发布时间:2019-07-18 阅读量:864 来源: 量子位 发布人: Cloris
训练神经网络,硬件要过硬?现在谷歌提出强有力反驳。
GPU和像谷歌TPU这样的硬件加速器大大加快了神经网络的训练速度,推助AI迅速成长,在各个领域发挥超能力。
然而,硬件发展再迅速,也总有力有不逮的时候。
比如,由于芯片的架构方式,像数据预处理这样的训练pipeline早期阶段并不会受益于硬件加速器的提升。
谷歌大脑的科学家们可不希望看到算法掣肘硬件,于是他们研究出了一种名为“数据回放(Data Echoing)”的新技术。
加速神经网络训练速度,这回不靠折腾半导体。
Data Echoing的黑科技
新的加速方法的核心在于减少训练pipeline早期阶段消耗的时间。
按照经典的训练pipeline,AI系统先读取并解码输入数据,然后对数据进行混洗,应用转换扩充数据,然后再将样本收集到批处理中,迭代更新参数以减少误差。
而Data Echoing是在pipeline中插入了一个阶段,在参数更新之前重复前一阶段的输出数据,理论回收空闲算力。
如果重复数据的开销可以忽略不计,并且echoing任意侧的阶段都是并行执行的,那么数据回放完成一个上游步骤和e个下游步骤的平均时间就是:
假设上游步骤花费的时间大于等于下游步骤花费的时间,你会发现附加的下游步骤是“免费”的,因为它们利用了空闲的下游容量。
data echoing缩短训练时间的关键在于上游步骤和下游步骤之间的权衡。
一方面,重复数据的价值可能会比新数据的价值低,那么data echoing就需要更多的下游SGD(随机梯度下降)更新来达到预期性能。
另一方面,data echoing中每个下游步骤仅需要1/e个上游步骤。
如果下游步骤因回放因子而增加的数量比e小,那么上游步骤的总数就会减少,总的训练时间也就减少了。
需要注意的是,有两个因素会影响在不同插入点处data echoing的表现:
在批处理前回放(echoing)
在批处理之前回放意味着数据是在样本级别而不是批处理级别重复和混洗的,这增加了临近批次不同的可能性,代价是批次内可能会有重复的样本。
在数据扩增前回放
在数据增强之前进行回放,重复数据就可能以不同的方式转换,这样一来重复数据就会更像新数据。
效果如何
研究团队对这一方法进行了实验,他们选择了两个语言模型任务,两个图像识别任务和一个对象检测任务,AI模型都是用开源数据集训练的。
实验中,“新”训练样本(训练样本从磁盘中被读取出来,就算做一个新的样本)的数目达到指定目标的时间就算作训练的时长。同时,研究人员也会调查data echoing是否减少了所需的样本数量。
除了用ImageNet训练的ResNet-50,data echoing的效率都比基线方法效率高。并且更早地在pipeline中插入echoing,训练所需的新样本会更少。
而随着批量大小的增加,data echoing相对于基线方法的改进会更加明显。
摩尔定律的黄昏
随着摩尔定律走向终结,要依靠芯片制造工艺的突破来实现人工智能算力的提升越来越困难,虽然有硬件加速器加持,但CPU这样的通用处理器依然成为了神经网络训练速度进一步提升的拦路虎。
另辟蹊径,以算法性能来突破重围,正在成为New sexy。
无人机技术正深度重构多行业作业模式。无论是精准农业的植株分析、工业设施的毫米级巡检,还是紧急物资的高效投送,其核心驱动力均来自高性能成像系统。作为行业方案引领者,安森美(onsemi)通过Hyperlux系列图像传感器与CQD SWIR技术,打造覆盖全域应用场景的无人机视觉解决方案。本文将从实际场景需求出发,解析关键器件的技术特性与选型逻辑。
全球射频半导体市场正经历结构性变革。据Yole Group最新报告,该市场规模将从2024年的513亿美元跃升至2030年的697亿美元,年复合增长率达5.2%。驱动这一增长的核心力量包括:5G技术全球渗透率突破45%、6G研发进入关键技术验证阶段、以及汽车雷达与国防电子系统的需求爆发。传统消费电子主导的格局正被打破,汽车、工业、国防领域贡献的射频元件占比预计从2023年的18%提升至2030年的35%。
在2025世界人工智能大会AI女性菁英论坛上,宇树科技创始人兼CEO王兴兴分享了其对行业的深刻洞察。他指出,当前人形机器人领域正经历前所未有的高速增长期。“据我个人观察,今年上半年全国智能机器人行业的平均增速可能高达50%到100%。”王兴兴强调,行业落地速度与出货节奏显著加快,自2024年起,市场日均涌现的新品已超过1款,展现出强劲的发展动能。
美国半导体企业MACOM Technology Solutions近日宣布,其位于北卡罗来纳州研究三角园区的晶圆制造工厂已全面投入运营。该设施于2023年12月从Wolfspeed公司完成产权交割,较原计划提前六个月实现接管。工厂的核心优势在于其成熟的GaN-on-SiC(碳化硅基氮化镓)工艺技术,专注于生产高频射频功率器件及单片微波集成电路(MMIC),主要服务于5G通信基站、卫星网络及航空航天领域的高可靠性电子系统。
2025年第二季度,全球射频前端(RFFE)模块与组件领域的专利活动呈现出前所未有的激烈竞争态势。知名专利分析机构KnowMade发布的最新报告揭示,本季度共计追踪到超过1100项重大专利事件,涵盖了556个新诞生的专利家族、324项成功获得授权的专利,以及250项因到期或申请人主动放弃而失效的专利。这些数据凸显了该关键半导体领域持续高涨的创新活力与复杂的专利博弈。