谷歌大脑新算法,不折腾TPU就能加快AI训练速度

发布时间:2019-07-18 阅读量:619 来源: 量子位 发布人: Cloris

训练神经网络,硬件要过硬?现在谷歌提出强有力反驳。


1.jpg


GPU和像谷歌TPU这样的硬件加速器大大加快了神经网络的训练速度,推助AI迅速成长,在各个领域发挥超能力。


然而,硬件发展再迅速,也总有力有不逮的时候。


比如,由于芯片的架构方式,像数据预处理这样的训练pipeline早期阶段并不会受益于硬件加速器的提升。


2.jpg


谷歌大脑的科学家们可不希望看到算法掣肘硬件,于是他们研究出了一种名为“数据回放(Data Echoing)”的新技术。


加速神经网络训练速度,这回不靠折腾半导体。


Data Echoing的黑科技


新的加速方法的核心在于减少训练pipeline早期阶段消耗的时间。


按照经典的训练pipeline,AI系统先读取并解码输入数据,然后对数据进行混洗,应用转换扩充数据,然后再将样本收集到批处理中,迭代更新参数以减少误差。


而Data Echoing是在pipeline中插入了一个阶段,在参数更新之前重复前一阶段的输出数据,理论回收空闲算力。


如果重复数据的开销可以忽略不计,并且echoing任意侧的阶段都是并行执行的,那么数据回放完成一个上游步骤和e个下游步骤的平均时间就是:


3.jpg


假设上游步骤花费的时间大于等于下游步骤花费的时间,你会发现附加的下游步骤是“免费”的,因为它们利用了空闲的下游容量。


4.jpg


data echoing缩短训练时间的关键在于上游步骤和下游步骤之间的权衡。


一方面,重复数据的价值可能会比新数据的价值低,那么data echoing就需要更多的下游SGD(随机梯度下降)更新来达到预期性能。


另一方面,data echoing中每个下游步骤仅需要1/e个上游步骤。


如果下游步骤因回放因子而增加的数量比e小,那么上游步骤的总数就会减少,总的训练时间也就减少了。


需要注意的是,有两个因素会影响在不同插入点处data echoing的表现:


在批处理前回放(echoing)


在批处理之前回放意味着数据是在样本级别而不是批处理级别重复和混洗的,这增加了临近批次不同的可能性,代价是批次内可能会有重复的样本。


在数据扩增前回放


在数据增强之前进行回放,重复数据就可能以不同的方式转换,这样一来重复数据就会更像新数据。


效果如何


研究团队对这一方法进行了实验,他们选择了两个语言模型任务,两个图像识别任务和一个对象检测任务,AI模型都是用开源数据集训练的。


训练.jpg


实验中,“新”训练样本(训练样本从磁盘中被读取出来,就算做一个新的样本)的数目达到指定目标的时间就算作训练的时长。同时,研究人员也会调查data echoing是否减少了所需的样本数量。


数量.jpg


除了用ImageNet训练的ResNet-50,data echoing的效率都比基线方法效率高。并且更早地在pipeline中插入echoing,训练所需的新样本会更少。


而随着批量大小的增加,data echoing相对于基线方法的改进会更加明显。


明显.jpg

摩尔定律的黄昏


黄昏.jpg


随着摩尔定律走向终结,要依靠芯片制造工艺的突破来实现人工智能算力的提升越来越困难,虽然有硬件加速器加持,但CPU这样的通用处理器依然成为了神经网络训练速度进一步提升的拦路虎。


另辟蹊径,以算法性能来突破重围,正在成为New sexy。


相关资讯
电位器的选型技巧与关键技术参数

电位器具有一系列优势,包括设计简单、价格低廉、电阻范围大、操作简便和技术成熟。它们作为可靠的器件,在电子和电气系统中对线性或旋转运动进行电压控制、测量和精确感应。在实际应用中,我们需要了解电位器的技术参数,以便正确选型和使用,确保电路的正常运行。

Transphorm与伟诠电子合作推出新款集成型SiP氮化镓器件

该SiP系列现已增至三款器件,均使用了Transphorm的SuperGaN,为支持新一代适配器和充电器拓展了功率等级

血氧仪无缝替代的元器件选型方案

全球性公共卫生事件呈现多发态势,引发了社会各界对个人健康及公共卫生问题的深度反思和广泛关注。如何迅速、高效地了解人体健康状况,以确保个人身体健康,成为一大焦点问题。家庭医疗电子设备,以其便捷的操作和智能化的检测手段,使人们能迅速直观地判断自身健康状况,因此受到了大众的青睐。血氧仪采用非介入的方式测量或连续监测动脉血液中的氧饱和度,以确保血液中存在足够的氧,这种设备常用于处在麻醉状态的呼吸道疾病患者、新生儿以及重症患者。

低功耗智能燃气表实战方案:华大电子,龙芯和小华半导体套件汇总

随着中国城市化进程的加快、“煤改气”工程的持续推进等因素的加持,我国智能燃气表行业正迎来全面放量的时期,智能燃气表的市场需求快速增长。智能燃气表是在普通燃气表的基础上,增加了通信和计量技术,使得燃气表具备了自动抄表、数据传输、智能监测等多种新功能。作为燃气计量和结算的重要依据,燃气表计量数据采集及抄收的准确性、及时性至关重要,由于燃气的特殊性,要求燃气表有防爆的需求,同时还需要长时间高可靠工作,所以对MCU的稳定性、可靠性都有很高的要求。针对智能燃气表的需求特点,快包分析师推荐华大、龙芯、小华的智能燃气表主控方案。

光电开关的特点及使用注意事项

光电开关是光电接近开关的简称,它是利用被检测物对光束的遮挡或反射,由同步回路接通电路,从而检测物体的有无。物体不限于金属,所有能反射光线(或者对光线有遮挡作用)的物体均可以被检测。光电开关将输入电流在发射器上转换为光信号射出,接收器再根据接收到的光线的强弱或有无对目标物体进行探测。安防系统中常见的光电开关烟雾报警器,工业中经常用它来计数机械臂的运动次数。