英特尔FPGA加速从云到边缘的应用

发布时间:2018-05-25 阅读量:1062 来源: 我爱方案网 作者:

英特尔® 现场可编程门阵列(FPGA)继续在市场中保持强劲的发展势头。配合英特尔®处理器,FPGA释放数据的巨大潜能,改造我们的世界,使从云到边缘的一系列实际用例的成长得以加速,体现出独特的价值。

凭借出色的灵活性,FPGA 堪比半导体界的瑞士军刀。即使在发运给客户之后,这些设备也可以随时编程。FPGA 融合了逻辑、内存和数字信号处理模块,能够实时地实施所需的功能,具有极高的吞吐率。这使得 FPGA 适用于许多关键的云和边缘应用。

预计到 2020 年,物联网(IoT)将覆盖高达 500 亿台智能设备。全球人均智能设备持有数量约为 6 台。每人每天将生成约 1.5 GB 数据,而每台智能互联设备每天将生成多达 50 GB 的数据。FPGA 通过以实时、节能的方式存储、处理和分析海量数据,从而提取商业智能,为云和边缘计算提供了极大的优势。

最近,英特尔宣布英特尔 FPGA 将为 Microsoft Azure 提供强大的人工智能*,这是一个绝佳的示例。Brainwave* 项目奠定了基础,该项目是微软为实时人工智能(AI)打造的主要架构,之前用于必应* 智能搜索,现在在 Azure 和边缘中提供。
 
无论在云中还是在边缘,英特尔 FPGA 以低延迟和高能效的方式实现实时人工智能,无需将计算批处理打包(batching)至较小的处理元件中。例如,采用 FPGA 的人工智能能够实现极高的吞吐率,可以运行 ResNet-50 ——一款行业标准深度神经网络,要求近 80 亿次计算——而无需批处理。这可以在 FPGA 中实现,因为逻辑、DSP、嵌入式内存等可编程硬件支持轻松编写任何所需的逻辑功能,并针对其面积、性能或功率进行优化。由于该结构在硬件中实施,可以定制与执行并行处理,性能有望比传统软件或 GPU 设计方法高出数个数量级。

企业应用也使用相同的功能。戴尔 EMC* 和富士通* 正将英特尔 Arria® 10 可编程加速卡(PAC)应用于企业数据中心的现有服务器中。这些加速卡可在各个工作负载上与英特尔至强® 处理器协同工作,如实时数据分析、人工智能、视频转码、金融、网络安全与基因组。这些数据密集型工作负载面临着数据的爆炸式增长,FPGA 的实时和并行处理能力为它们带来了极大的优势。英特尔已构建了广阔的合作伙伴生态系统,以使用面向英特尔®至强®CPU和FPGA的加速堆栈在上述工作负载中开发整套解决方案。 

Levyx*(一家由金融服务业前高管领导的大数据公司)使用基于 Arria®10 FPGA 的英特尔 PAC可编程加速卡 加速金融回溯测试,该测试经常用于帮助预测金融票据的计算交易策略的性能,包括各种证券、期权和衍生工具等。它是一个高度并行的数据与计算密集型工作负载,通常需要花费数小时,甚至数天来执行。借助 FPGA,Levyx 运行金融回溯测试的性能提升了 850%。图 1 中的数据显示了 20 个股票交易代码 50 次算法模拟的实际数据。结果令人惊讶。

图1:Levyx 与英特尔的联合解决方案用于回溯测试工作负载的加速

在云中,由于企业需要处理大数据,FPGA 的应用规模已经达到了空前的水平。边缘出现了相似的标志性转变。研究报告显示,到 2020 年,来自 500 亿台智能互联设备的大多数数据均由机器(而非人类)生成。数据将来源于广泛的行业,包括制造、机器人、医疗保健和零售。 

全球视频安防行业领先的解决方案提供商大华,以及加拿大国家科学研究院(NRC)正将英特尔 FPGA 嵌入其边缘应用中。

大华与英特尔通力合作,致力于使用 FPGA 加速它的 Deep Sense 服务器系列,以便在边缘实现实时推理,在由 100,000 张图像组成的数据库内进行面部对比。由于需要在带宽与功率受限的环境中快速执行面部识别,FPGA 技术被用作执行低延迟、节能型边缘推理的平台。

加拿大 NRC 正协助构建下一代平方公里阵列(SKA)射电望远镜,计划将其部署于偏远的南美与澳大利亚地区,对于天文研究而言,这种观察条件最为理想。SKA 射电望远镜将成为世界最大的射电望远镜,相比我们现在拥有的最好的射电望远镜,它的速度提升了 10,000 倍,图像分辨率提升了 50 倍。分辨率和速度的提升导致这些望远镜生成大量的图像数据,每隔几个月就要处理相当于互联网一年的数据量。 

NRC 的设计将英特尔® Stratix® 10 SX FPGA 嵌入南非 SKA 望远镜项目的中央处理设施(CPF)中,从而在边缘实时地处理和分析收集到的数据。高速模拟收发器支持核心 FPGA 结构实时获取信号数据。随后并行化可编程逻辑,以执行针对功效、性能或两者优化的任何自定义算法,这使得 FPGA 成为在边缘处理大量实时数据的理想之选。

从云计算到边缘、物联网和我们的传统嵌入式市场,英特尔一直处于技术的前沿。其他人正在预测未来时,我们已经开始开创未来。可编程解决方案事业部的团队正在加速这一进程。

我非常期待未来与您分享英特尔 FPGA 如何推动 5G 无线、有线、小芯片技术等创新——释放数据的巨大潜能,改造我们的世界。

作者:英特尔公司副总裁兼可编程解决方案事业部(PSG)总经理 Dan McNamara
相关资讯
AI引爆芯片扩产潮:2028年全球12英寸晶圆月产能将破1100万片

国际半导体产业协会(SEMI)最新报告指出,生成式AI需求的爆发正推动全球芯片制造产能加速扩张。预计至2028年,全球12英寸晶圆月产能将达1,110万片,2024-2028年复合增长率达7%。其中,7nm及以下先进制程产能增速尤为显著,将从2024年的每月85万片增至2028年的140万片,年复合增长率14%(行业平均的2倍),占全球总产能比例提升至12.6%。

高通双轨代工战略落地,三星2nm制程首获旗舰芯片订单

据供应链消息确认,高通新一代旗舰芯片骁龙8 Elite Gen 2(代号SM8850)将首次采用双轨代工策略:台积电负责基于N3P(3nm增强版)工艺的通用版本,供应主流安卓厂商;而三星则承接其2nm工艺(SF2)专属版本,专供2026年三星Galaxy S26系列旗舰机。此举标志着高通打破台积电独家代工依赖,三星先进制程首次打入头部客户供应链。

美光2025Q3财报:HBM驱动创纪录营收,技术领先加速市占扩张

在AI算力需求爆发性增长的浪潮下,存储巨头美光科技交出超预期答卷。其2025财年第三季度营收达93亿美元,创历史新高,其中高带宽内存(HBM)业务以环比50%的增速成为核心引擎。凭借全球首款12层堆叠HBM3E的量产突破,美光不仅获得AMD、英伟达等头部客户订单,更计划在2025年末将HBM市占率提升至24%,直逼行业双寡头。随着下一代HBM4基于1β制程的性能优势验证完成,一场由技术迭代驱动的存储市场格局重构已然开启。

对标TI TAS6424!HFDA90D以DAM诊断功能破局车载音频安全设计

随着汽车智能化升级,高保真低延迟高集成度的音频系统成为智能座舱的核心需求。意法半导体(ST)推出的HFDA80D和HFDA90D车规级D类音频功放,以2MHz高频开关技术数字输入接口及先进诊断功能,为车载音频设计带来突破性解决方案。

村田量产全球首款0805尺寸10μF/50V车规MLCC,突破车载电路小型化瓶颈

随着汽车智能化电动化进程加速,自动驾驶(AD)和高级驾驶辅助系统(ADAS)等关键技术模块已成为现代车辆标配。这些系统依赖于大量高性能电子控制单元(ECU)和传感器,导致车内电子元件数量激增。作为电路稳压滤波的核心元件,多层片式陶瓷电容器(MLCC)的需求随之水涨船高,尤其是在集成电路(IC)周边,对大容量电容的需求尤为迫切。然而,有限的电路板空间与日益增长的元件数量及性能要求形成了尖锐矛盾,元件的高性能化与小型化成为行业亟待攻克的关键难题。