A100 GPU 在 HPC 中达到新的高峰

发布时间:2022-11-10 阅读量:940 来源: 我爱方案网整理 发布人: Aurora

在首次推出全面的 MLPerf 推理基准两个月后,NVIDIA H100 Tensor Core GPU 在行业集团最新的 AI 训练测试中创下了企业 AI 工作负载的世界纪录。    


结果表明,H100 是在创建和部署高级 AI 模型时要求最高性能的用户的最佳选择。    

 

MLPerf 是衡量 AI 性能的行业标准。它得到了包括亚马逊、Arm、百度、谷歌、哈佛大学、英特尔、Meta、微软、斯坦福大学和多伦多大学在内的广泛团体的支持。    

 

在今天发布的相关 MLPerf 基准测试中,NVIDIA A100 Tensor Core GPU 提高了他们去年在高性能计算 (HPC) 领域设定的标准。   

    

A100 GPU 在 HPC 中达到新的高峰

 

首次提交 MLPerf 训练时,NVIDIA H100 GPU 的速度比 A100 GPU 6.7 倍    

 

H100 GPU(又名 Hopper)提高了 MLPerf 训练中每个加速器的性能标准。首次提交 MLPerf 训练时,它们的性能比上一代 GPU 6.7 倍。通过同样的比较,由于软件的进步,今天的 A100 GPU 又增加了 2.5 倍。    

 

部分由于其 Transformer Engine,Hopper 在训练流行的自然语言处理 BERT 模型方面表现出色。它是 MLPerf AI 模型中最大且最需要性能的模型之一。    

 

MLPerf 让用户有信心做出明智的购买决定,因为基准涵盖了当今最流行的 AI 工作负载——计算机视觉、自然语言处理、推荐系统、强化学习等。这些测试经过同行评审,因此用户可以依赖他们的结果。    

 

A100 GPU HPC 中达到新的高峰    

 

在单独的 MLPerf HPC 基准测试套件中,A100 GPU 横扫了在超级计算机上运行的苛刻科学工作负载中训练 AI 模型的所有测试。结果表明 NVIDIA AI 平台能够扩展以应对世界上最严峻的技术挑战。    

 

例如,A100 GPU 在 CosmoFlow 天体物理学测试中训练 AI 模型的速度比两年前第一轮 MLPerf HPC 中的最佳结果快 9 倍。在相同的工作负载下,A100 的每芯片吞吐量也比其他产品高出 66 倍。    

 

HPC 基准训练用于天体物理学、天气预报和分子动力学工作的模型。它们属于许多技术领域,如药物发现、采用人工智能来推动科学发展。      

A100 GPU 在 HPC 中达到新的高峰

 

Nvidia 表示,在全球范围内的测试中,A100 GPU 在训练速度和吞吐量方面均处于领先地位    

 

亚洲、欧洲和美国的超级计算机中心参加了最新一轮的 MLPerf HPC 测试。在 DeepCAM 基准测试的首次亮相中,戴尔科技公司使用 NVIDIA A100 GPU 展示了强劲的结果。    

 

无与伦比的生态系统    

 

在企业 AI 训练基准测试中,包括 Microsoft Azure 云服务在内的共有 11 家公司使用 NVIDIA A100A30 A40 GPU 提交。包括华硕、戴尔科技、富士通、技嘉、惠普企业、联想和美超微在内的系统制造商总共使用了九个 NVIDIA 认证系统来提交他们的申请。    

 

在最新一轮中,至少有 3 家公司与 NVIDIA 一起提交了所有 8 MLPerf 训练工作负载的结果。这种多功能性很重要,因为现实世界的应用程序通常需要一套不同的 AI 模型。    

 

NVIDIA 合作伙伴之所以参与 MLPerf,是因为他们知道对于客户评估 AI 平台和供应商而言,这是一个有价值的工具。    

 

NVIDIA AI 平台提供从芯片到系统、软件和服务的完整堆栈。这可以随着时间的推移实现持续的性能改进。    

 

例如,最新 HPC 测试中的提交应用了 技术文章中描述的一套软件优化和技术。他们一起将一个基准测试的运行时间缩短了 5 倍,从 101 分钟缩短到 22 分钟。    

 

NVIDIA 还针对企业 AI 基准测试优化其平台。例如,我们使用 NVIDIA DALI  为计算机视觉基准有效地加载和预处理数据。    

 

测试中使用的所有软件都可以从 MLPerf 存储库中获得,因此任何人都可以获得这些世界级的结果。NVIDIA 不断将这些优化整合到 NGC 上可用的容器中,NGCGPU 应用程序的软件中心。

 

关于我爱方案网

 

我爱方案网是一个电子方案开发供应链平台,提供从找方案到研发采购的全链条服务。找方案,上我爱方案网!在方案超市找到合适的方案就可以直接买,没有找到就到快包定制开发。我爱方案网积累了一大批方案商和企业开发资源,能提供标准的模块和核心板以及定制开发服务,按要求交付PCBA、整机产品、软件或IoT系统。更多信息,敬请访问http://www.52solution.com


相关资讯
半导体产业升级战:三星电子新一代1c DRAM量产布局解析

在全球半导体产业加速迭代的背景下,三星电子日前披露了其第六代10纳米级DRAM(1c DRAM)的产能规划方案。根据产业研究机构TechInsights于2023年8月22日发布的行业简报,这家韩国科技巨头正在同步推进华城厂区和平泽P4基地的设备升级工作,预计将于2023年第四季度形成规模化量产能力。这项技术的突破不仅标志着存储芯片制程进入新纪元,更将直接影响下一代高带宽存储器(HBM4)的市场格局。

蓝牙信道探测技术落地:MOKO联手Nordic破解室内定位三大痛点

全球领先的物联网设备制造商MOKO SMART近期推出基于Nordic Semiconductor新一代nRF54L15 SoC的L03蓝牙6.0信标,标志着低功耗蓝牙(BLE)定位技术进入高精度、长续航的新阶段。该方案集成蓝牙信道探测(Channel Sounding)、多协议兼容性与超低功耗设计,覆盖室内外复杂场景,定位误差率较传统方案降低60%以上,同时续航能力突破10年,为智慧城市、工业4.0等场景提供基础设施支持。

财报季再现黑天鹅!ADI营收超预期为何股价暴跌5%?

半导体行业风向标企业亚德诺(ADI)最新财报引发市场深度博弈。尽管公司第三财季营收预期上修至27.5亿美元,显著超出市场共识,但受关税政策驱动的汽车电子产品需求透支风险显露,致使股价单日重挫5%。这一背离现象揭示了当前半导体产业面临的复杂生态:在供应链重构与政策扰动交织下,短期业绩爆发与长期可持续增长之间的矛盾日益凸显。

全球可穿戴腕带市场首季激增13%,生态服务成决胜关键

根据国际权威市场研究机构Canalys于5月23日发布的调研报告,2025年第一季度全球可穿戴腕带设备市场呈现显著增长态势,总出货量达到4660万台,较去年同期增长13%。这一数据表明,消费者对健康监测、运动管理及智能互联设备的需求持续升温,行业竞争格局亦同步加速重构。

RP2350 vs STM32H7:性能翻倍,成本减半的MCU革新之战

2025年5月23日,全球领先的半导体与电子元器件代理商贸泽电子(Mouser Electronics)宣布,正式开售Raspberry Pi新一代RP2350微控制器。作为RP2040的迭代升级产品,RP2350凭借双核异构架构(Arm Cortex-M33 + RISC-V)、硬件级安全防护及工业级性价比,重新定义了中高端嵌入式开发场景的技术边界。该芯片通过多架构动态切换、可编程I/O扩展及4MB片上存储等创新设计,解决了传统微控制器在实时响应能力、跨生态兼容性与安全成本矛盾上的核心痛点,为工业自动化、消费电子及边缘AI设备提供了更具竞争力的底层硬件方案。