英伟达“核弹”AI芯片亮相!FP4算力高达40PFlops,售价或高达4万美元

发布时间:2024-03-20 阅读量:1641 来源: 综合网络 发布人: bebop

随着人工智能的广泛应用,对于高性能、高效率的 GPU 的需求也在日益增长。而英伟达凭借其强大的研发实力,不断推出满足市场需求的新品。


近日,人工智能(AI)芯片龙头厂商英伟达在美国加州圣何塞召开了GTC2024大会,正式发布了面向下一代数据中心和人工智能应用的“核弹”——基于Blackwell架构的B200 GPU,将在计算能力上实现巨大的代际飞跃,预计将在今年晚些时候正式出货。同时,英伟达还带来了Grace Blackwell GB200超级芯片等。


Blackwell B200 GPU宣称是目前“全球最强大的芯片”。该架构 GPU 具有 2080 亿个晶体管,制造工艺为专门定制的双倍光刻极限尺寸的台积电 4NP 工艺。其中,将 GPU 裸片连接成统一的 GPU 通过 10TB/s 的片间互联完成。


其次,新架构采用了第二代 Transformer 引擎。新一代引擎配备了新的微张量缩放支持以及集成于 TensorRT-LLM 和 NeMo Megatron 框架的动态范围管理算法,可在新型 4 位浮点 AI 推理能力下,实现算力和模型大小的翻倍。


此外,它还采用了第五代 NVLink 网络技术。全新的 NVLink 能够为万亿级参数模型以及混合专家 AI 模型,带来明显的性能提升。它不仅向每个 GPU 提供高达 1.8TB/s 双向吞吐量,还可以保证 576 个 GPU 之间的无缝高速通信。


并且,它还有一个 RAS 引擎。根据公开资料,“Blackwell 驱动的 GPU 将专用引擎和以 AI 为基础的预防性维护功能集成,以此确保可靠性、可用性和可维护性,从而最大限度地延长系统正常运行时间并最大限度地降低运营成本”。


这样,Blackwell GPU 基于此可实现运行诊断并预测可靠性相关的问题,还能提高大规模 AI 部署的弹性,使它能够连续不间断运行数周乃至数月,同时降低运营成本。


新架构还可在不影响性能的条件下,保护 AI 模型和客户数据从而保护隐私,提供更安全的 AI。此外,其配备的专用解压缩引擎可支持最新格式,从而通过加速数据库查询提供强大的数据分析和数据科学性能。


B200芯片的性能提升主要得益于晶体管数量(即芯片面积)的提升,其架构本身所带的性能提升相对有限,再加上价格高昂的192 GB HBM3E 内存,使得其硬件成本也将大幅提升。


Raymond James 分析师估计,英伟达 H100的硬件成本约为 3,100 美元,而 B200的硬件成本则大幅提高到了 6,000 美元。如果英伟达计划以 3 万至 4 万美元的价格出售B200,那么则意味着该芯片的毛利率将会高达80%-85%。


要知道在2023年,市场对于英伟达H100芯片的需求暴涨之时,由于先进封装产能紧缺导致H100供应严重不足,英伟达的合作伙伴就曾以 30,000 至 40,000 美元的价格出售 H100,H100的毛利率可能将更高。


当然,这并没有计算英伟达对于B200的研发成本。有报道称,英伟达为了研发B100及GB200等芯片,预计已投了资高达 100 亿美元来开发该平台,打破了其财务记录。该报道显示,黄仁勋表示,其在现代 GPU 架构和设计上的支出已超过了 100 亿美元。


需要指出的是,英伟达并不倾向于销售 B200 模块或加速卡,它可能更倾向于以每台数百万美元的价格出售带有 8 个 Blackwell GPU 的 DGX B200 服务器、GB200 NVL72服务器、甚至是带有 576 个 B200 GPU 的 DGX B200 SuperPOD。


黄仁勋在采访中也强调,英伟达更愿意出售超级计算机或DGX B200超级PODS,这些超级计算机拥有大量的硬件和软件,价格很高。因此,英伟达在其网站上也没有列出B200模块或加速卡,只有DGB B200系统和DGX B200 SuperPOD。也就是说,英伟达对于其B200 GPU的定价信息还是持保留态度。


相关资讯
红外传感器的选型要素与应用场景解析

红外传感器是一种利用红外线进行检测的电子设备,广泛应用于工业自动化,安防监控,智能家居,医疗设备等领域

DigiKey发布《机器人技术探秘》系列:联合Eaton与SICK深入探索机器人自动化新纪元

随着全球制造业迈向集成化与数字化,独立机器人单元正逐渐融入更广泛的自动化系统。DigiKey 本季发布的《机器人技术探秘》的第 5 季《未来工厂》视频系列,联合行业领先企业 Eaton 和 SICK,系统解析了从电气控制、传感技术到数据互联等多个层面的前沿解决方案。新一季邀请了多名专家,一起探讨支撑现代机器人制造与自动化的基础设施与创新技术。

SEMI-e 2025深圳半导体展9月启幕!全产业链覆盖,超千家龙头集结

SEMI-e深圳国际半导体展暨2025集成电路产业创新展将于2025年9月10日至12日在深圳国际会展中心(宝安新馆)隆重开幕。本届展会由CIOE中国光博会与集成电路创新联盟联合主办,中新材会展与爱集微共同承办,以“IC设计与应用”、“IC制造与供应链”及“化合物半导体”为核心主题,系统覆盖集成电路全产业链环节。

超11万人次观展,5723名海外买家到场!IOTE 2025深圳物联网展圆满落幕​

​在AIoT技术加速赋能全球数字化转型、中国持续引领物联网产业创新的大背景下,IOTE 2025第24届国际物联网展·深圳站于8月29日在深圳会展中心(宝安新馆)圆满落幕。本届展会以“生态智能·物联全球”为主题,联合AGIC人工智能展与ISVE智慧商显展,汇聚1001家产业链企业,覆盖8万平方米展区,三日内吸引观众超11万人次,其中海外专业买家达5723人,来自30多个国家和地区,充分彰显了展会的国际影响力与行业凝聚力。