英伟达推出最强AI芯片!

发布时间:2023-08-9 阅读量:10607 来源: 我爱方案网整理 发布人: bebop

美国当地时间8月8日,英伟达又发布了新一代GH200 Grace Hopper(简称“新版GH200”)平台。但与今年5月发布的GH200不同的是,新一代GH200搭载了全球首款HBM3e内存,内存容量和带宽都有显著提高,专为加速计算和生成式AI时代而打造。

英伟达称,新版GH200旨在处理世界上最复杂的生成式AI工作负载,涵盖大型语言模型、推荐系统和矢量数据库,将提供多种配置。新版GH200将于2024年第二季度投产。

具体来说,新版GH200芯片平台基于 72 核 Grace CPU,配备 480 GB ECC LPDDR5X 内存以及 GH100 计算 GPU,搭配 141 GB 的 HBM3e 内存,分为六个 24 GB 的堆栈,并使用了 6,144 位的内存接口。虽然英伟达实际安装了 144 GB 的内存,但只有 141 GB 是可用的。

相比原版GH200平台,新版GH200平台的双芯片配置将内存容量提高3.5倍,带宽增加三倍,一个服务器就有144个Arm Neoverse高性能内核、8 petaflops 的 AI 性能和282GB的最新HBM3e内存技术。

HBM3e是全新一代的高带宽内存,带宽达每秒5TB,比原版的GH200所搭载的HBM3快50%,可为新版的GH200提供总共每秒10TB的组合带宽,使新平台能运行比前代大3.5倍的模型,同时通过快3倍的内存带宽提高性能。

据英伟达介绍,目前配备 HBM3 内存的原版GH200 Grace Hopper超级芯片平台已经在生产中,并将于下个月开始商业销售。而配备 HBM3e 内存的新版GH200 Grace Hopper超级芯片平台现在正在样品测试中,预计将于 2024 年第二季度上市。

英伟达强调,新版GH200 Grace Hopper 使用了与原版相同的 Grace CPU 和 GH100 GPU 芯片,因此公司无需推出任何新的软件版本或步进。英伟达表示,原版 GH200 和升级版 GH200 将在市场上共存,这意味着后者将以更高的价格出售,毕竟其更先进的内存技术带来的更高性能。

英伟达表示,配备 HBM3e 内存的下一代 Grace Hopper 超级芯片平台完全兼容英伟达的 MGX 服务器规范,并且可以与现有的服务器设计直接兼容。

黄仁勋说,为了满足生成式 AI 不断增长的需求,数据中心需要有针对特殊需求的加速计算平台。新的GH200 Grace Hopper 超级芯片平台提供了卓越的内存技术和带宽,以此提高吞吐量,提升无损耗连接GPU聚合性能的能力,并且拥有可以在整个数据中心轻松部署的服务器设计。


相关资讯
英伟达Rubin CPX GPU震撼发布:1亿换50亿的AI"印钞机"来了!

英伟达正式发布代号“Rubin CPX” GPU产品,专为AI领域最棘手的“大规模上下文推理”而生。

SEMI-e 2025深圳国际半导体展助推全球产业协同创新​!​双展联动,光电融合新时代

9月10日,SEMI-e深圳国际半导体展暨2025集成电路产业创新展在深圳国际会展中心盛大启幕。本届展会由CIOE中国光博会与集成电路产业技术创新联盟(简称“大联盟”)共同主办,规模与影响力显著提升,汇聚全球半导体行业顶尖企业、专家学者与产业链关键代表,聚焦光电融合、先进制造与跨领域协同,全方位呈现集成电路与光电子技术的最新成果与发展趋势,为产业创新与合作搭建起高规格、高效率的国际性平台。

华为海思换帅!徐直军卸任董事长!

华为旗下核心芯片设计公司深圳市海思半导体有限公司完成重大人事调整,徐直军卸任法定代表人、董事长,由技术背景深厚的高戟接棒,同时完成多位高管的更迭

突发!美国联邦通信委员会FCC“拉黑”中国实验室

美国联邦通信委员会(FCC)发布通告:“基于国家安全考量”,FCC即刻实施新规,撤销或拒绝由“外国对手”控制的测试实验室的FCC认证资格

深度对接产业链!电子展组委会走访三省行业协会与龙头企业

为精准锚定行业需求、高效整合产业资源,全力备战2025年11月5–7日在上海新国际博览中心举办的第106届中国电子展,中国电子展组委会与电子制造产业联盟联合组建专项调研团队,于近期跨越广东、湖南、湖北三省,深入深圳、东莞、长沙、武汉四地,开展了一系列高密度、深层次的企业走访与产业对接活动。通过实地考察和多轮座谈,调研团队系统梳理了华南、华中地区电子制造产业链资源,为展会的高水平举办奠定了扎实基础。