发布时间:2019-12-4 阅读量:881 来源: 智东西 发布人: Jane
12月4日消息,亚马逊今日在AWS re:invent大会上发布了基于Arm架构的Graviton2服务器芯片,同时公布了Inferentia芯片的最新进展。AWS表示,Graviton2相较x86同类产品计算量提升4倍,性价比提升最高达40%。基于Inferentia芯片的Inf1实例相比Nvidia G4实例,吞吐量提高3倍,且成本降低40%。
Graviton2已经针对AWS云的原生应用进行了优化,并且每个核心的浮点性能有2倍提升。Inferentia是用于AI推理的高性能芯片,于去年推出。AWS CEO Andy Jassy今天在会上表示,目前AWS已经储备了人才力量,将在自研芯片领域持续发力,为用户提供更多高性价比产品。
一、Inf1吞吐量超英伟达G4 3倍
▲AWS首席执行官Andy Jassy于2019年12月3日在拉斯维加斯的re:Invent大会上,图片来源:Techcrunch
亚马逊AWS今天推出了Inf1实例,该实例由Inferentia芯片提供支持,是一个在云中为AI推理提供支持的实例,AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品。
Andy Jassy表示,“与Nvidia G4实例相比,Inf1具有更低的延迟,吞吐量将提高3倍,并且每个实例的成本降低40%。”“使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理,而推理芯片可能会很昂贵,并且要求低延迟和高吞吐量。”
Inf1还将由Annapurna Labs制造的Inferentia芯片提供支持,该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore,可以提供128TOPS的算力,而每个Inf1实例可以提供2000 TOPS的算力。
▲Inferentia芯片详细参数,图片来源:AWS
Inf1实例目前已经上市,并将与PyTorch,MXNet和TensorFlow集成。2020年,Inf1将可以用于EKS实例和Amazon的SageMaker,来进行机器学习的推理运算。
▲Inf1实例四种规格,图片来源:AWS
二、Graviton2成为英特尔AMD劲敌
亚马逊今日还推出了基于Arm架构的Graviton2服务器芯片,与基于x86的同类实例相比,该处理器的性价比最高提升可达40%,计算量提升4倍。基于Arm架构的Graviton2可能会对云工作负载、AWS的成本结构以及数据中心Arm架构的应用产生重大影响。
▲M6g、R6g、C6g实例部分数据
AWS加大了对Graviton2的投注,它们对Arm架构的数据中心处理器研发和稳步推进云基础架构创新都非常重视。AWS正在启动新的基于Arm的Amazon EC2实例,包括M6g、R6g、C6g系列。
Graviton2针对云原生应用进行了优化,并且基于64位Arm Neoverse内核和AWS的片上定制系统设计。Graviton2的每核浮点性能提高了2倍,可用于科学和高性能工作负载领域,最多支持64个虚拟CPU,25Gbps网络和18Gbps EBS带宽。
AWS CEO Andy Jassy在主题演讲中说:“我们决定设计芯片来为您提供更多功能。尽管许多公司使用x86已有很长时间,但我们希望为您提高性价比。”不过他补充说,英特尔和AMD仍然是AWS的主要合作伙伴。
结语:亚马逊服务器芯片重点发力,自研已成主攻方向
通过目前亚马逊发布的Inf1实例和Graviton2芯片,以及AWS CEO的发言我们不难看出,打造高性价比的自研芯片是亚马逊目前和今后的主要发展策略,而Arm架构在服务器领域的声量也将越来越大。
不过Andy Jassy也提到,英特尔、AMD后续将继续作为AWS的主要合作伙伴。在AI芯片和服务器芯片两大战场,格局似乎变得不再单一,英特尔、AMD、亚马逊等巨头后续会展开怎样的竞争与合作,我们拭目以待
文章来源:Techcrunch,ZDNet
在全球半导体产业加速迭代的背景下,三星电子日前披露了其第六代10纳米级DRAM(1c DRAM)的产能规划方案。根据产业研究机构TechInsights于2023年8月22日发布的行业简报,这家韩国科技巨头正在同步推进华城厂区和平泽P4基地的设备升级工作,预计将于2023年第四季度形成规模化量产能力。这项技术的突破不仅标志着存储芯片制程进入新纪元,更将直接影响下一代高带宽存储器(HBM4)的市场格局。
全球领先的物联网设备制造商MOKO SMART近期推出基于Nordic Semiconductor新一代nRF54L15 SoC的L03蓝牙6.0信标,标志着低功耗蓝牙(BLE)定位技术进入高精度、长续航的新阶段。该方案集成蓝牙信道探测(Channel Sounding)、多协议兼容性与超低功耗设计,覆盖室内外复杂场景,定位误差率较传统方案降低60%以上,同时续航能力突破10年,为智慧城市、工业4.0等场景提供基础设施支持。
半导体行业风向标企业亚德诺(ADI)最新财报引发市场深度博弈。尽管公司第三财季营收预期上修至27.5亿美元,显著超出市场共识,但受关税政策驱动的汽车电子产品需求透支风险显露,致使股价单日重挫5%。这一背离现象揭示了当前半导体产业面临的复杂生态:在供应链重构与政策扰动交织下,短期业绩爆发与长期可持续增长之间的矛盾日益凸显。
根据国际权威市场研究机构Canalys于5月23日发布的调研报告,2025年第一季度全球可穿戴腕带设备市场呈现显著增长态势,总出货量达到4660万台,较去年同期增长13%。这一数据表明,消费者对健康监测、运动管理及智能互联设备的需求持续升温,行业竞争格局亦同步加速重构。
2025年5月23日,全球领先的半导体与电子元器件代理商贸泽电子(Mouser Electronics)宣布,正式开售Raspberry Pi新一代RP2350微控制器。作为RP2040的迭代升级产品,RP2350凭借双核异构架构(Arm Cortex-M33 + RISC-V)、硬件级安全防护及工业级性价比,重新定义了中高端嵌入式开发场景的技术边界。该芯片通过多架构动态切换、可编程I/O扩展及4MB片上存储等创新设计,解决了传统微控制器在实时响应能力、跨生态兼容性与安全成本矛盾上的核心痛点,为工业自动化、消费电子及边缘AI设备提供了更具竞争力的底层硬件方案。