探索最快超级计算机“天河二号”背后,八万颗Intel处理器?

发布时间:2013-07-18 阅读量:1317 来源: 我爱方案网 作者:

【导读】大家肯定为由170个机柜组成的天河二号感到震惊吧?天河二号配备了48,000颗英特尔至强融核协处理器和32,000颗英特尔至强处理器。它的新型异构多态体系结构,在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用需求,设计了微异构计算阵列和新型并行编程模型及框架,提升了应用软件的兼容性、适用性和易用性。下面小编为大家详细报道!

1.170个机柜组成的天河二号

一套采用数万颗英特尔处理器和协处理器构建而成的系统,刚刚在第41届全球高性能计算机500强(TOP500)排行榜中被评为全球最强大的超级计算机。

天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于存储每册10万字的图书600亿册。

天河二号

图1 天河二号

相比此前排名世界第一的美国“泰坦”超级计算机,天河二号计算速度是“泰坦”的2倍,计算密度是“泰坦”的2.5倍,能效比相当。与该校此前研制的天河一号相比,两者占地面积相当,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,执行相同计算任务的耗电量只有天河一号的三分之一。

天河二号自主创新了新型异构多态体系结构,在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用需求,设计了微异构计算阵列和新型并行编程模型及框架,提升了应用软件的兼容性、适用性和易用性。

天河二号

图2 天河二号

天河二号服务阵列采用了由国家核高基重大专项支持、国防科技大学自主研制的新一代“飞腾-1500”CPU,是当前国内主频最高的自主高性能通用CPU。天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。>>

 

2.八万颗英特尔处理器

八万颗英特尔处理器

该系统名为“天河二号”(MilkyWay2),配备了48,000颗英特尔至强融核协处理器和32,000颗英特尔至强处理器,也采用了新一代国产16核CPU,峰值性能可达54.9PFLOPS(每秒54.9千万亿次浮点运算)。与2012年11月发布的上一届TOP500排行榜中排名第一名的系统相比,其性能提升达两倍以上。这也是自1997年以来第一款登顶TOP500榜单的、完全基于英特尔技术的系统。

天河二号

图3 天河二号

全球高性能计算服务器市场的年收入预计将于未来四年增长36%1,从110亿美元增至150亿美元。各个行业和领域对快速计算、模拟和制定更明智决策的需求持续推动着超级计算机的快速发展。

 Intel处理器在超级计算机五百强中的地位发展史,目前有402套系统都是Intel Inside。

图4 Intel处理器在超级计算机五百强中的地位发展史,目前有402套系统都是Intel Inside。

全球市场上,2013年1季度,HPC服务器厂商的整体营收增长5.3%,达到25亿美元,2012年同期为24亿美元。2013年1季度,HPC出货量为33511台套,同比增长16.4%,销售增长的主要原因是区域级、部门级和工作组级需求的增长。

去年,IDC曾预测区域级、部门级和工作组级市场会因为全球经济的恢复而出现“反弹”。而一些主要厂商所报告的营收数字也确认了2013年1季度的反弹。

IDC证实,今年第1季度,分区级HPC系统(售价从25万到49.9万美元)同比增长了21.3%。

部门级系统(售价从10万到24.9万美元)的营收同比增长了10.8%,而工作组级系统(售价低于10万美元)的营收同比增长了15.6%。

 

3.超级计算机采用的处理器

超级计算机广泛采用的英特尔处理器

超级计算机现在被用于提高天气预报的准确性、帮助探索更高效的能源、研究疾病的治愈方法、对人类基因组进行测序及大数据分析等工作。

 从研究项目到实际产品:Intel MIC架构

图5 从研究项目到实际产品:Intel MIC架构

 

英特尔公司数据中心及互联系统事业部副总裁兼技术计算部门总经理RajHazra表示:“英特尔制定了超级计算愿景和产品蓝图,致力于帮助客户不断推陈出新,发现新商机,同时大幅提升竞争力。用户对于更高计算力和更高能效水平的需求永无止境。

 Intel MIC是一个加速协处理器架构

图6 Intel MIC是一个加速协处理器架构

借助现有的和未来的英特尔至强融核协处理器、英特尔至强处理器、英特尔TrueScale互连技术及软件,英特尔将能够为客户带来完备的解决方案,全面满足其需求。”

 MIC架构编程特点

图7 MIC架构编程特点

自从6个多月前推出英特尔至强融核协处理器以来,英特尔至强处理器和英特尔至强融核协处理器已发展成为一个强大的组合,在全球最快的多个超级计算机中得到了广泛采用。英特尔至强融核协处理器基于英特尔集成众核(英特尔MIC)架构,可全面满足客户对于更高性能、更高能效和简单易用技术的需求。

 

4.全球最快超级计算机背后

“天河二号”全球最快超级计算机背后

由中国广州国家超级计算中心构建的“天河二号”超级计算机,配备了32,000颗即将发布的、基于IvyBridge微架构的12核英特尔至强处理器E5-2600v2,以及48,000颗英特尔至强融核协处理器。在最新的全球高性能计算机500强排行榜中,它不仅性能最强,还是能效最高的系统之一。

至强E5-2600处理器架构图

图8 至强E5-2600处理器架构图

该系统采用“微异构架构”(Neo-heterogeneousarchitecture),即具有多种类型、可提供计算力的硬件架构,但却由通用编程模型予以支持,以简化开发和优化过程。这一优势是传统异构架构(使用CPU与GPU加速器的组合)所无法实现的。

从系统架构上来看,“天河二号”整个系统采用了32000颗英特尔E52600V2系列,加上48000英特尔至强融核协处理器。这样的架构,英特尔将其称之为“微异构架构”。什么是“微异构架构”?英特尔(中国)服务器平台产品经理张振宇给出了这样的解释,“所谓‘微异构架构’就是采用单一编程模式的异构”。

微异构架构

图9 微异构架构

这听起来似乎很有诱惑力,因为对于许多高性能计算的客户而言,无论是“CPU+GPU”的架构还是“CPU+MIC”的架构,异构编程毕竟是一个老大难。微异构架构并不是说CPU上的程序可以直接在CPU+MIC的架构上使用,英特尔(中国)服务器平台产品经理张振宇谈道,“客户需要先将应用程序在CPU上做并行优化,之后才可以直接移植到至强融核上,这里面的优化技巧和方法需要学习和熟悉”。

 

该系统的出众性能和能效表现得益于其使用了即将发布的、基于英特尔领先的22nm制程工艺的英特尔至强处理器E5-2600v2产品系列。作为英特尔支持超级计算机用户的“先期供货(earlyship)”计划的一部分,这款处理器除被用于“天河二号”外,同时还被用于最新全球高性能计算机500强榜单上来自Bull的另外两套系统,它们分别为在榜单上排名第54位,拥有每秒557万亿次浮点计算性能的系统和在榜单上排名第330位,拥有每秒140万亿次浮点计算性能的系统。这一新款处理器将于下季度正式供应,它可集成多达12个核心、时钟频率最高达2.7GHz,能够为每个处理器插座提供259GFLOPS(每秒2,590亿次浮点计算)的性能,相比上一代产品提升了56%。

在第41届全球高性能计算机500强排行榜中,超过80%(403套系统)的上榜系统采用了英特尔处理器。在该榜单的所有新晋系统中,则有超过98%的系统采用了英特尔处理器。该榜单中还有11套系统配备了英特尔至强融核协处理器,其中包括性能级别达每秒千万亿次浮点计算的系统,如峰值性能达54.9PFLOPS(每秒54.9千万亿次浮点计算)的“天河二号”系统和峰值性能为8.5PFLOPS(每秒8.5千万亿次浮点计算)的“Stampede”系统。

据了解,天河二号的研制得到了广东省和广州市的大力支持,将作为广州超级计算中心的业务主机,今年下半年安装交付,主要应用于大科学、大工程以及产业升级和信息化建设领域。

天河二号

图10 天河二号

目前,天河二号已应用于生物医药、新材料、工程设计与仿真分析、天气预报、气候模拟与海洋环境研究、数字媒体和动漫设计等多个领域,开始为多家用户单位提供超级计算服务。

相关资讯
低空经济崛起:2025无人机市场的关键应用与增长引擎解析

无人机系统(Unmanned Aerial Systems, UAS)作为“低空经济”的核心载体,正以前所未有的深度和广度渗透至众多产业领域,驱动效率变革与模式创新。其核心价值在于提供高灵活性、低成本和高精度的空中解决方案,显著提升了传统作业方式的效能。

柔性AMOLED强势登顶!2025年Q1智能手机面板份额突破63%,中国供应链强势助攻

市场研究权威机构Omdia最新报告揭示,智能手机显示技术格局已发生根本性转变。2025年第一季度,采用AMOLED面板的智能手机出货量在全球总市场中占比高达63%,较去年同期的57%实现大幅跨越,标志着AMOLED已成为无可争议的主流标准。与此同时,LCD面板的份额被压缩至37%,延续了长期的萎缩态势。

英伟达H20芯片获批对华销售 黄仁勋链博会宣布近期供货

7月16日,第三届中国国际供应链促进博览会(链博会)在京开幕。美国科技企业英伟达公司首席执行官黄仁勋身着唐装亮相开幕式,并在现场透露重要业务进展:该公司专为中国市场设计的H20人工智能芯片已获得美国商务部出口许可,即将启动批量供货。

LPDDR6进程加速:Cadence推出性能达14.4Gbps的完整IP解决方案

近日,楷登电子(Cadence Design Systems, Inc., NASDAQ: CDNS)宣布其业界领先的LPDDR6/5X内存IP系统解决方案已成功完成流片验证。该集成化子系统通过技术优化,实现了高达14.4Gbps的运行速率,相较上一代LPDDR标准内存接口,性能提升幅度达到50%。此套先进解决方案被视为扩展人工智能(AI)基础架构的关键驱动技术之一。它旨在满足日益增长的新一代AI大语言模型(LLM)、代理型AI(Agent AI)以及众多垂直应用领域对超高内存带宽和容量的迫切需求,以高效支持这些计算密集型工作负载。楷登电子当前已与AI、高性能计算(HPC)及数据中心领域的多家头部客户展开紧密合作,共同推进该技术的应用落地。

贸泽电子持续强化TI产品矩阵,赋能全球硬件创新

作为全球授权电子元器件代理商,贸泽电子(Mouser Electronics)持续深化与德州仪器(TI)的战略合作,确保69,000余款TI器件的高效供应,其中45,000余款保持常态库存,可实现全球快速交付。通过整合TI在电源管理、数据处理及控制系统的完整技术生态,贸泽为工业自动化、汽车电子、通信基建、企业级设备等核心领域提供端到端解决方案支持。