发布时间:2023-11-7 阅读量:1566 来源: 我爱方案网 作者: bebop
11月6日,龙芯中科举行了业绩说明会,并在与投资者互动过程中公布了龙芯3A6000、3B6000、3C6000处理器,9A1000 GPU等产品的最新消息。
官方表示,龙芯3A6000处理器初步定于2023年11月28日正式发布。这款CPU采用龙芯自主指令系统龙架构(LoongArchTM),为4核8线程设计,主频2.5GHz,集成双通道DDR4-3200内存控制器,得到了统信、麒麟、欧拉、龙蜥、鸿蒙等操作系统的支持。性能方面,龙芯3A6000可对标英特尔第10代酷睿i5系列处理器,SPEC CPU 2006 base单线程定/浮点分值分别达到43.1/54.6分,双DDR4-3200内存通道Stream实测带宽超过42GB/s。
在先进工艺研发方面,龙芯称已经开展对新工艺的评估,2024年将研制相关IP并开展测试片研制。胡伟武表示,7nm先进工艺对未来3A7000 CPU产品提升,目前看还应该可以提高20%-30%性能。
据介绍,7nm流片费用较高,一次需花费上亿元,不能用该工艺试错,用已有工艺完成结构试错后再改到更先进工艺。在新工艺上,还需研制DDR5 PHY、PCIE PHY、各类寄存器堆、锁相环等IP。
龙芯服务器类芯片过去并未在算力市场发展中,有效撑起公司业绩成长。胡伟武在业绩会上称,由于过去龙芯只有4核,几乎没有服务器市场。不过随着3C5000和3D5000的推出,今年龙芯服务器有很大进步,胡伟武表示,相信6000系列出来后,会有更大进步——3D6000、3E6000和3C6000推出时间(间隔)不会超过半年。
GPU方面,龙芯中科目前正在开发9A1000等GPU,以及用于互联的“龙链”技术。胡伟武称,9A1000的INT8性能大概达到32TOPS,并支持多个GPU通过龙链互联,“龙链跟3A5000的片间互联协议比,片间互联延迟成倍降低,带宽提高了好几倍,大大提高多片协同工作的性能。但目前龙链和英伟达的NVlink相比,速率要低一些,但效率已经很不错了。”
胡伟武透露,龙芯显卡产品9A1000对标AMD RX550,同时支持科学计算加速和AI加速,计划在2024年Q3流片。
资料显示,龙芯中科是国内唯一基于自主指令系统构建、独立于Wintel/AA的开放信息技术体系,和国内多数企业直接购买国外商业IP进行芯片设计、基于x86/Arm指令系统融入国外信息技术体系、依赖境外先进工艺提升性能的做法,是完全不同的。
龙芯在获得MIPS指令集授权后,借鉴创新出LoongArch指令集。这可以简单理解为指令集技术的“逆向工程”,先买别人的来研究仿制,再独立开发,并一步步迭代。
这条路走得艰难,在没有前人领路,只能“自学”的情况下,龙芯完成研究到独立开发迭代。在性能方面,龙芯制程工艺达到12nm节点,性能逐步达到七八年前主流水平。这表明授权+自研指令集路线的CPU,虽然还没有追上主流CPU的性能,已经取得了不小的进步。
龙芯中科处理器核心IP实现自主设计,依托于三大产品线,构建完整生态。龙芯中科通过完成自研指令系统、CPU和操作系统,龙芯中科打造独立自主信息产业技术体系,在处理器核设计、高速互连设计、内存控制器设计、物理设计等核心技术取得多项专利。
在产品方面,龙芯中科研制的芯片包括龙芯1号、龙芯2号、龙芯3号三大系列处理器芯片及桥片等配套芯片,主要客户是板卡、整机厂商。龙芯1号系列、龙芯2号系列主要面向工控类应用;龙芯3号系列主要面向信息化应用,其中部分面向高端工控类应用;配套桥片在工控类和信息化类领域均有应用。
龙芯具体芯片、方案介绍:
龙芯3A5000
龙芯3A5000是面向桌面和服务器等信息化领域的通用处理器,是首款采用龙芯指令系统(LoongArch)的处理器芯片。主频为2.3GHz-2.5GHz,包含4个处理器核心。每个处理器核心采用64位超标量GS464V自主微结构,包含4个定点单元、2个256位向量运算单元和2个访存单元。其关键IP源代码均为自主编写,芯片内置安全模块。
龙芯3A5000集成了2个支持ECC校验的64位DDR4-3200控制器,4个支持多处理器数据一致性的HyperTransport 3.0控制器。龙芯3A5000支持主要模块时钟动态关闭,主要时钟域动态变频以及主要电压域动态调压等精细化功耗管理功能。可广泛适用于五轴数控机床、工业计算机、双路服务器等场景。
应用案例:五轴数控机床
该方案基于龙芯3A5000芯片,完成龙芯CPU+ Loongnix + Preempt-RT的核心底层平台,并完成了五轴数控系统核心功能基于该平台的移植与初步验证,正在开展实时系统、 PLC子系统、总线协议栈、设备及轴管理、内核重构、 IDE编程调试软件、 HMI软件移植等完善提升。
龙芯3C5000
龙芯3C5000通过封装集成了四个3A5000硅片,形成16核处理器,重点优化多核多路互联效率主频 2.2-2.5GHz,单芯片双精度浮点峰值运算速度超过 0.5TFLOPS。单芯片unixbench分值9500以上,双精度计算能力达560GFlops,16核处理器峰值性能与典型Arm 64核处理器的峰值性能相当,并支持最高16路互连,搭配新一代龙芯7A2000桥片,PCIe吞吐带宽比上一代提升400%以上。可满足通用计算、大型数据中心、云计算中心的计算需求。
应用案例:工业服务器
(3C5000边缘云可扩展服务器)
3C5000 多达16核、2.5GHz的主频为实时数据库、历史数据库、应用服务器、OPC服务器提供充沛的计算能力。可应用于工业生产现场、设备控制、实时监控、高性能高可靠运算等场景。
龙芯2K1000LA
龙芯2K1000是面向工业控制与终端等领域的低功耗通用处理器,片内集成两个 64 位的双发射超标量 LA264 处理器核,主频 1GHz,功耗低至1~5W ,并支持动态降频降压,集成 GPU。芯片外围接口包括两路PCIE2.0、一路SATA2.0、4路USB2.0、两路DVO、64位DDR3及其它多种接口。可广泛适用于行业自助终端、数据网关、工业机器人、工业网关、PLC等领域。
应用案例:AI双目识别一体机
支持适配国产Loongnix/UOS/麒麟系统;
支持龙芯3A4000/2K1000处理器;
支持本地人脸图片的采集入库
金融级别的红外活体防伪认证算法
可用于人脸认证开机等权限管理应用
支持门禁机、认证对比机、一体机产品应用
内存:512MB,1×16-bit DDR4-2400
存储:2Gb NandFlash
申请样片,方案技术资料,请扫二维码。
在AI算力爆发与云计算需求激增的2025年,数据中心面临高带宽、低时延、低成本的三重挑战。GIGALIGHT推出的400G QSFP-DD SR4至4×100G单波互连方案,以“单波长100G PAM4”技术为核心,突破传统并行架构的瓶颈,实现单端口带宽利用率提升300%、功耗降低20%,并减少75%的光电转换单元,为全球超大规模数据中心提供兼具弹性与经济效益的短距连接新范式。这一方案不仅解决了传统400G部署中光纤资源浪费、端口密度不足、TCO过高等痛点,更在NVIDIA GPU集群、云原生Spine-Leaf架构等场景中验证了其技术领先性。
在AI数据中心高速迭代的浪潮中,是德科技KAI系列解决方案以全栈测试能力重构AI基础设施验证范式,通过算法仿真、高速网络验证与光互连测试三大核心模块,直击AI集群设计效率低、网络验证复杂度高、光模块测试精度不足等痛点。相较于传统方案,KAI系列通过全生命周期协同验证,帮助客户缩短30%以上的开发周期,并在Meta、阿里云等头部企业的实际部署中实现性能跃升。以下为重新生成的5个标题,结合技术价值与传播吸引力,精准覆盖用户需求场景。
在全球5G与AI技术加速融合的背景下,广和通推出5G AI MiFi解决方案,通过“通信+智能”双引擎重构移动热点设备的行业标准。该方案基于4nm制程高通QCM4490平台,集成Wi-Fi 7多频并发、本地化AI语音交互(支持20种语言互译)及低功耗设计,在2.33Gbps下行速率与95%翻译准确率的加持下,彻底解决传统MiFi设备在跨国场景中的连接延迟、交互单一及云端依赖等痛点。相比Netgear、华为等竞品,其独特的“端侧AI+边缘计算”架构在能效比(0.46Gbps/W)与多场景适配性(工业巡检、国际商务)上展现显著优势,成为推动万物智联时代高效落地的标杆方案。
一般定位追踪可使用GNSS技术,引入NB-loT的作用主要是为了利用云平台实现管理
工业智能化发展使大量工业设备需要接入网络以实现数据采集、远程监控和设备控制等功能