被指抄袭阿里通义千问!华为盘古团队官方回应......

发布时间:2025-07-10 阅读量:505 来源: 我爱方案网 作者: bebop

近期大模型领域里面出了个大瓜,华为的盘古大模型被质疑套壳和抄袭了阿里的通义千问开源大模型。

7月初,有自称是哥斯达黎加大学的韩国学生的GitHub用户,发布报告指出:盘古Pro MoE模型与阿里通义千问Qwen-2.5 14B模型的注意力参数指纹相似度高达0.927(接近完全一致的1.0),远超行业0.7以下的正常差异阈值,且在开源代码中发现了阿里的版权声明。 

图片










对比研究报告  图源:Github

截至发稿,上述文章已删稿。

针对质疑,华为官方“诺亚方舟实验室”迅速出面否认,其表示:模型为昇腾平台自主研发,部分代码引用已合规标注,并且符合开源协议。

图片

华为盘古团队的回应中,一个细节值得玩味:盘古大模型部分基础组件代码确实参考了业界开源实践,涉及其他开源大模型的部分开源代码。但严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。至于参考的是不是通义千问,标注出来的是不是通义千问的源代码,就没具体说了。

 

而阿里的沉默,则被解读为一种战术性回避,避免卷入公开论战。


一波未平一波又起,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。


图片

爆料文章截图


该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。


自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”


最后其也对盘古大模型的未来给出了肺腑之言:其实时至今日,我还是真心希望华为能认真吸取教训,能做好盘古,把盘古做到世界一流,把昇腾变成英伟达的水平。


截至目前,华为并未对此自曝内容发表声明。


笔者认为,这场争论尚无最终定论,但已为行业敲响警钟:国产大模型的崛起,需要超越“规避抄袭争议”的底线思维,向真正的架构创新与技术定义权迈进——因为最终决定市场地位的,从不是参数的相关性系数,技术只是基座,唯有普惠大众才是终极目标。正如工业界所言:“没有落地的大模型如同悬浮的引擎”,唯有扎根产业土壤,AI才能真正成为新质生产力的核心驱动力。

当前,瑞芯微平台的RK3588能很好地承载deepseek-r1 7B和1.5B语言大模型,在端侧运行时,RK3588凭借自身架构和NPU算力,可流畅运行7B/1.5B模型,生成速度每秒十几token。快包平台可提供安全稳定且即插即用的RK3588开发板及主控芯片。


扫码可申请免费样片以及获取产品技术规格书

图片

RK3588是瑞芯微电子推出的一款高性能处理器,采用先进的8nm制程工艺,集成了四核Cortex-A76和四核Cortex-A55 CPU,以及Mali-G610 MP4 GPU。更重要的是,RK3588内置了独立的NPU(神经网络处理单元),可提供高达6TOPS的AI算力,为运行复杂的深度学习模型提供了强劲动力。

AI界新星DeepSeek(中文名:深度求索)在近期迅速崛起,凭借低成本、高性能的AI模型火爆全网。其核心是一个强大的语言模型,能够理解自然语言并生成高质量文本,此外DeepSeek免费向全球开发者开放,加速了AI技术普及。

在RK3588上部署Deepseek可以通过瑞芯微官方的 RKLLM量化部署。

RKLLM-Toolkit 是为用户提供在计算机上进行大语言模型的量化、转换的开发套件。通过该工具提供的Python接口可以便捷地完成以下功能:

1.模型转换:支持部分格式的大语言模型转换为RKLLM 模型转换后的 RKLLM 模型能够在 Rockchip NPU 平台上加载使用2.量化功能:支持将浮点模型量化为定点模型

DeepSeek转换完成的RKLLM模型如下图所示:

图片

(图源讯为,下同)

然后将其传输到开发板上,使用对应的可执行文件运行即可,运行之后如下图所示:

图片

接下来向该模型提出问题即可,回复内容如下所示:

图片

在回复的过程中查看CPU和NPU的利用率,可以看到CPU的占用率为84%,并且调用了NPU的3个核心进行加速推理:

图片


RK3588与DeepSeek的结合,可以有效应用在以下场景:
  • 智能家居: RK3588可搭载于智能摄像头、智能门锁等设备中,利用DeepSeek实现人脸识别、行为分析等功能,提升家居安全性和便捷性。例如,当识别到陌生人闯入时,系统可自动报警;当识别到老人摔倒时,系统可及时通知家人。
  • 工业控制: 在工业生产线上,RK3588可结合DeepSeek实现产品质量检测、设备状态监控等功能,提高生产效率和产品质量。例如,在表面检测场景中,DeepSeek可快速识别产品表面的缺陷,并自动进行分类和记录。
  • 表面检测: RK3588可应用于各种表面检测设备中,例如PCB板检测设备、液晶面板检测设备等,利用DeepSeek实现高精度、高效率的缺陷检测,提高生产效率和产品质量。

快包平台推出了很多设计优化的RK3588主板方案,它们都是稳定出货、即插即用,在具体场景实现应用的产品。

瑞芯微RK3588工控机开发板

图片

方案简介:

方案基于Rockchip新一代旗舰 RK3588处理器开发设计,采用先进8nm制程工艺集成4核Cortex-A76+4核Cortex-A55架构,主频最高达2.4GHZ,支持8K超清显示,四屏异显,内置瑞芯微自研三核NPU,综合算力可达6TOPS。

方案特点:

1.6 TOPS算力加持,赋能人工智能应用

2.提供多种显示接口,支持四屏异显

3.提供丰富的CPU接口资源,满足计算链接存储需求

4.支持多种操作系统和二次开发

5.支持双千兆网口通讯

应用场景:

AGV、边缘计算、智慧大屏、高端平板、智能NVR、可视化网关等领域。

瑞芯微3588直播一体机

图片

方案简介:

瑞芯微 3588 直播机是一款即插即用直播机方案,方案可供直播机设备终端制造商开发自定义直播机。该直播机主板采用RK3588高端8核处理器,6T算力,屏幕分辨率最大可支持1920*1080,并配有两个USB3.0、一个Type-C全功能接口,方便客户组合外设,设置WiFi和4G互联,监控外设录像/编辑,快速导入产品创新。

方案特点:

SOC :RockChip RK3588

CPU :4×Cortex-A76+4×Cortex-A55

GPU :ARM Mali-G610 MP4 四核 GPU

NPU :6TOPS

应用场景:

教学培训、直播带货、产品宣传

瑞芯微RK3588边缘计算盒子

图片

方案简介:

瑞芯微RK3588边缘计算盒子,主频高达2.4GHz,适用于边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜。支持安卓12系统,内嵌高性能AI加速硬件,支持6T算力NPU.板载LPDDR4/LPDDR4X 8G内存,EMMC标配128GB(最大可选512GB),支持WIFI6通信、10000M以太网。可直接驱动1920*1080液晶屏。

方案特点:

1.RK3588超强CPU搭载Android 12系统,速度更快,性能更强。

2.支持PCIE WIFI6,BT5.0,双天线。

3.网口设计,支持一个1000M网口。

4.分辨率最大支持4K@60。

应用场景:

边缘计算,广告机,miniPC整机,工控一体机,零售机和快递柜

扫码可申请免费样片以及获取产品技术规格书

图片


相关资讯
大联大世平发布25TOPS多路AI检测方案:DeepX+瑞芯微RK3588赋能边缘计算

(2025年7月10日) 全球领先的半导体分销商大联大控股旗下世平集团,今日宣布推出一款创新的边缘AI多路物体检测解决方案。该方案深度融合了韩国DeepX的高性能DX-M1 AI加速卡(基于PCIe M.2)与瑞芯微(Rockchip)强大的Orange Pi 5 Plus模块(搭载RK3588处理器),旨在满足智能安防、零售分析、工业质检等领域对高效、高精度、低功耗多路实时物体识别的迫切需求。

低成本低功耗首选!三种人体运动感应模组对比分析

当前人体感应传感器主要包括红外传感器、激光雷达及低端毫米波雷达。

国产通用变频器方案合集:支持高精度矢量控制,满足异步电机调速需求

在工业自动化与电力电子驱动领域,变频器(VFD)已从可选设备跃升为提升系统能效与动态性能的关键核心。

龙芯超声波流量计方案在工业生产、热力能源监控中的应用案例

龙芯中科推出的LS1D100系列超声波流量计方案凭借国产化、高集成、低成本特性,快速切入工业控制与自动化市场。

瑞芯微全系列电力智能化方案合集!

面对电力行业对智能巡检与能效管理的迫切需求,瑞芯微SoC通过异构计算架构与低功耗设计实现技术突破