CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统

2022年1月13日下午,龙芯中科首届LoongArch生态创新大会在线上召开 。
会上,龙芯携手众多合作伙伴发布基于LoongArch自主指令集的产品或解决方案,发布龙芯生态白皮书,并同步举行了吸引中小企业参与研发的龙芯创业者支持计划颁奖典礼 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

龙芯中科于2021年正式推出具有完全自主知识产权的LoongArch自主指令集,具有完全自主、技术先进、兼容生态三大特点 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

在先进方面,LoongArch吸纳了现代处理器架构中各种先进指令技术优势,指令集效率大大提升,摒弃了传统指令系统中已不合时宜的陈旧内容,以及对于指令系统设计领域的先进技术的发展,与原有兼容指令系统相比,LoongArch不仅在硬件方面更易于高性能低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发 。
在自主性方面,LoongArch从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,在架构上进行自主重新设计,具有充分的自主性,已通过了第三方权威知识产权评估机构的评估 。
【CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统】在兼容性方面,LoongArch融合了各国际主流指令系统的主要功能特性,同时依托龙芯团队在二进制翻译方面十余年的技术积累创新,不仅能够确保现有龙芯电脑上应用二进制的无损迁移,而且能够实现多种国际主流指令系统的高效二进制翻译 。也就是说,LoongArch可以兼容多种国际主流的指令系统 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

去年下半年推出的3A5000/3C5000L芯片正是基于LoongArch指令集 。
其中,龙芯3A5000是首款基于LoongArch指令集的桌面处理器,主频为2.3GHz-2.5GHz,包含4个处理器核心 。每个处理器核心采用64位超标量GS464V自主微结构,包含4个定点单元、2个256位向量运算单元和2个访存单元 。
龙芯3A5000集成了2个支持ECC校验的64位DDR4-3200控制器,4个支持多处理器数据一致性的HyperTransport 3.0控制器 。支持主要模块时钟动态关闭,主要时钟域动态变频以及主要电压域动态调压等精细化功耗管理功能 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

根据龙芯中科公布的国内第三方测试机构的测试结果显示,龙芯3A5000处理器在GCC编译环境下运行SPEC CPU2006的定点、浮点单核Base分值均达到26分以上,四核分值达到80分以上 。
基于国产操作系统的龙芯3A5000桌面系统的Unixbench单线程分值达1700分以上,四线程分值达到4300分以上 。测试分值已经逼近市场主流桌面CPU水平,在国内桌面CPU中处于领先地位 。
龙芯3C5000L则是龙芯中科的新一代服务器处理器 。龙芯3C5000L通过封装集成了四个3A5000硅片,形成16核处理器 。
基于龙芯3C5000L的四路64核服务器整机的SPEC CPU2006性能分值可达900分以上,全面满足云计算、数据中心对国产CPU的性能需求 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

龙芯表示,CPU的单核性能更能够反应芯片设计能力,正是基于龙芯自主IP核的不断超越,十年来龙芯CPU单核性能提升了10倍,这其中主频仅提升了1.5-2倍,剩下的2-5倍的性能提升更多是来自于龙芯自身的CPU设计能力的提升 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

此外,3A5000/3C5000L还内置国密算法和可信模块,实现了自主与安全的深度融合,彻底打破由Wintel及AA国外厂商主导的基于指令集及芯片设计的生态体系,填补国家信息化发展对芯片要求性能优异并具有完全自主知识产权的空白 。为加快数字化发展、建设数字中国打下坚实的自主核心硬件基础 。

CPU处理器|单核性能10年提升10倍!龙芯CPU构建全面开放的LoongArch生态系统
文章图片

倪院士在大会致辞中表示,LoongArch自主指令集系统(龙芯架构)的发布,是中国信息产业的一个重要成果,希望龙芯等国产CPU开展协同攻关,开拓创新,能够成为国家网信事业的坚强底座 。


推荐阅读