『驱动之家』128 核心 CPU 问世:12 通道 DDR5+PCIe5.0、性能超顶级 Intel 至强


2016年才成立的斯洛伐克创业公司Tachyum今天抛出一枚重磅炸弹 , 宣布了全新的128核心Prodigy处理器 , 号称"性能可超越Intel最快的至强 , 同时功耗仅有十分之一" 。
首先说一下Tachyum的背景:这家公司设立在斯洛伐克 , 并得到过斯洛伐克政府1700万美元投资 , 但几位创始人都是美国人 , 且大有来头 。
尤其是CEORadoslavDanilak , 拥有25年的半导体行业经验 , 一度大红大紫的SSD主控巨头SandForce就是他创立的 , 还亲自担任CEO , 后被希捷收购 , 后来又创立了Skyera , 继续研究SSD主控技术 , 2014年又被西数收购 。
TachyumProdigy号称是全球第一颗"通用处理器"(universalprocessor) , 因为它在单独一颗硅片内 , 集成了通用目的处理器、高性能计算、AI人工智能、DML深度机械学习、可解释人工智能(ExplainableAI)、生物人工智能(BioAI)等等 , 基于并行多处理器环境 , 可简化编程模型和环境 。

『驱动之家』128 核心 CPU 问世:12 通道 DDR5+PCIe5.0、性能超顶级 Intel 至强
本文插图

最新的顶级型号为ProdigyT6128 , 单路单芯片集成128个物理核心 , 乱序执行架构 , 每时钟周期4条指令 , 支持64位寻址、512位矢量操作、AI/ML矢量和矩阵乘法加速、虚拟化、高级RAS , 运行频率最高4GHz 。
缓存方面 , 每个核心32KB一级指令缓存、32KB一级数据缓存 , 均支持ECC , 末级缓存共享64MB , 支持DECTEDECC 。
内存方面 , 支持12个通道的DDR4、DDR5 , 最高频率DDR5-4800 , 但每通道只能有一条内存条 , 单条最大容量512GB , 合计最大6TB , 并支持高级纠错和RAS 。
IO方面 , 集成了多达36个PCIe5.0控制器 , 最多48条通道 , 同时还集成了两组400G(40万兆)以太网控制器 。
更惊人的是 , 所有这些强大的规格 , 在台积电7nm工艺的加持下 , 封装面积才不过85×85平方毫米 , 略大于IntelLGA2066的酷睿 , 但小于AMDSP3的线程撕裂者 。
Tachyum没有披露Prodigy的具体架构 , 不知道基于RISC-V、MIPS、ARM还是自研 , 只是说无论单线程还是多线程应用 , 都已经超越了Intel至强 , 但是又比ARM更小巧 。
据介绍 , ProdigyT6128处理器适合大规模超级计算机、大数据、大型AI应用 , 可提供262TFlopsAI训练和推理性能、16TFlopsHPC高性能计算性能 。
开发环境方面 , Tachyum也提供了一系列工具 , 包括FPGA模拟器、软件模拟器、二进制翻译器、C/C++/Fortran编译器、调试器和配置文件、TensorFlow编译器 , 都在Linux操作系统下 。

『驱动之家』128 核心 CPU 问世:12 通道 DDR5+PCIe5.0、性能超顶级 Intel 至强
本文插图


『驱动之家』128 核心 CPU 问世:12 通道 DDR5+PCIe5.0、性能超顶级 Intel 至强
本文插图

如果客户不需要128核心这么高大上的规格 , Tachyum也提供64/32/24/16核心等不同配置 。
64核心的有两款型号 , 一个是T864 , 支持八通道DDR4/DDR5内存、72条PCIe5.0通道、两组400G以太网、两组HBM3(可选)、32MB完全一致性二级/三级缓存 , 运行频率4GHz , 核心电压0.8V , 热设计功耗180W , 核心面积290平方毫米 , 封装面积66×66平方毫米 , 可以取代单路/双路的至强E7、至强E5 。
另一个是TH24 , 专供AI/HPC , 四通道DDR5和/或32GBHBM3 , 后者可作为缓存也可以是独立内存 , 需要高精密水冷 。
32核心的型号为T432 , 四通道DDR4 , 32条PCIe4.0 , 两组100G以太网 。 16核心的则是T216 , 双通道DDR4 , 32条PCIe4.0 , 两组50G以太网 。 二者都是小尺寸封装 , 成本和价格低廉 , 适合取代至强E5、至强E3、至强D系列 。
当然 , 这些产品大部分都还在纸面上 , 目前只流片成功了64核心的T864 , 预计今年内投入量产 。


推荐阅读