AI从业必看!英伟达GTC China大会最新干货( 二 )


2、比电气链路更快速的光链路
NVIDIA研究团队也在研究用更快速的光链路取代现有系统内的电气链路 。 该团队正与哥伦比亚大学的研究人员密切合作 , 探讨如何利用电信供应商在其核心网络中所采用的技术 , 通过一条光纤来传输数十路信号 。
电信号因自身限制 , 传播距离只有1/3米 , 而光信号的传播距离有20-100米 , 只需一个单条NVLink便可连接至更大规模的系统 。
这种名为“密集波分复用”的光学技术, 有望在仅1毫米大小的芯片上实现Tb/s级数据的传输 , 是如今互连密度的10倍以上 。
除了更大的吞吐量 , 光链路也有助于打造更为密集型的系统 。 Dally举例展示了一个未来借助光链路传输、可搭载160多个GPU的NVIDIA DGX系统模型 。
AI从业必看!英伟达GTC China大会最新干货文章插图
3、全新编程系统原型Legate
软件方面 , 为了简化编程步骤 , NVIDIA研究人员开发了全新编程系统原型Legate 。 开发者借助Legate , 即可在任何规模的系统上 , 运行针对单一GPU编写的程序 , 既适用于Jetson Nano、单卡A100 , 也适用于搭载数千个GPU的巨型超算 。
Legate将一种新的编程速记融入了加速软件库和高级运行时环境Legion , 目前它正在美国国家实验室接受测试 。
AI从业必看!英伟达GTC China大会最新干货文章插图
Dally也提到 , Legate无法针对大量GPU进行理想的并行处理 , 这也是他们要努力解决的问题 。
除了上述三项研究外 , Dally还在演讲中谈到NVIDIA针对医疗健康、实时光线追踪、无人驾驶汽车、机器人等众多行业打造的平台 , 并首次公开展示了NVIDIA对话式AI框架Jarvis与GauGAN的组合 。
GauGAN利用生成式对抗网络 , 只需简略构图 , 就能自动填充画面细节 , 创建漂亮的风景图 。 在演示中 , 用户可通过语音指令 , 即时生成像照片一样逼真的画作 。
AI从业必看!英伟达GTC China大会最新干货文章插图
此外 , Dally还牵头开展了一项合作 , 构建了NVLink和NVSwitch最初的原型 。 NVLink和 NVSwitch如今用于全球最大型的超级计算机中 , 实现了其内部GPU的互连 。
最后 , Dally总结道 , NVIDIA正做着许多激动人心的事 , 相信未来将其中一些构思变为现实时 , 一定会振奋人心 , 届时 , NVIDIA将构建更强大的计算设备 , 将其运用到一系列更广泛的问题上 , 从而改善人们的生活 。
二、NVIDIA A100拿下多家中国云服务商和系统集成商在随后的高峰论坛上 , NVIDIA 亚太区战略运营与合作伙伴副总裁 Ashok Pandey宣布 , 多家中国顶级云服务提供商及系统制造商已采用NVIDIA A100 Tensor Core GPU和NVIDIA技术 , 用于提速各类AI应用 。
迄今为止 , 阿里云、百度智能云、滴滴云、腾讯云等中国云服务提供商均推出或即将推出搭载了NVIDIA A100的多款云服务及GPU实例 。
在中国 , 阿里巴巴已部署EFLOPS , 目前NVIDIA正与阿里合作将EFLOPS升级至A100和IB架构 。 在线性推理方面 , NVIDIA GPU已经逐渐进入CSP客户的核心业务 , 如推荐、广告、搜索、直播、视频等等 。
此外 , 最新发布的NVIDIA A100 PCIe版本以及NVIDIA A100 80GB GPU已被新华三、浪潮、联想、宁畅等中国领先系统制造商采用 。
NVIDIA A100 GPU配备了具有更高精度的第三代Tensor Core核心 , 性能较上一代产品有显著提升 , 可提供600GB/每秒GPU间连接传输速率的第三代NVIDIA VLink、NVIDIA NVSwitch、PCIe Gen4与NVIDIA Magnum IO软件SDK的组合 , 实现成千上万个GPU集群的高效扩展 。
这些技术得到了来自于NGC容器注册中NVIDIA市场领先生态系统的支持 。


推荐阅读