『GPU』GPU历史系列(四):通用GPU的来临

『GPU』GPU历史系列(四):通用GPU的来临
本文插图

来源:内容由半导体行业观察(ID:icbank)编译自「techspot」 , 谢谢 。
随着DX10的到来 , 顶点和像素着色器保持了很大程度的通用功能 , 因此移动到统一的着色器拱门消除了许多不必要的重复处理块 。 第一个使用这种架构的GPU是Nvidia的标志性G80 。
四年的研发和4.75亿美元的投入 , 生产出了6.81亿个晶体管 , 484mm2 的庞然大物——在11月8日首次成为8800 GTX旗舰和8800 GTS640MB 。 一款超频的GTX , 即8800 Ultra , 代表了G80的顶峰 , 夹在两款较小产品的发布之间:2月份发布的320MB GTS和2007年11月19日限量生产的GTS 640MB/112 Core 。
在新的Coverage Sample anti-aliasing(CSAA)算法的帮助下 , Nvidia满意地看到其GTX彻底摧毁了所有单显卡和双显卡竞争对手 。 尽管取得了成功 , 但该公司在第四季度在独立显卡市场的份额下降了三个百分点-AMD凭借原始设备制造商(OEM)合同的优势获得了增长 。
『GPU』GPU历史系列(四):通用GPU的来临
本文插图

MSI版本的GeForce 8800 GTX
2007年2月和6月 , 英伟达关于G80的商业战略的其余部分成为现实 。 基于c语言的CUDA平台SDK(软件开发工具包)以beta形式发布 , 目的是利用GPU高度并行化的特性实现一个生态系统 。 Nvidia的PhysX物理引擎以及它的分布式计算项目、专业虚拟化和OptiX (Nvidia的射线追踪引擎)是使用CUDA的更受瞩目的应用程序 。
Nvidia和ATI(现为AMD)都在将不断增加的计算功能集成到图形管道中 。 ATI / AMD将选择依靠开发人员和委员会来开发OpenCL , 而Nvidia考虑到CUDA和高性能计算有更直接的计划 。
为此 , 英伟达在6月份推出了Tesla系列的数学协处理器 , 最初是基于已经为GeForce和Quadro FX 4600/5600提供动力的G80 core , 经过至少两次(可能三次)的主要调试 , AMD在5月份发布了R600 。
媒体大肆宣传该产品是AMD对8800 GTX的回应 , 但HD 2900 XT令人大失所望 。 它是一款中高端卡 , 但有着发烧级主板的功耗 , 比其他任何当代解决方案都消耗更多的功率 。
R600的失误在ATI内部产生了深远的影响 , 促使战略改变以满足未来的最后期限和最大限度的发布机会 。 RV770 (Evergreen)以及南北群岛系列改进了执行 。
R600是迄今为止最大的ATI / AMD GPU , 面积为420mm2 , 它结合了许多GPU首创 。 它是AMD的第一个DirectX 10芯片 , 它的第一个也是唯一一个拥有512位内存总线的GPU , 第一个带有tessellator单元的厂商台式机芯片(由于游戏开发者的漠不关心和缺少DirectX支持 , 该单元一直未被大量使用) , 第一个具有集成音频/ HDMI支持的GPU , 以及第一个使用VLIW的GPU , 这种架构一直保留到现在的8000系列 。 这也是自RADEON7500以来 , 第一次在竞争对手的价格和性能方面 , ATI/AMD没有部署顶级卡 。
AMD将R600升级为RV670 , 将GPU从TSMC的80nm进程缩减为55nm节点 , 并将512位双向内存环总线替换为更标准的256位 。 这使得R600的裸片面积减少了一半 , 同时封装了几乎同样多的晶体管(666万个 , 而R600是7亿个) 。 AMD还为DX10.1更新了GPU , 并增加了对PCI Express 2.0的支持 , 所有这些都足以淘汰HD 2000系列 , 并与主流的GeForce 8800 GT和其他更小的显卡竞争 。
在缺乏高端GPU的情况下 , AMD于2008年1月推出了两款双GPU显卡 , 以及基于预算的rv620 /635的显卡 。 HD 3850 X2在4月份上市 , 最后一张All-In-Wonder品牌显卡HD 3650在6月份上市 。 经过精心设计的驱动程序包 , 双GPU显卡立即引起了评论家和消费者的注意 。 HD 3870 X2轻松地成为最快的单显卡 , 而HD 3850 X2也没有慢多少 。 与Nvidia的SLI解决方案不同 , AMD通过通用的ASIC为Crossfiring显卡建立了支持 。


推荐阅读