|云服务太麻烦,我花9000美元自建深度学习工作站,上双路泰坦RTX


机器之心报道
编辑:魔王、蛋酱
贵是贵了点儿 , 但用起来是真香 。
|云服务太麻烦,我花9000美元自建深度学习工作站,上双路泰坦RTX
本文插图

创建属于自己的深度学习工作站大概是很多机器学习从业者的梦想 , 本文作者 Rahul Agarwal 也不例外 。 然而创建工作站并非易事 , 你得有时间 , 还得有钱 。 主要是得有钱……
在拖延了很长时间后 , Rahul Agarwal 下定决心创建自己的工作站 。 原因无他 , 受够了使用云服务时 , 不管多小的项目都要设置服务器、进行一系列安装 , 或者运行时和网络连接受限 。
于是 , Rahul 决定行动起来 。 在创建工作站之前 , 他阅读了大量资料 , 观看了很多相关的 YouTube 视频 , 做足了准备工作 。
按照个人需求创建深度学习工作站需要大量研究 , Rahul 研究了单个组件、性能、评论甚至外观 , 并写下了整个过程、所有组件以及选择原因等详细信息 。
如果你也想创建深度学习工作站 , Rahul 的这篇文章或许可以作为参考 。
为什么要创建个人工作站?
映入我脑海的第一个答案是:为什么不呢?
我的工作和深度学习、机器学习应用密切相关 , 但是每一次开启新项目都要使用新的服务器、安装所有依赖 , 真是让人头秃 。
|云服务太麻烦,我花9000美元自建深度学习工作站,上双路泰坦RTX
本文插图

如果有了属于自己的工作站 , 你就可以坐在桌边使用它 , 根据自己的需求进行大量定制 。 简直太棒了!
不过相比于使用云服务 , 创建工作站这个主意真的让我「身无长物」了 。
工作站配置
我用了好几周时间 , 搞定了所有配置 。
从一开始 , 我就目标明确:拥有大量算力 , 组件能在未来几年中进行更新 。 目前 , 我的最高优先级是创建一个支持两块英伟达 RTX Titan 显卡(具备 NVLink 桥)的系统 。 这样我就可以拥有 48GB 的 GPU 内存了!
PS: 以下配置或许并非最优配置 , 可能会有价格更低廉的选择 , 但我确定该配置会让我未来不那么头大…… 因此 , 我选择了它 。 此外 , 我还向英伟达寻求了大量建议 。
1. 英特尔 i9 9920x 3.5 GHz 12 核处理器
|云服务太麻烦,我花9000美元自建深度学习工作站,上双路泰坦RTX
本文插图

我选择的是英特尔处理器 , 而不是 AMD 。 原因是英特尔拥有更兼容和相关的软件 , 如 MKL , 它对我使用的大部分 Python 库有益 。
另一个可能也更重要的原因是:英伟达的工作人员建议 , 如果我想上双路泰坦 RTX , 最好用 i9 。 这样以后就不头痛啦~
那么 , 为什么从英特尔的产品里选择了这一款呢?
我最开始考虑了 9820X(10 核)和 9980XE(18 核) , 但后者超出预算太多 。 后来 , 我发现了 12 核的 3.5 GHz 处理器 i9–9920X , 既满足预算 , 同时它对于中档解决方案也是更优的选择 。
CPU 决定了其他组件的选择 。 例如 , 如果你选择 i9 9900X 系列 CPU , 你就必须选择 X299 主板;如果你使用 AMD Threadripper CPU , 那么你将需要一个 X399 主板 。
因此 , 注意选择合适的 CPU 和主板 。
2. MSI X299 SLI PLUS ATX LGA2066 主板
|云服务太麻烦,我花9000美元自建深度学习工作站,上双路泰坦RTX
本文插图

这是一次艰难的选择 , 选项实在太多了 。 我需要一个至少支持 96GB RAM 的主板(这也是为了满足双路泰坦 RTX 的需求) 。 这就意味着 , 如果我使用 16GB RAM 模块 , 我就必须拥有至少 6 个插槽 , 16x6=96 。 而这个主板有 8 个插槽 , 也就是说可以扩展到 128 GB RAM 。
我还想让这个系统以后可以拥有 2 TB NVMe 固态硬盘 , 也就是说我需要两个 M.2 端口 , 而这块主板恰好具备 。


推荐阅读