|用Windows电脑训练深度学习模型?超详细配置教程来了


选自towardsdatascience
作者:Ahinand
机器之心编译
编辑:Panda
虽然大多数深度学习模型都是在 Linux 系统上训练的 , 但 Windows 也是一个非常重要的系统 , 也可能是很多机器学习初学者更为熟悉的系统 。 要在 Windows 上开发模型 , 首先当然是配置开发环境 。 Kaggle Master 及机器学习实践者 Abhinand 立足于自己的实践 , 给出了一种简单易行的 Windows 深度学习环境配置流程 。
本文将介绍在 Windows 计算机上配置深度学习环境的全过程 , 其中涉及安装所需的工具和驱动软件 。 出人意料的是 , 即便只是配置深度学习环境 , 任务也不轻松 。 你很有可能在这个过程中犯错 。 我个人已经很多次从头开始配置深度学习环境了 , 但是通常是在对程序员更友好的操作系统 Linux 中 。
而对于 Windows 操作系统 , 没有多少文章详细解释这一过程 。 所以我打算自己来试试 。 这些天 , 经过多次试错之后 , 我终于找到了解决方案 。 这个方法不仅能够配置成功 , 还比我见过的其它教程简单得多 。
本教程为谁而写 , 以及为什么要用 Windows?
相信我 , 我自己也不喜欢在 Windows 上鼓捣 CUDA 。 但我们常常遇到这种情况:开发者经常需要在并非深度学习或程序开发专用的笔记本电脑或更强大的硬件上工作 。 在这种情况下 , 你并不总能避免使用 Windows 。 如果你遇到这种情况 , 或者正好拥有一台 Windows 计算机 , 又或者还不能熟练使用 Linux , 那么这份指南肯定能帮到你 。
本文包含以下内容:
硬件和软件的最低要求
安装 Python 和所需工具
设置开发环境
一些 GPU 术语
安装 GPU 驱动
安装 TensorFlow(CPU 和 GPU)
安装 PyTorch(CPU 和 GPU)
验证安装情况
我的个人经验和替代方法
硬件和软件的最低要求
如果你要按照本指南操作并且计划使用 GPU , 你必须使用英伟达 GPU 。
开发深度学习应用涉及到训练神经网络 , 这自然需要执行大量计算 。 也因此 , 我们需要越来越多的并行运算 , 而 GPU 正好能够满足我们的需求 。 这也是当前 GPU 需求旺盛的主要原因之一 。 大多数深度学习框架都自带 GPU 加速支持 , 这让开发者和研究者无需执行任何 GPU 编程就能在几分钟内使用 GPU 进行计算 。
大部分这些框架都(只)支持 CUDA , 而这只能在英伟达 GPU 上使用 , 这也是你需要使用英伟达 GPU 的原因 。 但是 , 使用 AMD 的 GPU 也不是不可能 , 相关信息可参阅:https://rocmdocs.amd.com/en/latest/ 。
不过 , 就算你没有 GPU , 也依然可以继续本教程 。 但为了有效进行深度学习 , 至少你要有好用的 CPU、内存和存储空间 。
我的硬件——笔记本电脑的配置如下:
CPU——AMD Ryzen 7 4800HS 8C -16T@ 4.2GHz on Turbo
RAM——16 GB DDR4 RAM@ 3200MHz
GPU——Nvidia GeForce RTX 2060 Max-Q @ 6GB GDDR6 显存
对于硬件配置 , 我推荐至少使用 4 核 2.6 GHz 的 CPU、16GB 内存和 6GB 显存的英伟达 GPU 。
另外 , 对于本教程 , 你当然需要使用 Windows 10 系统 。 我也假设你对 Python 软件包和环境具备基本认知 。 不管怎样 , 后面都会给出解释 。
推荐使用的 Windows 版本是最新的 64 位 Windows 10 稳定版 。
本教程假设你的操作系统是刚装好的 , 没有执行过额外的修改 。 不过只要你知道自己在做什么 , 依然可以参考本教程 。
安装 Python 和所需工具
第一步当然是安装 Python 。 我建议使用 Mini-Conda 来安装 Python 。 先给刚入门的新手解释一下原因 。
Conda 是一个软件包管理工具 , 可以帮助你安装、管理和移除各种不同的软件包 。 不过 Conda 并不是唯一的选择 , 还有 pip——这是我很喜欢的 Python 默认软件包管理工具 。 这里我们选择 Conda 的原因是在 Windows 上使用它更简单直接 。


推荐阅读