惠普Z8 G4工作站评测:中小型AI模型训练“神器”( 二 )


由于强大的处理器性能 , 因此对整机的散热功能提出了挑战 。 HP Z8 G4工作站为每颗处理器都配备了高压风扇散热排 , 其整机前部和顶部也有多个出风口 , 后部则有一个大风扇和小风扇用于吸风 , 可以在保障高性能工作的基础上依然保持一个较低的温度 。 相比于以前用的电脑主机 , 没有烫手的温度 , 也没有“蒸桑拿”式的感受 。 在出风口处只有淡淡的暖风 , 并且没有风扇高速旋转的噪音 , 完全满足了室内工作环境安静的需求 。
二、在深度学习模型训练上的表现介绍完HP Z8 G4工作站的一些关键参数和散热表现后 , 下面给大家上“主菜” 。
目前AI领域最成熟的技术可能就是计算机视觉了 , 因此也有着很多人开始转入计算机视觉相关的研发工作 。 而计算机视觉领域中 , 图像分类和目标检测是两个最基本任务 , 也是每一个计算机视觉研发人员必须要掌握的技能 。 下面就这两个任务 , 我将进行深度学习模型的训练 , 来实际看看HP Z8 G4工作站的性能到底如何 。
1、基本的环境配置和参数根据NVIDIA官网的推荐 , 针对NVIDIA Quadro RTX 8000我选取了450版本的驱动进行了安装 , 并安装了相应版本的CUDA 11.0 , 实现对GPU计算调用加速 。 在Linux下可以通过命令NVIDIA-SMI看GPU驱动以及CUDA版本信息 。 如下图所示 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
通过CUDA自带的案例程序 , 也可以测试并查看一些基本的计算参数 , 如:

  • – CUDA核心数目
运行程序./NVIDIA_CUDA-11.1_Samples/1_Utilities/deviceQuery/deviceQuery , 可查看CUDA信息 。 如下图 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
从图中的输出的信息来看 , CUDA核心数目为4608个 , 同时提供48601MB的存储器 , 1.77GHZ的最大频率和7001MHZ的显卡频率 。
  • – 浮点计算能力
运行程序./NVIDIA_CUDA-11.1_Samples/7_CUDALibraries/batchCUBLAS/batchCUBLAS , 可测试GPU的单精度计算能力 。 如下图 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
  • – 单精度浮点运算
运行程序./NVIDIA_CUDA-11.1_Samples/7_CUDALibraries/batchCUBLAS/batchCUBLAS可进行测试 。 如下图 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
2、图像分类与目标检测模型的训练(1)基于CIFAR-10和ImageNet数据集的分类模型训练在本次的分类模型训练中 , 我分别使用了简单的CNN网络和经典的ResNet50网络 , 分别对CIFAR-10数据集和ImageNet数据集进行了分类训练 。
  • – 模型介绍与数据集介绍
CNN(Convolutional Neural Networks , 卷积神经网络)由于其出色的泛化能力 , 被广泛的应用于物体分类和物体检测等方面 , 在图像方面有着广泛的应用 。 而ResNet网络则是2015年由AI学术界大佬何凯明提出的一中卷积神经网络模型 , 获得了当年ImageNet大规模视觉识别竞赛中图像分类的冠军 。
CIFAR-10数据集是一个比较小、也比较常见的图像分类数据集 , 其共有60000张32×32的彩色图片 , 图片分为10类 , 每类6000张图 。 其中有50000张用于训练 , 10000张用于测试 。
ImageNet数据集则是一个用于视觉对象识别软件研究的大型可视化数据库 , 其中包含了20000多物体类别 , 共计约1400万张图像 , 是计算机视觉领域最具权威的数据集之一 。
  • – 模型训练与结果
在本次的实验中 , 因为CIFAR-10数据集本身的数据量并不多 , 因此通过构建简单的CNN来进行训练 , 来直观感受一下HP Z8 G4工作站的计算能力 。 同时利用经典的ResNet网络 , 选择使用50层深度的ResNet50来对ImageNet数据集中的图像进行分类训练 。 训练结果如下 。


推荐阅读