模型|惠普Z8 G4工作站评测:中小型AI模型训练“神器”( 三 )


HP Z8 G4工作站所提供的显存真的非常大 。 两块NVIDIA Quadro RTX 8000 , 提供2 x 48G的显存 。 在CIFAR-10分类模型训练过程中 , 我通过不断调整batch大小后发现 , 当batch=512的时候 , 才会产生显存不足的问题 , 从而导致无法正常训练 。
虽然batch的增大会一定程度上提高模型的泛化能力和稳定性 , 但随着batch的增大 , 模型的性能反而会下降 。 因此一般情况batch的设置不会太大 , 常用的设置为32、64和128 。 而48G的显存在最大程度上提供了稳定性和提高batch的可能性 。
最后从整体的使用体验来看 , HP Z8 G4工作站凭借着两块NVIDIA Quadro RTX 8000为整个训练提供了足够的计算能力 。 完全可以满足中小型模型训练的算力需求 。
同时因为其卓越冷却设计和惠普高效的散热解决方案 , 在整个训练过程中并没有出现很大的噪音和很大的热量 , 避免了影响其他同事的工作 。


推荐阅读