模型|华为云人工智能领域首席科学家田奇:ModelArts 3.0助力行业AI落地( 三 )


弹性训练是ModelArts的核心能力之一 , 可以根据模型训练速度的需求自适应实现资源的最佳分配 。
ModelArts提供两种模式 , 一是Turbo模式 , 可以充分利用空闲资源加速已有训练作业 , 训练速度可提升10倍以上 , 并且不影响模型的收敛精度;二是经济模式 , 可以通过最大化资源利用率给开发者提供极致的性价比 , 在大多数典型场景下可以提升性价比30%以上 。

模型|华为云人工智能领域首席科学家田奇:ModelArts 3.0助力行业AI落地
文章图片

为了更好地支持超大算力需求的AI研发 , 华为ModelArts平台在集群规模 , 任务数量 , 以及分布式训练都做了针对性的优化 。
ModelArts研发平台能够管理上万的节点 , 更好的支持大型训练任务需求 。 通过优化服务框架 , ModelArts平台支持10万级别的作业同时运行、支持万级芯片的大规模分布式任务 。
优秀的分布式加速比是大规模集群分布式训练的关键能力 , 也是促使用户选择使用大规模集群来加速AI业务的关键因素 。
华为云ModelArts领先的分布式加速比能力 , 在MLPerf benchmark Imagenet-1K分类任务上 , 使用512芯片集群跑出93.6秒的成绩 , 优于NVIDIA V100的120秒 。
在骨干网络、联邦学习、模型诊断优化、高效算力的加持下 , 华为云ModelArts会加速AI在行业落地 。 未来 , 华为云将持续聚焦于模型高效、数据高效、算力高效和知识高效4个重点方向 , 扎根于AI基础研究 。 在计算机视觉、语音语义、决策优化3大AI领域进行基础研究计划投入 , 我们会持续努力 , 提供强大的AI技术支持每一位开发者发挥所长、创造独特价值 。 华为云将持续践行普惠AI , 与全球开发者共成长!


推荐阅读