方舟,与其背后的「引擎」
从整个大模型应用市场来看,大模型服务平台获得企业客户的前提之一,也包括持续获得众多大模型提供商的支持 。
能够迎来国内数家顶尖大模型提供商的积极入驻,火山方舟当然有自己的优势 。
对于模型提供商来说,一方面,火山方舟是「大模型技术」与「火山引擎机器学习平台」的有机整体,能够提供可靠的算力供应、持续的性能优化、有竞争力的性价比 。
作为首批入驻的大模型提供商,据智谱 AI CEO 张鹏介绍,智谱 AI 在火山引擎平台上解决了千亿模型训练的稳定性、性能优化等挑战;MiniMax 联合创始人杨斌则表示,MiniMax 在火山引擎上实现了从月至周级别的大模型迭代速度,和指数级的用户交互增长 。
另一方面,借助火山方舟平台,模型提供商不需要去管理非常底层、复杂的事项,就能够向客户提供稳定服务,更低成本触达广泛客户,快速获得技术的回报 。在技术之外,火山引擎的算法团队、解决方案团队和交付团队也会共同协助企业客户与大模型提供商之间对齐需求,促进大模型的落地加速 。
此前,很多国内训练大模型的厂商都使用火山引擎的云服务,而从今以后,它们不仅能在火山引擎平台上花钱,还能够在火山引擎平台上赚钱 。
每一次技术的大变革,都会带来体验创新的新机会 。在大模型热潮的推动下,包括火山引擎在内的云厂商同样面临着快速变化的行业格局 。能否把握住变革中的机会,却与此前的技术布局分不开 。
如下图所示,位于基础设施层的火山引擎为大模型的推理提供高可靠的保障以及企业级的负载均衡和容错能力 。随着平台的不断迭代,其对大模型的资源供应将更为弹性、动态和廉价 。利用流量错峰、训推一体等手段,大模型推理的单位成本将进一步降低,这也是「大模型上云」带来的重要优势 。
![抖音团队在用的大模型服务平台"火山方舟",我们也上手体验了一把](http://img.jiangsulong.com/230630/155250I36-9.jpg)
文章插图
除此之外,火山引擎还将与大模型提供商联合进行深度的性能优化 。以 Lego 算子库为例,在训练场景下,使用该高性能算子库可将 Stable Diffusion 模型在 128 张 A100 的训练时间从 25 天减少到 15 天,训练性能提升 40% 。
在火山引擎的发展历程中,与英伟达的紧密合作也是一大亮点 。此前,双方共同完成的 GPU 推理库 ByteTransformer 在 IEEE 国际并行和分布式处理大会(IPDPS 2023)上获得最佳论文奖 。火山引擎和英伟达还联合开源了高性能图像处理加速库 CV-CUDA,并在大规模稳定训练、多模型混合部署等方面的技术合作上取得成效 。
NVIDIA 开发与技术部亚太区总经理李曦鹏表示,未来双方将继续深化合作,包含在 NVIDIA Hopper 架构进行适配与优化、机密计算、重点模型合作优化、共同为重点客户提供支持,以及 NeMo Framework 适配等,携手助力大模型产业繁荣 。
据了解,在火山方舟推向市场之前,团队已经利用众多的内部场景打磨和改进了平台 。迄今,字节跳动有 10 余个业务线正在探索接入和试用火山方舟平台,覆盖文本和图像生成、对话代码辅助、信息检索、营销创意、电商办公效率等应用 。
在大模型落地的关键探索时期,火山方舟的诞生恰逢其时,也收获了足够的注视 。但作为一个新生事物,它必然还要广阔的成长空间,而接下来的路,就需要大模型领域中的每一位参与者共同携手走下去了 。
【抖音团队在用的大模型服务平台"火山方舟",我们也上手体验了一把】
推荐阅读
- AI 正在杀死旧 Web?
- 爬虫解析HTML动态JS,技术应用揭秘
- 电影每秒播放的帧数一直停留在24帧,而不继续向更高的帧数发展
- 文章原创度在线检测工具有哪些?
- 十个图像处理的Python库
- 女人是否在乎你,看这3个方面就知道了
- 《长风渡》停播,让我看到影视圈一股隐藏的“乱象”,在野蛮生长
- 1韩元等于多少人民币——30亿韩元在韩国能用多久
- 三星掌门李在镕:毁掉胞妹,逼死女星,肆意操纵韩国的影子总统
- 这些人,在潜意识里就瞧不起你!