雷锋网|星云 Clustar 首席科学家胡水海：GPU 在联邦机器学习中的探索( 五 )

本文插图

那么为什么机器学习模型训练可以容忍部分丢包呢？原因是目前模型训练大多采用随机梯度下降(SGD)方式通过多轮迭代进行，丢失一部分数据不影响训练算法找到模型收敛点。如图所示，蓝线是不丢包的情况下模型训练的收敛路径，而在有丢包的情况下，随机梯度下降能让模型训练选择另外一条路径达到收敛点。

本文插图

基于上述观察，我们设计了一个机器学习专用的网络传输协议---MLT 。核心思想是：在不影响模型收敛的前提下，允许一定的丢包，不做重传，从而降低跨区域通信时间。将MLT跟传统的TCP以及UDP进行对比可以发现， TCP可以看作是做百分百丢包重传的可靠传输， UDP可以看作是百分百丢包不重传的不可靠传输，而MLT位于两者之间，是根据机器学习训练的特点，选择重传一部分丢失的数据包，使丢包率控制在不影响模型收敛的范围内，并通过避免不必要的丢包重传来降低联邦学习的通信时间。

本文插图

具体到实验评测如上图， MLT可以通过减少不必要的丢包重传，能够大幅缩短联邦学习模型训练的时间。
雷锋网、雷锋网、雷锋网

雷锋网|星云 Clustar 首席科学家胡水海：GPU 在联邦机器学习中的探索( 五 )

推荐阅读

【汽车冷知识】电动航空座椅/升降橱柜//旋转马桶，五一房车展：新款飞翔T型房车

大模型Kimi火了，长文本“卷”出新高度

[坦言]收入提高了？滴滴司机坦言：因为平台这波操作，现在收入

游戏大妹子|金角刚被转到辅助位置，如今宣布回归AD位，BLG无人可用

何鸿燊逝世，旗下上市公司股价暴涨超20%

英语老司机|怒怼特朗普的人走了…“中国外交天团”换人了！发言人耿爽卸任

低龄老人挤爆老年大学娱乐班最爱上什麽课？

环球火力配30mm火神机炮，发动机被打烂都能返航，全球最彪悍的攻击机

威宁|网传大山深处出现诡异“龙吟”声？调查结果来了！

8个老司机不愿意分享的倒车技巧，简单实用！

“我想要的一直都是被坚定的选择” | Soul星研究：你有“真正去爱”的能力吗？

阿力讲星座|8月里，越来越有钱的生肖，7月下旬日子红红火火

华为Mate30华为手机太多，不知道怎么选？看看这三款，口碑超好

自动挡的＂S“挡和”sport＂按键 sport是什么意思

苹果手机|华为新机，双卡+Wi-Fi 6+，会是谁？ | iPhone SE 2官方降价，国行2399起？

炼化|华泰证券：看好基础原料环节的龙头公司（附股）

中年|你的银行卡号输错一位，我们怀疑你恶意骗贷！

「王者荣耀」王者荣耀：评分最高只能16？玩家一场对局感动官方，得分突破记录

「克克异闻」多吃点他吧，很有用，长期痛经的

中新经纬|东阿阿胶大跌5.19%，振幅8.63%