人走茶凉|UC伯克利尤洋189页博士论文公布,聚焦快速机器学习训练算法( 二 )
该论文包括以下三个主要部分:
第二章详细讲解了通信避免的SVM(communication-avoidingSVM) , 第三章详细介绍了通信高效的KRR(communication-efficientKRR) , 第四章详细介绍了异步贪心坐标下降(Asy-GCD) 。
第五章介绍了在超级计算机上加速ImageNet训练的细节 , 包括算法设计和通信/计算权衡 。
第六章介绍了将BERT训练时间从3天降低到76分钟的技术细节 , 这是建立在大批量优化和超参数自动调整等技术之上的 。
这三个部分紧密相关 。 研究者在第一部分中以凸优化开始 , 在第二部分中深入探讨非凸优化 。 由于非凸优化比凸优化要难得多 , 因此作者在第三部分中又进行了详细介绍 。 第七章则进行了总结 。
以下是这篇博士论文的目录:
在致谢的最后 , 尤洋表达了对家人的感谢:
【人走茶凉|UC伯克利尤洋189页博士论文公布,聚焦快速机器学习训练算法】最后 , 我想感谢我的母亲YanleiHuang , 父亲ZhiqiangYou , 兄长PengYou , 以及我的妻子ShiyueLiang 。 我将向家人们表达最深的感谢 , 没有他们无条件的支持我不可能获得今天的成就 。 我会一直在你们身边 。
推荐阅读
- 人走茶凉|释放出了什么信号?,英特尔恢复对华为的供货
- 短视频|周某人走红狂吸粉300万,直言418万直播,背后有团队撑腰?
- 快科技|这样不好,百度CEO李彦宏:现在的算法容易让人走极端
- 人走茶凉|消失多年的“公共天线”
- cell|小聪明式的科研人走不远,一篇顶刊论文《CELL》背后的纠纷!
- 人走茶凉|Power-Z KT002专用电子负载,ChargeLAB
- 人走茶凉|多媒体信息发布系统源码
- 人走茶凉|这下轮到库克着急了,突然反转!苹果市值单日蒸发10000亿
- 人走茶凉|| 电脑时钟时间正确,任务栏时间显示不正确,经验