科技一哥清华开源迁移学习算法库作者：清华大数据软件团队机器学习组本

文章图片
作者：清华大数据软件团队机器学习组
本文长度为1700字，建议阅读6分钟
本文为你介绍Trans-Learn算法库。
Trans-Learn是基于PyTorch实现的一个高效、简洁的迁移学习算法库，目前发布了第一个子库——深度域自适应算法库（DALIB），支持的算法包括：
DomainAdversarialNeuralNetworks（DANN）DeepAdaptationNetwork（DAN）JointAdaptationNetworks（JAN）ConditionalAdversarialDomainAdaptation(CDAN)MaximumClassifierDiscrepancy(MCD)MarginDisparityDiscrepancy(MDD)项目地址：
https://github.com/thuml/Transfer-Learning-Library
域自适应背景介绍
目前深度学习模型在部分计算机视觉、自然语言处理任务中已经超过了人类的表现，但是它们的成功依赖于大规模的数据标注。但是实际场景中，标注数据往往是稀缺的。解决标注数据稀缺问题的一个方法是通过计算机模拟生成训练数据，例如用计算机图形学的技术合成训练数据。

文章图片
图表1VisDA2017竞赛任务
但是由于训练数据和测试数据不再服从独立同分布，训练得到的深度网络的准确率大打折扣。为了解决上述数据漂移造成的问题，域自适应(DomainAdaptation)的概念被提出。域自适应的目标是将模型在源域(Source)学到的知识迁移到目标域(Target) 。例如计算机模拟生成训练数据的例子中，合成数据是源域，真实场景的数据是目标域。
域自适应有效地缓解了深度学习对于人工标注数据的依赖，受到了学术界和工业界广泛的关注。目前已经被引入到图片分类、图像分割(Segmentation)、目标检测(ObjectDetection)、机器翻译(MachineTranslation)等众多任务上。吴恩达曾说过：“在监督学习之后，迁移学习将引领下一波机器学习技术商业化浪潮。 ”随着产品级的机器学习应用进入数据稀缺的领域，监督学习得到的尖端模型性能大打折扣，域自适应变得至关重要。
研究现状
深度域自适应方法主要包括以下两大类：
1.矩匹配。通过最小化分布差异来对齐不同域的特征分布。例如深度适配网络DAN ，联合适配网络JAN 。
2.对抗训练。域对抗网络DANN是最早的工作，它引入一个领域判别器，鼓励特征提取器学到领域无关的特征。在DANN的基础上，衍生出了一系列方法，例如条件域对抗网络CDAN ，间隔差异散度MDD等。

文章图片
图表2DANN网络架构图

文章图片
图表3MDD网络架构图
上述方法在实验数据上体现了良好的性能。然而目前学术界域自适应方法的开源实现中存在下述问题：
复用性差。域自适应方法和模型架构、数据集耦合在一起，不利于域自适应方法在新的模型、数据集上复用。稳定性差。部分对抗训练方法随着训练进行，准确率会大幅度下降。DALIB设计的初衷就是让用户通过少数几行代码，就可以将域自适应算法用在实际项目中，而无需考虑域自适应模块的实现细节。
易用性
DALIB将现有域自适应训练代码中的域自适应损失函数分离出来，按照PyTorch交叉熵损失函数的形式进行封装，方便用户的使用。域自适应损失函数也和模型架构进行了解耦，因此不依赖于具体的分类任务，所以算法库很容易扩展到图片分类以外的分类任务。
如下，使用两行代码即可定义一个与任务无关的域对抗损失函数。

文章图片
不同域自适应损失函数中有一些公用的模块，例如所有算法中都用到的分类器模块，对抗训练中用到的梯度翻转模块、域判别器模块，核方法中的核函数模块等。这些公用模块和提供的域自适应损失函数是分离的。因此，在DALIB中，用户可以像搭积木一样，重新定制自己需要的域自适应损失函数。

科技一哥清华开源迁移学习算法库

推荐阅读

央视新闻客户端|服务贸易到底是啥？它和日常生活有啥联系？一文看懂：服贸就在我们身边

茭白需要炒几分钟

阿里巴巴从蒋凡事件谈阿里巴巴合伙人制度设计：股权激励费用数目惊人

央视新闻|49岁眼科女医生去世，将眼角膜和遗体分别捐献给医院和大学

[生肖]家有此3大生肖，贵人助力，富足旺财，6月下旬，职场风生水起

南充新闻网|白俄罗斯代表46国在联合国人权理事会作共同发言支持中国在涉疆问题上的立场

美国今年近2.7万人因枪死亡|美国今年近2.7万人因枪死亡具体是什么情况？

猛龙|30＋11＋8三分！范弗里特打疯了，真对不起，小卡真不是单核夺冠

鼎盛军事|配备中国造14.5重机枪，威力十分强悍，伊朗自产防雷车已大量服役

经济|新闻观察 | 各地项目集中开工支撑基建投资保持高位投资需求加速释放

大众报业·海报新闻|富力主帅：战鲁能上年轻人

29年前，那位大喊“我要读书”的大眼睛女孩苏明娟，如今成了这样

土耳其安哥拉猫生活习性介绍

周迅|48岁周迅怎么还那么嫩！庆生照穿衬衫古灵精怪美成少女，状态超好

许7秒记忆■文玩沉香手串应该如何保养？

德国党卫军跟国防军区别,二战时期德国国防军跟党卫军有什么区别-

安东尼|美国女子陈尸家中两年死因成谜，四子女同屋照常生活

小丑的娱乐|萧亚轩男友累到吐血就医：天后表示非常的自责，富婆真是不好伺候

乘坐动车时大行李箱放在哪里比较好？

zol中关村在线首款支持5G+Wi-Fi 6平板官宣四等边框设计爱了

科技一哥 清华开源迁移学习算法库

推荐阅读

科技一哥清华开源迁移学习算法库