怎样用 torch7 做 multi-task learning?怎样 branch out? 这个任务最好

这个任务最好还是用caffe，无论是已有模型、引出分支、多损失、不同层使用不同学习率等等，在caffe中有很好的支持，改改prototxt配置文件即可，用torch麻烦一些。如果一定要用torch的话，大致思路如下：1）导入已有模型，推荐使用loadcaffe，毕竟可获得的最多的模型格式是caffe的。2）loadcaffe得到的是nn.Sequential形式的网络，想在原有基础上加几个分支，直接处理有点麻烦，可先手动将nn.Sequential转为nngraph形式，每个layer对应一个node，然后就方便在此基础上创建更复杂的网络了。3）多个损失，使用nn.ParallelCriterion 即可。4）finetune 时一般对不同层使用不同学习率，这一点用torch处理起来就麻烦一些了，网上有解决方案，https://gist.github.com/szagoruyko/1e994e713fce4a41773e ， gist被墙了，摘录原内容如下：Q: How to set different learning rates/weight decays per layerA: Two ways of doing it:if you are using optim.sgd, pass as argument to the optimState the fieldslearningRates/weightDecays, containing a Tensor with the multiplying factors(for the learning rate) or the values itself (for the weight decay) perparameter of the network. Here is an example. The downside of this approachis that you need to store an extra tensor of the size of the network.instead of doing parameters, gradParameters = model:getParameters(), doparameters, gradParameters = model:parameters(). This will give you a tableof tensors, each one of them corresponding to a separate weight/bias perlayer. While optimizing using optim, keep a separate optimState for eachparameter (which implies calling optim.sgd in a for loop)
■网友
用多个loss函数，把它们的gradient传回网络即可。

怎样用 torch7 做 multi-task learning?怎样 branch out?

推荐阅读

闲话星座|让前任忘记不了的3大星座女，不光能赚钱，还是贴心小棉袄，原创

居之安生活|为您讲清楚真相，降压药可以导致肾衰竭吗？真相是什么？医生辟谣

网友在公积金中心偶遇韦神，穿“鸳鸯鞋”打扮朴素，疑似生活拮据

肖战：“动听的力量·云上音乐节”正式启动

小天说历史|刘禅做了两件事，一件比一件高明，为何最终却成庸主，诸葛亮死后

娱乐老隋|老公比她小了12岁，韩国最美欧文球迷！多年健身堪称“冻龄女神”

朵儿的占星世界：四月底爱在心中，主动求和，再续爱情的人，守一段情念一个人

你知道什么是ERP吗 erp系统是什么意思啊

前男/女友突然干上了代购/微商是一种咋样的体验?

浅爷说育儿|网友笑翻：孩子都是意外，父母才是真爱，一家四口午睡的照片火了

「」Android 11加入新功能：长期不用的APP自动关闭敏感权限

什么工作(21岁学什么技术好一点)

米粒|蓬香松软营养美味，怎么吃都不腻大米饭不一样的吃法

怀疑自己有精神疾病

嘉人|复古回潮，还以为宽檐帽是Ugly Hat嘛？

科技俱乐部菌买5G的有必要吗？答案其实很简单，现在买手机买4G的还是买5G的

电子秤金额显示lb是什么意思 lb是什么意思

教育局|市教育局紧急通知：师生禁止外出，中小学寒假提前，家长表示担忧

相约2020网安周｜朋友，国家网络安全宣传周特别节目了解一下？

黄昏恋是多大年纪黄昏恋是多大年龄