通常用于训练狗狗的正强化法可帮助科学家教机器人学习新技巧据外媒报道

据外媒报道，世界上可能没有一家机器人师范学院在积极开展机器人学习。毕竟，这个领域掌握着开启行业大量潜力的钥匙。让它如此引人注目的事情之一是，如此多的研究人员正在采取无数不同的方法来解开帮助机器人本质上从头学习的秘密。约翰斯·霍普金斯大学的一篇新论文以 "好机器人 "为题，探讨了通过正强化学习的潜力。这个标题来源于作者Andrew Hundt关于教他的狗不要追逐松鼠的轶事。
文章插图
但这个想法的核心是，当机器人做对了事情时，要给它一些激励，而不是当它做错了事情时，要给它一些惩罚。对于机器人来说，激励措施以评分系统的形式出现--本质上是一种游戏化，根据正确执行任务的情况奖励若干积分。
这位博士生表示，这种方法能够大大缩短任务的训练时间。 “机器人希望得到更高的分数， ”Hundt在与研究相关的新闻稿中说。 “它很快就学会了正确的行为，以获得最好的奖励。事实上，过去机器人需要一个月的练习才能达到100%的准确性。我们能够在两天内完成。 ”
【通常用于训练狗狗的正强化法可帮助科学家教机器人学习新技巧】这些任务仍然是相当初级的，包括堆积积木和在视频游戏中导航，但人们希望未来的机器人能够努力完成更复杂和有用的现实世界任务。

通常用于训练狗狗的正强化法可帮助科学家教机器人学习新技巧

推荐阅读

小陌和你说历史▲为何6万余美军却打不过志愿军2个师?，上甘岭战役的真相:

GQ盛典来袭，近百位艺人参加，水上红毯或成看点？

爱豆APP|展现动技能百分百空手接物，王源暴露了他的隐藏身份

家里|家里养这6种球根花卉，开花好漂亮

基金|16亿未兑付！近2000投资人中招，中基协出手了！

|播放侵权动漫作品200余部 D站创始人被批捕

补钙食品补钙食品有哪些

3DM游戏网|《哈迪斯》销量已破100万大关正考虑移植其他平台

多少周检查胎位正不正

澎湃新闻|自然科学基金委：警惕不明人员或组织宣称提供“有偿帮助”

穿搭|搭配比年龄更加重要，40岁的女人这样穿，不仅优雅温柔还有气质

为什么读书(我们为什么要读书?)

猫姐品衣有道|学会就是赚到，日系风为什么这么火？秘诀就是“上松下松”技巧

人民网|[网连中国]乡音唱新风、定约除陋习，文明实践最后"一公里"通了

发霉的玉米能喂鸡吗有毒吗发霉的玉米能喂鸡吗

莫小葵|和他“亲吻”一次，就知道答案了，想知道男人爱你的程度

扬子晚报|儿子在上海，独居南京的母亲摔倒难起身，多亏了众邻居和民警

ACG次元饭|FGO：水武藏掉出节奏榜蓝卡顶级，评价不如四星，之前都白氪了？

斯科蒂·皮蓬|乔丹二儿子跟皮蓬前妻热恋：分享恩爱视频甜蜜拥吻一脸幸福

『开放』浙江自贸区油气全产业链开放获批支持适度开展成品油出口业务