新智元谷歌大脑提出并发RL算法，机器人也可以“边行动边思考”( 二 )

接下来，研究人员从连续时间强化学习的角度开始探索，因为它可以容易地表示出系统的并发特征。
之后研究证明，基于连续时间强化学习得出的结论同样适用于随后在所有实验中更为常用的离散环境。
实验表明：并发模型比阻塞模型提高49%
研究人员分别在仿真与机械手臂上进行了实验，它们的任务是抓取并移动垃圾箱中的各种物体。

本文插图

仿真手臂与机械手臂的实验

本文插图

表 1 通过对无条件模型与并发知识模型进行比较总结了阻塞和并发模式的性能。并发知识模型能够学习更快的轨迹，其周期持续时间与阻塞模型相比减少了 31.3% 。

本文插图

研究人员表示，「这些模型在抓取成功方面性能相当，但就策略持续时间（用来衡量策略总执行时间）而言，并发模型比阻塞模型快49％。而且，并发模型能够执行更流利的动作。」
合著者认为，「他们研究的方法可以促进机器人的发展，让机器人在真实环境中完成任务，如在多层仓库和履行中心之间运输材料。」
参考链接：
https://arxiv.org/pdf/2004.06089.pdf
https://sites.google.com/view/thinkingwhilemoving
【新智元谷歌大脑提出并发RL算法，机器人也可以“边行动边思考”】https://venturebeat.com/2020/04/15/googles-ai-enables-robots-to-make-decisions-on-the-fly/

新智元谷歌大脑提出并发RL算法，机器人也可以“边行动边思考”( 二 )

推荐阅读

名曲科技|OPPO Ace2强势助力PEL总决赛，网友：这波对决值得一看，原创

光明网|阿富汗的集体婚礼

速溶茶粉,速溶茶粉产品的发展前景分析

顺平县一男子焚烧杂物造成环境污染被拘留

全球|全球二次疫情：强传播弱致命，冲击分化

黑龙江省：早安！黑龙江：新增确诊病例0，新增疑似病例0，无新增境外输入确诊病例

熊宝贝说游戏|龙之谷2：城镇之间无缝衔接！冒险家打算一起组队吗？相约龙巢不见不散！

减肥食品市场乱象调查：非法添加违禁成分，网络销售自有话术

糖尿病偏爱这3类人，不想血糖飙升，劝你及时做好预防

【搜狐新闻】它真的不错，干它！盘它！

柳智敏|出道前被全网黑的柳智敏

华为|华为发布动态自适应扭矩系统余承东：全世界只有特斯拉和华为拥有

北京商报|在水泥森林中找寻希望的温度“写给明天的诗——城市艺见2020公益展”开展

【】这脑洞绝了！动画片还能这么拍？

『感应灯』甲醛挥发期长达10余年，不想家人生病，装修少用这两种材料

质押|金圆股份：金圆控股解除质押260万股及质押446万股

范蠡财经|德指，纳指，道指趋势分析，刘泽清：11.2早间恒指

小金方|解暑，养颜，拔毒，和胃，消肿，它是暑天的王牌

房屋他项权证和房产证有什么区别房地产他项权证

朱元璋的墓地到底在明孝陵的什么位置?康熙祭祀明孝陵