新智元谷歌大脑提出并发RL算法,机器人也可以“边行动边思考”( 二 )
接下来 , 研究人员从连续时间强化学习的角度开始探索 , 因为它可以容易地表示出系统的并发特征 。
之后研究证明 , 基于连续时间强化学习得出的结论同样适用于随后在所有实验中更为常用的离散环境 。
实验表明:并发模型比阻塞模型提高49%
研究人员分别在仿真与机械手臂上进行了实验 , 它们的任务是抓取并移动垃圾箱中的各种物体 。
本文插图
仿真手臂与机械手臂的实验
本文插图
表 1 通过对无条件模型与并发知识模型进行比较总结了阻塞和并发模式的性能 。 并发知识模型能够学习更快的轨迹 , 其周期持续时间与阻塞模型相比减少了 31.3% 。
本文插图
研究人员表示 , 「这些模型在抓取成功方面性能相当 , 但就策略持续时间(用来衡量策略总执行时间)而言 , 并发模型比阻塞模型快49% 。 而且 , 并发模型能够执行更流利的动作 。 」
合著者认为 , 「他们研究的方法可以促进机器人的发展 , 让机器人在真实环境中完成任务 , 如在多层仓库和履行中心之间运输材料 。 」
参考链接:
https://arxiv.org/pdf/2004.06089.pdf
https://sites.google.com/view/thinkingwhilemoving
【新智元谷歌大脑提出并发RL算法,机器人也可以“边行动边思考”】https://venturebeat.com/2020/04/15/googles-ai-enables-robots-to-make-decisions-on-the-fly/
推荐阅读
- 投放OKKI 推出谷歌投放解决方案,小满科技助力B2B出海企业高效推广
- 新智元|B站上线!DeepMind加UCL强强联手推出深度学习与强化学习进阶课程(附视频)
- 新智元|人工智能领域很多引人注目的进展并不真实
- 新智元|机器学习团队常用工具总结,人生苦短,我用Python!
- 万物未解之谜|当大脑停止时,意识会不会消失?
- 生活大看点|谷歌微软苹果等科技公司纷纷发声:支持黑人维权!
- 新智元|Science | 人工智能领域很多引人注目的进展并不真实
- 神州|Space X与国际空间站对接;雷军:不参与商业航天业务;谷歌推迟发布Android 11|Do早报
- 牛科技|福利比薪资重要?微软员工:薪酬不如谷歌等同行,但福利令人满意
- AppSo|这可能是最强的笔记工具!拥有比 Wiki 还好用的双向链接,能复制你的大脑运作流程