首页
研究机器人足球中的强化学习和模拟到真实的框架
返回

研究机器人足球中的强化学习和模拟到真实的框架

2022-12-19 科技信息 By:佚名
最佳答案在“超小型足球”中,由三个机器人组成的两支球队相互争夺进球。通常针对每种情况对机器人的行为进行编程。强化学习可以用来提高机器人的能力;但是,由于硬件的退化以及能源和时间的消耗,现实世界中的培训是不切实际的。最近的一项研究提出了从模拟到真实训练的框架。在这种情况下,将对...

在“超小型足球”中,由三个机器人组成的两支球队相互争夺进球。通常针对每种情况对机器人的行为进行编程。强化学习可以用来提高机器人的能力;但是,由于硬件的退化以及能源和时间的消耗,现实世界中的培训是不切实际的。

最近的一项研究提出了从模拟到真实训练的框架。在这种情况下,将对机器人进行模拟训练,并将学习到的策略转移到现实世界中。结果表明,与人为设计的策略相比,此策略可导致更广泛的行为,但攻击速度较慢且精确度较低。2019年拉丁美洲机器人大赛评估了强化学习的有效性。在这里,这是第一次由强化学习训练的机器人团队赢得了由人为设计政策操作的团队的胜利。

本文介绍了一个名为VSSS-RL的开放框架,用于研究机器人足球中的强化学习(RL)和模拟到现实,重点是IEEE超小型足球(VSSS)联盟。我们提出了一个模拟环境,在该环境中,可以训练连续或离散控制策略来控制足球代理商的完整行为,并提供一种基于域自适应的模拟到真实的方法,以使所获得的策略适用于真实的机器人。我们的结果表明,受过训练的策略学会了各种各样的行为,而这些行为很难通过手工控制策略来实现。借助VSSS-RL,我们在2019年拉丁美洲机器人大赛(LARC)中击败了人为设计的政策,在21个团队中排名第四,是成功在此竞赛中成功应用强化学习(RL)的第一人。

猜你喜欢
d1005(关于d1005的介绍)

d1005(关于d1005的介绍)

10-25 0 阅读
新东阳肉松(关于新东阳肉松的基本详情介绍)

新东阳肉松(关于新东阳肉松的基本详情介绍)

04-23 0 阅读
hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

12-18 0 阅读
朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

12-18 0 阅读
公共汽车简笔画 彩色(公共汽车简笔画)

公共汽车简笔画 彩色(公共汽车简笔画)

12-18 0 阅读
笔记本无线上网软件(笔记本无线上网)

笔记本无线上网软件(笔记本无线上网)

12-18 0 阅读
热门推荐
d1005(关于d1005的介绍)

d1005(关于d1005的介绍)

10-25 0 阅读
新东阳肉松(关于新东阳肉松的基本详情介绍)

新东阳肉松(关于新东阳肉松的基本详情介绍)

04-23 0 阅读
hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

12-18 0 阅读
朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

12-18 0 阅读
公共汽车简笔画 彩色(公共汽车简笔画)

公共汽车简笔画 彩色(公共汽车简笔画)

12-18 0 阅读
笔记本无线上网软件(笔记本无线上网)

笔记本无线上网软件(笔记本无线上网)

12-18 0 阅读
广东工程职业技术学院和广东工程技术职业学院

广东工程职业技术学院和广东工程技术职业学院

12-18 0 阅读
音乐鉴赏课论文1000字(音乐鉴赏课论文3000)

音乐鉴赏课论文1000字(音乐鉴赏课论文3000)

12-18 0 阅读
洛阳58同城(洛阳58)

洛阳58同城(洛阳58)

12-18 0 阅读
齐鲁晚报简介(齐鲁晚报品牌介绍)

齐鲁晚报简介(齐鲁晚报品牌介绍)

12-18 0 阅读