首页
在现实世界中安全地学习运动技能
返回

在现实世界中安全地学习运动技能

2022-12-19 科技信息 By:佚名
最佳答案深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。该框架由两个政策组成。“安全恢复策略...

深度强化学习 (RL) 的最新进展能够解决机器人技术中复杂的高维问题。然而,有效地训练 RL 策略需要探索可能对机器人不安全的机器人状态和动作。因此,Google Research 最近的一篇论文介绍了一种 RL 框架,用于学习腿部运动,同时满足训练期间的安全约束。

该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。

只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。

猜你喜欢
d1005(关于d1005的介绍)

d1005(关于d1005的介绍)

10-25 0 阅读
新东阳肉松(关于新东阳肉松的基本详情介绍)

新东阳肉松(关于新东阳肉松的基本详情介绍)

04-23 0 阅读
hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

12-18 0 阅读
朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

12-18 0 阅读
公共汽车简笔画 彩色(公共汽车简笔画)

公共汽车简笔画 彩色(公共汽车简笔画)

12-18 0 阅读
笔记本无线上网软件(笔记本无线上网)

笔记本无线上网软件(笔记本无线上网)

12-18 0 阅读
热门推荐
d1005(关于d1005的介绍)

d1005(关于d1005的介绍)

10-25 0 阅读
新东阳肉松(关于新东阳肉松的基本详情介绍)

新东阳肉松(关于新东阳肉松的基本详情介绍)

04-23 0 阅读
hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

hd4000相当于什么显卡(hd4000显卡相当于独显什么水平)

12-18 0 阅读
朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

朱越是如何沦陷的?黑鸡和白暨豚是朱越生的还是造的?为什么是平治?

12-18 0 阅读
公共汽车简笔画 彩色(公共汽车简笔画)

公共汽车简笔画 彩色(公共汽车简笔画)

12-18 0 阅读
笔记本无线上网软件(笔记本无线上网)

笔记本无线上网软件(笔记本无线上网)

12-18 0 阅读
广东工程职业技术学院和广东工程技术职业学院

广东工程职业技术学院和广东工程技术职业学院

12-18 0 阅读
音乐鉴赏课论文1000字(音乐鉴赏课论文3000)

音乐鉴赏课论文1000字(音乐鉴赏课论文3000)

12-18 0 阅读
洛阳58同城(洛阳58)

洛阳58同城(洛阳58)

12-18 0 阅读
齐鲁晚报简介(齐鲁晚报品牌介绍)

齐鲁晚报简介(齐鲁晚报品牌介绍)

12-18 0 阅读