乒乓球运动可大大助推机器人学习研究?_中国科技资讯网

乒乓球运动可大大助推机器人学习研究?

在最近的一篇博文中表示，机器人学习现已应用到许多真实世界任务，但将其应用于需要紧密循环的动态、高速人机交互任务还并不常见。这方面的任务可体现在乒乓球训练上。

乒乓球任务有两个互补的属性，其不仅需要速度和精度(对算法要求高)，还是高度结构化的(环境固定、可预测)。

另外，执行乒乓球任务的机器人可与人和其他机器人分别对战，非常利于有关人机交互和强化学习方面的研究。因此，一些团队已经开发了乒乓球研究平台。

机器人团队同样搭建了一个类似平台，使其能够在多玩家、动态的环境中，研究机器人学习中出现的问题。

视频 | (来源：)

对于该方面的研究，通过两篇论文做了相关阐述，分别题为《i-Sim2Real：紧密人机交互循环中机器人策略的强化学习》()、《GoalsEye: 在一个物理机器人上学习高速精密乒乓球》()，且都已提交到 arXiv 上。

下面对的 i-Sim2Real 和 GoalsEye 两个项目分别做一简单介绍。

在 i-Sim2Real(i-S2R)项目中，机器人的目标本质上是有关合作的。即最大程度与人类玩家连续游戏。

由于在现实中通过人类训练机器人既费时又费力，采用了一种基于仿真(模拟现实)的方法。但该方法较难准确模拟人类行为，尤其是在需要与人类进行紧密、闭环交互的任务上。

因此，开发出一种学习人类行为模型，专门用于人-机器人交互。最终，在与人对战中，机器人能够连续击中乒乓球三百多次。

关于学习人类行为模型，其在官网表示，该问题似乎是一个悖论。若起初缺乏优良的机器人策略，便很难获得人机交互方面的优质数据。但人类行为模型的缺失，又会得不到机器人策略。

为解决这个问题，i-S2R 以一般的人类行为模型为起点，并在模拟和真实训练中不断迭代，人类行为模型和策略都逐渐得到了优化。

还通过不同的人类对手重复训练，来评估 i-S2R。并将它与通常的模拟到现实(S2R，sim-to-real)+微调(FT，fine-tuning)进行比较，发现 i-S2R 反弹长度比 S2R + FT 高约 9%。

i-S2R 和 S2R + FT 的反弹长度直方图显示，S2R + FT 的反弹大部分较短(即小于 5)，而 i-S2R 实现更长的反弹更频繁。

图 | i-S2R 结果摘要(来源：)

还在博文中表示，i-S2R 专注于模拟到真实学习，但有时需要仅使用真实世界的数据进行学习。在这种情况下，缩小模拟到真实的差距是不必要的。

研究人员还简单分析了模仿学习(Imitation learning，IL)和强化学习(Reinforcement Learning，RL)存在的问题。

其认为，IL 提供了一种简易、稳定的学习方法，但它需要获得演示，并且几乎不会超过被模仿者的表现。而在高速环境下，收集专业人员训练时的精确目标定位非常困难。

RL 虽然十分适合这种高速、高精度任务，但它面临着一个艰难的探索问题(特别是在一开始)，并且采样效率很低下。

所以，在另外一个 GoalsEye 项目上，结合行为克隆技术，来塑造精确定位策略。该方法起始于一个结构薄弱的、非目标的小型数据集。其主要考虑乒乓球任务的精度。

推荐内容

机械制造业简介　机械制造业在国民经济中的作用是什么？

2023-01-05
桑塔纳车怎么样？桑塔纳车多少钱简介

2022-12-27
中国十大望远镜品牌十大望远镜品牌汇总

2022-12-22
什么是智慧校园？智慧校园是什么意思？

2022-12-16
本田雅阁2021款报价本田雅阁2021款报价多少钱？

2022-12-12
索尼S39h硬件配置索尼S39h测评来了

2022-12-09
双WIPE是什么东西双WIPE是什么意思？

2022-12-08
美人鱼存在吗世界上真的有美人鱼吗？

2022-12-07
什么是DCIM?谁能准确定义DCIM？

2022-11-24
土豪金Arc A750显卡你见过吗？现在你要看见了！

2022-11-08
RTX 4080 16GB的备货情况比RTX 4090还要差！NVIDIA：要全力清30系显卡库存

2022-11-08
RTX 4080 16GB真实性能跑分揭晓：配套32GB DDR5内存

2022-11-08
小米13高清渲染图首曝！对标苹果iPhone 14？

2022-11-08
联发科天玑9200明天见：A16也被卷到

2022-11-08
可任意视角看全景视频的新专利来了申请公布号CN115297351A

2022-11-08
高通CEO：预计2024年，搭载骁龙芯片的Windows PC将在市场上迎来拐点

2022-11-08
已完成10亿元新融资小冰公司启动30万数字员工大升级

2022-11-08
如何让毫米波5G做到速度又快、信号又好?

2022-11-08
不是吧！AMD Zen4架构锐龙7000处理器大幅降价

2022-11-08
埃隆马斯克执掌的推特启动大规模裁员

2022-11-07
NVIDIA上个月正式开卖了RTX 4090显卡售价达到了12999元

2022-11-07
iOS 16.2和iPadOS 16.2迎来新的Beta测试版更新

2022-11-07
第五届中国国际进口博览会于11月5日-10日在上海举办

2022-11-07
经过多年高速发展之后智能手机行业今年遇到了严峻考验

2022-11-07
华硕发布RX 7900系列显卡：8pin接口

2022-11-04
苏妈不负众望这次带来了新旗舰卡RX 7900系列

2022-11-04
AMD新一代旗舰显卡RX 7000系列终于来了将于12月13日正式开售

2022-11-04
徕卡M6胶片相机复刻版上架：最贵套餐则要14.68万元

2022-11-04
玄铁C908 CPU发布：能效提升超20%

2022-11-04
百度地图：宣布正式登陆iPhone 14 Pro、iPhone 14 Pro Max灵动岛

2022-11-04
AMD将发布新意旗舰显卡RX 7000 你对它有什么期待吗?

2022-11-04
业内人士Ross Young爆料苹果iPhone SE 4规划了5.7和6.1英寸两种尺寸

2022-11-04
高通CEO安蒙：预计2024年搭载骁龙芯片的Windows PC将在市场上迎来拐点

2022-11-04
希腊的OGS团队居然刷新了两项显卡世界纪录

2022-11-04
Sapphire Rapids第四代可扩展至强一直拖延今天等待终于结束

2022-11-03
知情人士透露消息苹果目前已经暂停了几乎所有的招聘

2022-11-03
联想thinkplus口红电源100W氮化镓充电器发布

2022-11-03
腾讯科技(深圳)有限公司获批授权的"弹幕处理方法

2022-11-03
云存储服务商Backblaze发布了2022年三季度硬盘故障率报告

2022-11-03
遭遇并非孤例人工智能让从业者感到无比疲惫

2022-11-02
韩国成均馆大学生：高时空分辨率下活体直接成像实现

2022-11-02
每年数百万吨废弃塑料排放到海洋 2050年海洋中塑料的重量将和鱼一样多

2022-11-02
高端用户也玩得起的企业级SSD 100TB残酷写入测试！

2022-11-02
AMD已经官宣将在北京时间11月11日凌晨1点举办发布会

2022-11-02
Intel Arc A系列显卡的性能未能达到大家的预期官方支持优化聚焦在DX12游戏上

2022-11-02
TIM发布公告宣布即将停止软件的云文件服务

2022-11-02
集邦咨询最新研究新品Sapphire Rapids大规模量产时程推迟

2022-11-02
上市两周多时间以来 RTX 4090显卡已经出现了至少15起"自燃"烧毁案例

2022-11-02
不是吧！各平台直接把苹果最新发布的iPhone 14系列落下了水

2022-11-01
Q3国内手机市场数据出炉：第三季度智能手机销量同比下降12.4%

2022-11-01