拳击爆头(拳王被爆头)
AI 拳击可以有多好玩?
小红红,吃我一拳。
嘿,我挡。
前期先试探周旋几次,再找机会吧。
没错,就是这个空隙,爆头。
还想故技重施,我躲。
怎么样,AI 拳击动画效果是不是和真人比赛神相似?
基于 AI 深度强化学习的拳击选手身体不仅拥有超高自由度,而且它还掌握了格挡、后退、摆拳等拳击基本动作。
Facebook 人工智能研究部门(FAIR)在机器学习领域,总能带来一些意想不到的成果,上面的演示正是它们在《Control Strategies for Physically Simulated Characters Performing Two-player Competitive Sports》(模拟人物进行双人竞技运动的控制策略)一文中的部分演示片段。
论文地址:https://research.fb.com/wp-content/uploads/2021/06/Control-Strategies-for-Physically-Simulated-Characters-Performing-Two-player-Competitive-Sports.pdf
在这篇论文中,研究人员开发了一个学习框架,通过物理模拟角色学习基本技能、学习回合级别的策略、深度强化学习的步骤方法,来模拟人们学习竞技体育的训练路线。
同时,它们还开发了一个编码器-解码器结构的策略模型来让物理模拟角色进行训练学习,该结构包含一个自回归潜在变量和一个专家混合解码器。
为了展示框架的有效性,研究人员通过拳击和击剑两种运动,演示了物理模拟角色在框架学习到的控制策略,这些策略可以生成战术行为,并且让所有动作看起来更自然。
1
论文概述
在双人竞技运动中,运动员经常在比赛中展示出高效的战术动作,如拳击和击剑。但创建多人动画场景是一项巨大的挑战,因为它不仅要求每个人物模型都以自然的方式行事,而且还要求它们彼此之间的互动在时间和空间领域都是同步的,以显得自然。
相互作用的密度越大,问题就越具有挑战性,因为在相互作用之间没有时间“重置”。使用物理模拟角色简化了问题的一部分,因为低层次的物理互动(如碰撞)是通过模拟自动生成的。
然而,由于学习包含比赛的一系列技能,人们还没有对不同技能的协调进行深入研究,如刺拳、勾拳、等拳击级别的反击和压力战斗策略。
在竞技运动中使用模拟角色的一个关键挑战是,需要学习基本技能和拳击级别的策略,以便它们能够正确地协同工作。
在这篇论文中,FAIR 探讨了训练控制系统的技术,开发了一个框架,为角色之间的互动生成控制策略。其中的人形机器人拥有超高自由度,并由关节力矩驱动。
研究人员解释,他们的设计灵感源于现实世界。对于大多数运动来说,人们首先是在没有对手的情况下学习基本技能,然后通过与对手竞争来学习如何结合和完善这些技能。
基于此,FAIR 模仿这两个过程,通过深度强化学习,让物理模拟角色学习基本技能和学习比赛级别的策略。
2
多智能体强化学习
如上文所述,物理模型角色不仅在前期会训练学习基本技能,后期还会通过竞技的方式来深度学习,这里就涉及到了一个多智能体互相学习的问题。
FAIR 的框架采用一组运动数据,其中包括双人竞技运动的基本技能作为输入,并生成两个物理模拟选手的控制策略。控制策略允许玩家以正确的动作和时间执行一系列基本技能,从而赢得比赛。
具体来看,研究人员首先会收集了一些动作数据,包括在没有对手的情况下进行这项运动的基本技能。然后采用单智能体深度强化学习的方法对动作进行单一模仿策略的学习。
最后,将模仿策略转化为竞争策略,每个参与者通过带有竞争策略的多智能体深度强化学习来增强自己的策略。
为了有效地将模仿策略转换为竞争策略,FAIR 使用了一个由任务编码器(如下图绿色)和运动解码器(蓝色)组成的新策略模型,该任务编码器的输出以自回归的方式更新(灰色)。
即使如此,在多智能体环境中采用动作捕捉依然存在不少巨大的难题。当我们需要多个智能体之间密集和丰富的交互时,由于物理交互过程中的遮挡和微妙运动,精确捕捉尤其困难。
基于此,FAIR 设计一种框架,用于捕捉动作数据。首先用一个智能体进行动作捕获,并通过模拟和学习创建所需的竞争交互。
采用这种方法的动机来自于人们学习竞技运动的方式——新手玩家先模仿高手玩家的示范,学习基本技能,然后在与对手对战的过程中对所学的基本技能进行提炼和学习战术。
3
小结
在这篇论文中,FAIR 通过创建控制模型,使得两个物理模拟角色进行竞技运动。以拳击和击剑为例,尽管这种方法产生了竞争性的匹配,但这个方法仍然具有局限性。
首先,该系统需要相当数量的计算来生成可信的竞争模型。随着环境中涉及的变量增加,可能产生的交互也会以指数方式增加,因此所需的元组数量也以类似的方式增加。
为了使框架应用到更多运动中,如篮球或足球,更多的样本数据是必要的。这种计算复杂性可以通过学习算法(如基于模型的 RL 算法)的突破来解决,或者收集更多的数据来引导智能体之间的交互。
其次,FAIR 开发的框架中有一个假设前提,即运动的个人技能可以由单个智能体掌握,虽然该假设为角色在后期竞技中的学习做了一个铺垫,然而,在一些双人竞技运动中,这种假设并不成立。
例如,在摔跤中,一个玩家首先需要抓住另一个玩家的身体,并不断地利用接触来获得分数,而这其中并不包含特别的技能需要去学习。
最后,FAIR 的模型虽然能够生成相互竞争的两个动画角色,但动作表现的自然程度却取决于输入参考运动的质量。
例如,在拳击比赛中,专业运动员在比赛中表现出非常敏捷的动作,而模拟的运动员却移动得很慢。研究人员认为,造成这种差异的主要原因是实验中使用的输入动作来自一个训练非常有限的拳击手。
虽然 FAIR 的这项研究并非真正成熟,仍有不少局限性,但它发表的该篇论文具体描述了自动生成多个拥有高自由度的动画角色模型,以及让它们深度学习和相互竞技的过程,是一篇十分具有 AI 前沿性质的参考文献。
从长期来看,这个研究方向旨在提供了一种模拟的方式,让人类能够通过控制人工智能进行竞争/互动,在电脑游戏、商业电影和体育赛事中能开辟新的应用形式。
雷锋网雷锋网雷锋网
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。
相关阅读
- 普瓦里尔VS达菲轻量级对决再度敲定于UFC195
- 不败将军”VS“中亚狼王” 昆仑决笼斗之夜再现经典
- 吉林省将举办"我要上全运"太极拳项目选拔赛
- 《一个人的武林》参展伦敦电影节
- 文科考题紧贴社会热点
- 徐琰领衔出征中日搏击:佐藤更高更壮 我仍要KO他
- 闽南功夫电影《徒弟》开机
- 弗朗切公布下场比赛对手民调结果
- 电影《千龙爪》女汉子穿越回明朝变身女神捕
- 泰勒-索利曼赛后出拳统计
- 如何画会功夫的女孩(如何画会功夫的女孩简笔画)
- 阿布里尔点数击败塔特利卫冕
- 帕奎奥:我能让梅威瑟站定了激战
- 揭秘播求"出走"真相 泰拳"家长制"为何遭遇反抗
- 首届“八卦掌大家庭”迎春晚会隆重召开
- 泰国华裔青少年云南学武术
- 公安部:全国日均查醉驾136起 一律刑事立案
- 武僧一龙怒斥播求输不起,坦言自己只是武术爱好者
- 爱尔兰超新星康纳再出战 UFC178对阵普瓦里尔
- 湖南新增24个武术段位考点 全面启动武术进高校
- 安藤晃司第五次夺魁 吴昊天吃败仗
- 珍宝岛事件中的中苏“武术对决”!
- 第11届北京吴式太极拳推手大会
- 韦小宝会什么武功(韦小宝后面有武功吗)
- 2014年10大UFC新星 科里-安德森冲击轻重新人王
- 成龙新片《天将雄师》受多国片商热捧
- 军民携手 共庆“八一”------江桥镇消防中队与江桥精武基地“八一建军节”共庆活动
- 2015武林風駐馬店站拳王爭霸賽3月開戰 終極PK將上演
- “功夫小子”青奥会闭幕式将再飞翔
- 武术散打联赛试行职业化
猜您喜欢
- 来自俄罗斯的“武林高手”——波波夫
- 北少教学一区隆重举行演武大会
- 如何练就静坐硬功夫肌肉(怎样练静坐功)
- 阿鲁姆:帕奎奥想战库-马胜者
- 功夫上映时评价如何看(功夫刚上映差评)
- 外媒大赞甄子丹适演蝙蝠侠
- 功夫者如何保护自己的腰椎(功夫者如何保护自己的腰椎间盘)
- 首届武搏会组委会在京成立
- 图文:库托今天起开始备战比赛
- 2015国功联高峰论坛在京成功举行
- 功夫椰青味道如何(功夫椰子怎么打开)
- 功夫手游(功夫手游推荐)
- 赛事推荐|北京市青少年儿童武术成果展示网络大赛火热进行中
- 2分钟了解泰拳和散打有何区别?
- 博克斯计划打造唐山湾搏击中心
- 武当山公交车时间(到武当山的公交最早几点钟)
- 段位制推广交流大会今日举行
- 武侠电影《双手洪拳》14日全国上映
- 武术要承担起文化建设重任
- 独家揭秘“女高中生格斗士”李芮知艰辛追梦路
- 上海市闵行区梅陇镇开展太极推手系列技能培训
- 山东省淄博市博山区举行庆祝全民健身日武术展演活动
- 南太行国际武术节现场直击
- UFC195新增对阵瞩目 盖斯特鲁姆火速回归战诺克
- 北京铁昌太极道在“津门决”创佳绩
- 特鲁西埃被少林功夫征服
- 功夫熊猫导演(功夫熊猫导演和主要演员)
- 邵逸夫家中离世 享年107岁
- 皓都武功(皓都的武力值)
- 太极拳公开赛开发公益比赛的市场属性