鹅厂机器狗登Nature子刊封面:动作敏捷如真狗,能玩定向越野

腾讯机器狗,登上了Nature子刊封面!

在它的控制下,机器狗的动作和真实世界中的狗越来越像了。

注意看,这里的两只机器狗玩起了“定向越野”,还是带追逐的那种。

游戏当中,两只机器狗分别要扮演追逐者和逃脱者,逃脱者需要在不被抓到的情况下到达指定位置。

一旦它到达了指定位置,两只机器狗就会交换身份,如此来回进行,直到有一只被抓住。

这个游戏的一个难点在于有最大速度限制,两只机器狗都不能单独依靠速度取胜,必须规划出一定策略。

甚至,还有更加困难的障碍赛,战斗更加激烈、场面更加精彩。

这场机器人越野大赛的背后,应用的正是这套全新的控制框架。

该框架采取了分层式策略,并运用生成式模型学习了动物的运动方式,训练数据来自一只拉布拉多犬。

这套方法让机器狗不再依赖物理模型或手工设计的奖励函数,并能像动物一样理解和适应更多的环境与任务。

像真的狗一样运动

这只机器狗名叫MAX,重量为14kg,每条腿上有3个行动器,可提供平均22N·m的持续扭矩,最大能达到30N·m。

MAX的一大亮点,就是实现了对真实世界中狗的模仿。

在室内环境中,MAX挣脱了研究者,然后就开始了自由跑动。

把MAX放到室外,它也能在草地上欢快地奔跑玩耍。

当遇到有障碍的复杂地形时,这种模仿就更加惟妙惟肖了。

向上,MAX可以敏捷飞快地爬上楼梯。

向下,它也能钻过障碍物,挡在它前面的横杆没有被碰到一点。

这一系列的动作背后,都是MAX的控制系统从一只拉布拉多的动作当中学习到的策略。

利用对真狗的模仿,MAX还能规划更高级的策略,完成更为复杂的任务,前面展示的追逐大战就是一个很好的例子。

值得一提的是,除了让两只机器狗相互竞技之外,研究人员也通过手柄控制加入到了这场战斗。

从画面中不难看出,真人控制模式下的机器狗(下图中1号),反而不如纯机器方案(2号)来得灵活。

最终的结果是,在开了挂(人类控制的机器狗最大限速更高)的情况下,人类仍然以0:2的比分彻底输给了机器。

除了能让机器狗灵活运动,该框架最大的优势就是通用性,可以针对不同的任务场景和机器人形态进行预训练和知识复用。

未来,团队还计划把该系统迁移至人形机器人和多智能体协作的场景。

所以,RoboticsX实验室的研究人员是如何打造出这套方案的呢?

加入生成式模型的分层框架

研究人员设计这套控制框架的核心思路,就是模仿真实动物的运动、感知和策略。

该框架通过构建可预训练、可重用和可扩展的原始级、环境级和策略级知识,使机器人能够像动物一样从更广泛的视角理解和适应环境与任务。

具体实现上,该框架也采用了分层式的控制方式,之中的三个层级——原始运动控制器(PMC)、环境适应控制器(EPMC)和策略控制器(SEPMC)——分别与原始级、环境级和策略级知识形成了对应。

首先,人类会发出一个高级的指令(比如告诉机器竞速追逐游戏的规则和目标),这也是(运行过程)全程唯一需要人参与的地方。

这个高级指令会被SEPMC接收,并根据当前情况(如机器人角色、对手位置等)制定策略,然后生成包括移动方向、速度等信息的导航命令。

导航命令接下来会传给EPMC,然后结合环境感知信息(如地形高度图、深度信息等),选择适当的运动模式,形成一个类别分布,同时选择合适的离散潜在表示。

最后,PMC又把这种潜在表示与机器人当前的状态(如关节位置、速度等)结合,得到电机控制信号,并最终交付执行。

训练的顺序则刚好与之相反——从PMC开始,到SEPMC结束。

第一阶段PMC的训练,也就是原始级训练,是为了建立基础的运动能力。

该阶段的训练数据来自对一只训练有素的中型拉布拉多犬的运动捕捉。

通过指导狗狗完成各种动作,作者收集了大约半小时的不同步态(如行走、奔跑、跳跃、坐下等)的运动序列,以每秒120帧的频率采样。

狗狗在捕捉过程中遵循直线、方形、圆形等不同的路径轨迹。此外,作者还专门收集了约9分钟的上下楼梯的运动数据。

为了弥合动物和机器人的骨骼结构差异,作者使用逆运动学方法将狗狗的关节运动数据重定向到机器人关节。

通过进一步的人工调整,最终得到了与四足机器人兼容的参考运动数据。

基于这些数据,作者使用了生成式模型VQ-VAE编码器来压缩和表示动物的运动模式,构建了PMC的离散潜在空间。

通过向量量化技术,这些连续的潜在表示离散化为预定义的离散嵌入向量,解码器则基于选定的离散嵌入和当前机器人状态生成具体的运动控制信号。

在VQ-VAE的基础上,PMC的训练目标,是最小化生成的运动轨迹与参考轨迹之间的偏差。

同时,作者引入了优先级采样机制,根据不同运动模式的难易程度动态调整其在训练中的权重,确保网络对所有参考数据都能很好地拟合。

通过不断迭代和优化,PMC逐步学习到一组能够有效表达复杂动物运动的离散表征,直至收敛。

PMC阶段的结果,为EPMC生成更高级别的运动控制信息提供了基础。

EPMC在PMC的基础上引入了环境感知模块,接收来自视觉、雷达等传感器的信息,使得策略网络能够根据当前环境状态动态调整运动模式。

EPMC的核心是一个概率生成网络,根据当前的感知信息和指令信号,在PMC提供的离散潜在空间上生成一个概率分布。

这个分布决定了应该激活哪些原始运动模式,以最好地适应当前环境和任务。

EPMC的训练,通过最小化环境适应和任务完成的损失函数来实现,逐步学习优化运动策略,提高机器人的适应能力和鲁棒性。

最后的SEPMC训练阶段进一步提升了机器人的认知和规划能力,使其能够在多智能体交互环境中制定和执行高层策略。

SEPMC在EPMC的基础上,根据当前的游戏状态(如自身和对手位置等)和历史交互记录,生成高层的策略决策(如追逐、躲避)。

MAX机器人玩的追逐式定向越野游戏,也正是SEPMC的训练方式。

在该阶段,作者采用了先进的多智能体强化学习算法PFSP,通过自我博弈不断提升机器人的策略水平。

训练过程中,当前策略不断与历史上的强对手进行对抗,迫使其学习更加鲁棒和高效的策略。

得益于前两个阶段打下的坚实基础,这种复杂策略的学习是非常高效的,即使在稀疏奖励的情况下也能快速收敛。

值得一提的是,这样的多智能体方案当中,还可以引入一些模拟人类的智能体,从而实现机器间或人机间的协作配合。

以上的训练过程都是在仿真环境中完成,然后以零样本迁移到真实环境。

在仿真中,物理参数可以自由控制,作者随机化了大量物理参数(包括负载、地形变化等),通过强化学习得到的策略必须能够应对这些变化,得到稳定和通用的控制能力。

另外,作者在控制框架中的每一层都使用了LSTM,使得各个层级都具备一定的时序记忆和规划能力。

传感器方面,目前作者主要验证了使用MotionCapture系统,或仅基于DepthCamera的视觉感知可以完成一系列复杂的任务。

为了处理更加开放和复杂的环境,作者未来将进一步整合LiDAR、Audio等感知输入,进行多模态理解,更好的应对环境。

THE END
1.蔚蓝科技阿尔法机器狗WEILAN官方网站南京蔚蓝智能科技有限公司创立于2019年,由一群希望致力于为社会带来卓越的人工智能和机器人科技创新的工程师一手打造,他们希望通过科技创新来让我们的世界变得更加美好。 蔚蓝的工程师们综合考量了科技、人文、环境、经济以及社会五个维度,决定通过加速世界向可持续创造https://www.weilan.com/
2.快来看!世界人工智能大会上的机器狗显眼包除握手、蹲下起立等基本动作,踢不倒的双足机器狗、会空翻的工业用机器狗和会变表情的家庭宠物型机器狗都因各自的“绝活”备受瞩目。http://cn.chinadaily.com.cn/a/202407/10/WS668e0240a3107cd55d26aaec.html
3.AI机器狗工厂巡检AI机器狗工厂巡检 4月18日,在内蒙古北科交大机器人有限公司机器人集成车间内,一台四足机器狗正在日常巡检。这台机器狗可负载80公斤,时速达8公里,跃障高度2.5米,能克服地形、气候等恶劣环境,实现全方位识别、24小时独立作业,广泛应用于钢铁、铝业、煤炭、光电、风电、磁材等领域。据悉,该公司是内蒙古自治区唯一一家...http://m.northnews.cn/news/2023/0420/2201754.html
4.一款智能仿生机器狗,智商竟然如此的高!新闻 体育 汽车 房产 旅游 教育 时尚 科技 财经 娱乐 更多 无障碍 关怀版 登录 视频加载失败,可以 刷新 试试 00:00/00:00 推荐 已经到底了 一款智能仿生机器狗,智商竟然如此的高!数码恒星小北 发布于:吉林省 2024.09.11 22:31 分享到 热门视频 已经到底了 ...https://www.sohu.com/a/808190429_121753656
5.全球首家人工智能机器狗体验店这是7月份在德基广场开的全球首家人工智能机器狗体验店 这个狗堪称机器狗界的“变形金钢”,可以在"人”与狗之间来回切换 作为全球唯一一个走进家庭的陪伴型AI机器狗,BabyAlpha不仅是“问不倒的万事通”,随时随地满足孩子的好奇心,还是“双语交流好伙伴”,通过纯正的中英文对话创造自然的多语言学习环境;不仅是会...https://m.dianping.com/ugcdetail/272432588?sceneType=0&bizType=29&msource=baiduappugc
6.当真狗遇上机器狗:“够了,你比我还狗”#AI#人工智能#机器狗#...当真狗遇上机器狗:“够了,你比我还狗” #AI #人工智能 #机器狗 #机器人 #热门 凤凰科技 凤凰网科技频道官方抖音账号 热播推荐 日媒:中方同意拆除钓鱼岛附近浮标 普京签了:赴乌参战免债 乌军再以美制陆军战术导弹袭击俄多地 俄副外长:美国图谋利用台湾挑起亚洲危机 菲律宾当局:严肃核实副总统刺杀总统威胁 特...https://v.ifeng.com/c/8ehK40FoMWV
7.柯达Koda推出可感知人类情感的AI宠物机器狗这款AI宠物机器狗配备了...柯达Koda推出可感知人类情感的AI宠物机器狗 这款AI 宠物机器狗配备了 3D 深度感知摄像头以及充当其“眼睛”的前置 13MP 高画质摄像头,能够随着时间推移不断学习和适应与主人的互动,同时保证数据的安全。目前其售价介于 4.5~5.5 万美元(26~ 29万 RMB)之间。https://xueqiu.com/5447239990/171176691
1.2021年不寻常的人工智能家居产品你喜欢野生动物吗?然后,Bird Buddy Smart Bird Feeder 是一款您会非常兴奋的 AI 小工具。这个喂鸟器可以在有羽毛的访客到达时通知您。它甚至可以捕捉特写照片。最重要的是,智能应用程序可以识别拜访您的鸟类。 KODA AI机器狗 如果你不能拥有一只真正的狗,你可以选择 KODA AI 机器狗。它像真正的小狗一样与人互动...https://www.51cto.com/article/685202.html
2.华为宣布采用AI技术的机器狗导读:一. 机器狗的兴起随着人工智能技术的飞速发展,各行各业都纷纷开始将其应用到实际生活中。备受瞩目的华为公司宣布将推出一款采用AI技术的机器狗。这一消息引起了广泛的关注和讨论。二. 本文目录一览 1、华为AI音箱机身采用技术 2、华为AI音响机身采用技术 ...http://chatgpt.kuyin.cn/article/3702792.html
3.科大讯飞“AI四足机器狗”首次亮相,这才是“机器狗”的理想形态...AI四足机器狗作为科大讯飞超脑2030计划的重要组成部分,不仅给行业应用带来了新的启迪,更借助人工智能技术加快了演进历程,未来也会在越来越多应用场景下发挥重要的作用。相信科大讯飞也将发挥AI技术底层优势,以“机器狗”切入仿生机器人这片巨大的商业蓝海,成为机器人赛道不可小觑的新势力。https://maimai.cn/article/detail?fid=1756996472&efid=bNDM7kecnWj3EvGHYMgAMg
4....A2系列蔚蓝阿尔法机器狗人工智能机器狗AI机器狗BabyAlphaA2...WEILAN BabyAlpha A2 系列 蔚蓝阿尔法机器狗 人工智能机器狗 AI 机器狗 BabyAlpha A2 Plus 星光白图片、价格、品牌样样齐全!【京东正品行货,全国配送,心动不如行动,立即购买享受更多优惠哦!】https://item.jd.com/10101529952454.html
5.斯坦福大学Pupper机器狗,官方卖家带你8小时玩转它芒当科技机器狗亲自DIY一只来自斯坦福大学的人工智能AI机器狗,现在只需人民币4999元!自己担心组装有困难?斯坦福大学机器狗官方全球合作方Mangdang(芒砀科技 http://www.mangdang.net)带你一步步,全程视频直播,中文讲解,只要8小时就可以玩转它(组装5小时,软件安装1.5小时,校准0.5小时,玩0.5小时,答疑0.5+小时)!(参与方式见文末) ...https://blog.csdn.net/w990002/article/details/107916752
6.2025年AI写手教你:怎么描写机器狗——从科幻到现实的写作技巧...三、赋予机器狗个性:从程序到灵魂的跃迁 仅仅描写外观和行动还不够,你需要让你的机器狗活起来! 怎么描写机器狗的个性?这才是展现你写作功底的时候! 程序设定下的行为:机器狗是单纯执行指令的冰冷机器,还是拥有某种程度自主学习和判断能力?这会直接影响它的个性! https://www.shicehao.com/341d18da7890.html