近日,腾讯自主研发的多模态四足机器人“机器狗 Max”再度得到升级,使其动作、行为都更加接近真实动物。腾讯方面表示,通过将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,让这次机器狗 Max的灵活性和自主决策能力得到大幅提升。


【资料图】

经纬创投合伙人王华东曾表示:“四足机器人凭借优越的灵活性、友好的人机交互能力,及同等地形下更低的成本,在企业应用及普通消费者场景均有良好的前景。”因此,一些初创公司和科技互联网企业都瞄准了这个赛道。

腾讯如何让机器狗更聪明

2021年,腾讯正式发布首个软硬件全自研多模态四足机器人机器狗Max,2022年,第二代四足机器人“Max”发布,这次的三代跟之前相比,关节自由度有了明显提升。

腾讯Robotics X机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识,并“举一反三”。

这一系列的学习分为三个阶段:

第一阶段通过游戏技术中常使用动作捕捉系统,研究员收集真狗的运动姿态数据,包括走、跑、跳、站立等动作,并利用这些数据,在仿真器中构建了一个模仿学习任务,再将这些数据中的信息抽象并压缩到深度神经网络模型中。这些模型能够非常准确地涵盖收集的动物运动姿态信息,且具有一定的可解释性。

腾讯Robotics X机器人实验室和腾讯游戏合作,用游戏技术提升了仿真引擎的准确和高效,同时游戏制作和研发过程中积累了多元的动捕素材。这些技术以及数据对基于物理仿真的智能体训练以及真实世界机器人策略部署起到了一定的辅助作用。

在模仿学习的过程中,神经网络模型仅接收机器狗本体感知信息作为输入,例如机器狗身上电机状态等。再下一步,模型引入周边环境的感知数据,例如可以通过其他传感器“看到“脚下的障碍物。

第二阶段,通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境。当机器狗适应了多种复杂的环境后,这些将灵动姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。

第三阶段,利用上述两个预训练阶段获取的神经网络,机器狗才有前提和机会来聚焦解决最上层的策略学习问题,最终具备端到端解决复杂的任务的能力。第三阶段附加的网络会获取与复杂任务有关的信息,例如在游戏中,获取对手的信息、旗子的信息。此外,通过综合分析所有信息,负责策略学习的神经网络会学习出针对任务的高阶策略,例如往哪个方向跑动,预判对手的行为来决定是否继续追逐等等。

上述每一阶段学习到的知识都可以扩充和调整,不需要重新学习,因此可以不断积累,持续学习。

机器狗向何处去

20世纪90年代后,美国和日本公司开始进行商业化足式机器人的尝试,如波士顿动力、本田、丰田、索尼等企业。美国波士顿动力学公司于2005年研发了动力平衡四足机器人Big Dog,作为阿富汗战场增兵计划的一部分。

进入21世纪,国内也开始钻研四足机器人,2015年到2020年,宇树科技、云深处科技、蔚蓝科技公司等相继成立,在各种科技展会甚至春晚都能见到机器狗的身影。随着软硬件技术的逐步成熟以及成本下降,四足机器人灵活性及性价比持续提升,普及度有所提高。

敦鸿资产合伙人俞文超表示:“机器人是 AI、算力、IoT、底层硬件等各种技术的集大成者,这一未来万亿级赛道的星辰大海才刚开启。四足机器人作为 ‘新物种’,除了 2B 应用外,有望成为最早在 C 端普及的机器人之一。”

我们熟悉的消费级四足机器人,更多地强调陪伴功能,如果能普及,未来将会看到大量“遛机器狗”的赛博场景。这种四足机器人的价格普遍在万元以上,目前仍是昂贵的电子玩具,受众往往是极客和高净值人群。

事实上,资本看好的是四足机器人背后服务、工程、安防、制造、养老等巨大的市场。以陪护方向为例,导盲机器狗可能成为未来面向C端的主要产品。据统计,我国约有1730万盲人,机器狗相较于传统导盲犬有更强的交互能力,能够与盲人群体更好地沟通。提前布局市场,才能在商业化浪潮来临之前站稳脚跟。

而商用的四足机器人同样面临成本制约,但胜在应用场景较为丰富。相较于轮履式机器人,四足机器人更为灵活敏捷,行动速度、越障能力更为出色;相较于人形机器人,其平衡能力更好,设计、生产、维护更为简单,多重优势使其成为了世界多个科技公司研发的热点。

除了部分场景,四足机器人的实际落地还面临一些困难。比如过于复杂的工业级别的应用,四足机器人尚无法应付;续航时间较短、充电时间过长,也是一大短板。云深处科技方面以电力巡检为例,认为传统机器人巡检方案的应用场景仍然有一定限制,例如不能实现全域检查,复杂环境仍需人工干预等。正如赛智伯乐合伙人袁智勇所言:“做一个能动的四足机器人是简单的,但是应用到环境恶劣的工业和行业场景中,需要极高的技术壁垒和行业积淀。”

2021年,国内四足机器人也涌入了科技互联网圈的竞争者。8月,小米发布了首款仿生四足机器人“CyberDog”;同年9月,小鹏则发布了全球首款可骑乘智能机器马。但是并没有解决太多痛点,更多的是在该赛道提前布局“占坑”。

波士顿咨询公司预计,2030年,全球机器人市场规模将达到1600亿至2600亿美元。而腾讯机器狗的最新迭代,已经将前沿的预训练AI模型和强化学习技术应用到机器人控制领域,为机械机器人向智能机器人加速转变添了一把火。

谈到四足机器人未来的发展,宇树科技创始合伙人陈立认为,大模型的快速迭代,对四足机器人的发展也有促进作用。“原来在四足机器人身上的语音交互比较简单,基本上是单句命令式的语音操控,没法做语言语音背后的一些识别和算法的优化。现在出了ChatGPT这样的产品,意味着我们可以通过大模型的赋能,跟四足机器人实时沟通,令其能更好更快地理解人类意图。这样的话,现在有大模型赋能之后(四足机器人)会更智能易用。”

责任编辑:

推荐内容