办公系统
个人会员
单位会员
首页 新闻中心 新闻资讯 正文

【2024 WRC】具身智能热度高 大模型助力机器人“脑力”升级

2024-09-14

走进2024世界机器人大会博览会的序厅,“人形机器人技术创新区”的简介大屏格外显眼:“人形机器人是‘人工智能+机器人’的产物,拥有聪慧的‘大脑’、敏捷的‘小脑’、灵活的‘肢体’,是通用人工智能的理想载体。”一段精炼的介绍,开启了观众走近人形机器人的大门。


(2024世界机器人大会博览会序厅)


作为近两年的产业风口及本届大会的一大看点,此次集中亮相的人形机器人不仅凭借着越来越像人的形态外观和行为能力受到观众们的热捧,也持续引发学界、产业界关于人形机器人和具身智能的深度探讨。

人工智能与机器人擦出了什么样的火花?大模型加持,对机器人脑力升级发挥了什么作用?近两年受到热议的具身智能又有哪些进展?如果拥有了具身智能,机器人还能为人们做些什么?具身智能机器人大概多久能真正走进人们的家庭,帮助人们做家务?未来的机器人形态一定会向着人形发展吗……这些问题在大会论坛及嘉宾采访中持续被问。

记者首先带着“何为具身智能?它与大模型、机器人是什么关系”的问题采访了业内人士。据科大讯飞硬件中心产品经理张吉洋介绍,大模型可以比作机器人的大脑,而具身智能则是一种智慧水平。值得一提的是,具身智能是大模型发展到一定阶段才能实现的高阶能力,它不仅仅是大脑,而是需要全身传感器、四肢一起配合大脑来实现。“目前全球的大模型发展水平,也只能让机器人有很初级的具身智能,就比如1-2岁儿童的具身智能水平。”


(科大讯飞具身智能机器人演示物品抓取。)


从现场来看,各家人形机器人在不同“场景”下的“特长展示”,都吸引了不少观众围观。比如,长距离行走巡馆,“听到”人的语音指令,精准地识别、抓握、放置物体,甚至自主完成叠衣服、写书法、递咖啡等任务。


(“天工”机器人在2024世界机器人大会巡馆引围观。)


记者了解到,简单来说,完成上述任务,机器人要听清、听懂指令,看见、分辨物体,并进行任务拆解和执行。这就需要机器人具备“五官”感知能力,“大脑”决策调动能力,以及“小脑”和“肢体”的协调配合。这些“特长展示”的背后,正是人工智能作用于机器人本体的生动实践,即通过大模型训练让机器人模仿人类、认识世界,尤其是多模态大模型让机器人理解不同维度的信息,从而训练掌握不同维度的技能。此外,如果要让机器人行动更自如,还需要通过小模型训练,分模块强化机器人的运动智能,最终实现机器人的“一脑多能”“一人多岗”。

“就像小孩学走路一样,我们在仿真环境下训练它,通过让它在不同地形上进行训练,让它训练中遇到足够多样的地形环境,当它日后在真实世界遇到类似的情况就知道如何应对了。”采访中,北京具身智能机器人创新中心资深工程师韩刚告诉记者,基于不同小模型的训练,让机器人分别学会走路、跳远、跑步等不同运动技能。在习得这些技能后,通过大模型也就是大脑层面对真实情况的感知、决策,就可以调用不同运动技能来应对,“相当于赋予机器人运动智能,可以理解为某种程度的具身智能。”

同样地,以汽车工厂场景为例,优必选首席品牌官谭旻向记者介绍,如今优必选的人形机器人已经从实验室走到了汽车工厂,我们通过建立车厂环境下的大模型以及针对不同岗位的小模型,把不同的数据模型结合在一起,变成全场智能大模型。”相当于为机器人建立了对汽车工厂环境下不同工种的认知,从而“胜任”不同环节的工作,包括车身检测、物料分拣、无人配送等。


(优必选人形机器人演示物料分拣。)


换句话说,不论是哪种场景、何种技能,不同于传统的机器人根据编程设置,在固定位置完成固定动作,被赋予了AI能力的机器人将能够“随机应变”。正如宇树科技创始人、CEO 王兴兴在接受采访时多次提到,“机器人最重要的(目标)是能干活。”从硬件到软件,从零部件性能的提升到AI算法的优化,从基于小模型进行垂域训练到通过大模型实现世界感知,让机器人逐渐像人一样与物理世界感知交互的路径日渐清晰。


(宇树科技人形机器人演示自如行走。)


记者在采访中了解到,智能化是机器人产业的大势所趋,也是一个长期发展的过程。当前,全国范围内多个人形机器人创新中心的建立,以及各细分赛道机器人企业的涌现,为构建机器人训练数据集、完善机器人产业链、扩大机器人应用场景提供了必要条件。可以预见,随着产业各方积极探索和实践,让机器人越来越聪明、越来越能干,更好地服务于人类,指日可待。

来源:央广网

返回列表页

加入会员

学会官微