办公系统
个人会员
单位会员
首页 新闻中心 新闻资讯 正文

【WRC大咖论道】对话—为人形机器人发展提供新“动力”

2024-11-22

2024世界机器人大会以“共育新质生产力 共享智能新未来”为主题,为期三天的主论坛和26场专题论坛上,416位国内外顶尖科学家、国际组织代表、院士和企业家聚焦前沿技术、产业动向和创新成果,深入研讨人工智能与机器人技术深度融合带来的新趋势、新机遇,共同打造了一场十分精彩的机器人领域前沿观点盛宴!

在8月24日下午的主论坛上展开了一场以“为人形机器人发展提供新动力”为主题的对话,对话由德国慕尼黑工业大学教授Alois C. Knoll主持,波士顿动力人工智能研究所执行主任,波士顿动力公司创始人Marc Raibert,北京具身智能机器人创新中心总经理熊友军,北京星动纪元科技有限公司创始人,清华大学交叉信息研究院助理教授陈建宇,宇树科技创始人、首席执行官兼首席技术官王兴兴,北京大学前沿计算研究中心助理教授、北大银河通用具身智能联合实验室主任王鹤参与对话。


数说2024世界机器人大会


论坛


26 家国际支持机构

3 大主题 26 场专题论坛

416 名国内外顶尖科学家、国际组织代表、院士和企业家

74 位国外嘉宾及港澳台嘉宾参会

线上线下听众达 160万 人次


展览


27 款人形机器人集中亮相

首发新品 60 余款

近 170 家参展企业 600 余件参展产品

参观人数近 25万 人次


大赛


全球 10 余个国家和地区的 7000 余支赛队

 13000 余名参赛选手

每天参赛人数 4000 余人



媒体关注


近 400 家国内外媒体

短视频平台话题播放量达 2.9亿


1732758463196676.jpg

对话—为人形机器人发展提供新“动力”


以下是对话内容实录 

Alois C. Knoll:欢迎各位,大家下午好!刚才我们听到了几位嘉宾非常精彩的演讲,我们现在已经有点推迟了,但是我们会花一点时间在接下来的对话上面,因为这是大家都非常期待的。

我作为主持人,希望做一个简短的介绍,在人形机器人方面已经有了很长的发展历史,为不太了解这段历史的观众做一下介绍。大家可能不知道人类创造的第一台机器人就是人形机器人,是1920年一位捷克的作家写了一部科幻剧,它在1921年进行了全球的首演,这是100多年前的事情了,这部科幻剧就是首次在英语和整个科幻小说界引入机器人Robot这个词,即便那个时候我们已经在思考机器人统治人类的一个想象,所以从最开始机器人就有着非常负面的意义,所以我们当年创作的第一部科幻剧当中,就说机器人会征服人类。

您可以在右边看到这是当时在舞台上演出时候使用的机器人,它实际上是1939年为世界博览会创造的机器人,叫做Electro,它能够行走,能通过语音指令来执行任务,能抽烟,能做其它有趣的事情,它能说大概700个单词,甚至它的眼睛通过光电的程序可以区分红光和绿光。此外Electro有一个机器狗叫做Sparkle,这是差不多80年前的事情了,所以太阳底下无新事。

这是我个人认为的一些重要的历史时间点,1973年实际上是微处理器发明之后不久,全尺寸人形机器人Robot1被创造出来了,它来自日本早稻田大学。后面我们又发布了Robot2,这款机器人可以阅读乐谱,并且弹奏电子键盘,它的头部有摄像头,已经具备5根手指的机械手了,这是在1980年,44年之前了。

然后我们进入了第二个时代,就是会行走的人形机器人,这里有很多实验室,有一家日本的公司,他在1984年就创造了能够行走的人形机器人,本田其实也做了一些机器人,他在2005年也做了第二个机器人的项目,很不幸的是本田把这个项目砍掉了,就像Marc刚才说的,你要是想挣大钱,特别是在那个时候,机器人这个赛道,尤其是人形机器人并不是你最佳的选择,但是在未来我们期待它会有变化的。

第一波的研究是从1980年到2005年,主要关注于行走。第二波大概1985年到2010年,除了步行之外还有全身的运动,在右边可以看到它当时在玩一个桌面游戏,另外这个机器人也是来自早稻田大学,也是差不多20年前的事情了。

自我来推介一下,2000年的时候我就开始来参加人形机器人方面的一系列会议,2000年的时候我们出现了HRPR核森,国际电气电子工程协会就创造了机器人和自动化协会,我当时就开始做参会。这些年我们不断发展,最近这期是2024年在法国会举办。如果大家感兴趣可以去我们网站查看,它可以看到最新的信息,大家可以借此探索一下人形机器人的历史。

刚才我们看到了各位嘉宾给大家看到的非常精彩的机器人视频,大家自有判断。但是像刚才王先生说的一样,现在已经进入新的时代,我们发展可能是指数级爆炸性的增长。这就是我作为主持人简单的介绍,现在进入讨论和问答环节。我想问一下讨论嘉宾,请每位嘉宾简短地向我和听众们介绍一下您和人形机器人的联系。为什么对机器人感兴趣,何时对机器人干兴趣。

我先来介绍,我一般是作为讨论嘉宾,但是今天担任主持人也给大家说一下。我来自慕尼黑工业大学,2001年开始就在计算机科学领域工作。我对于人形机器人一直都非常感兴趣,我认为它对智能具身来说非常重要。慕尼黑工业大学之前有一位先驱已经退休了,他和我当时就在研究具身智能。我们认为人形机器人最好发展就是以人形来设计机器人,它会和世界和自然建立紧密联系。机器人的身体应该和人的身体有同样的设计和科学,否则机器人要发展很困难。所以大家可以看到这里有一系列机器人图片,左下角是可以在手里滚球。

下面到marc这边,能不能再多分享一下。刚才已经说到您和人形机器人联系,从何时您开始对人形机器人感兴趣?


Marc Raibert:我认为您刚才展示的图片,对我这个问题的回答非常有帮助。如果说人形就意味着直立行走,两臂两腿还有头,那我直到最近才开始感兴趣。因为我一直认为作为一个公司来说功能最重要。包括灵活性、感知、智能,形式和外观是次要的。另一方面对于人的精气神来说它的动能像生命一样像人一样。我一直是人形机器人的文思,虽然我们第一个做的只是向人形机器人渐进的过程,但是我认为核心就像做的蹦跳机器人一样。我们刚开始做也是这样的概念,它要像人一样,有时候还要有一个脑袋直立行走。

它不是只关于工程和科学,而是公众们对此非常感兴趣,特别热情。我们当时做的大狗没有像后来做的人形机器人那样获得公众如此热烈的反应。


Alois C. Knoll:非常感谢,下一位熊友军博士,您能不能分享一下您自己的观点。


熊友军:我读博士的时候2000年开始做人形机器人研发,那时候更多是做工业领域,特种领域的机器人,用在一些危险的环境里。因为那时候机器人技术还是非常非常不成熟,但是在很多特种领域,尤其是微型场景有很多是需要机器人完成工作,但是那时候机器智能很差。所以我们当时想的办法是将机器人智能和人的智能结合起来,所以做了些激情摇操作的事情。但是摇操作完成工作过程中,发现很多场景用工业机械手臂,用人式机械臂解决不了,尤其是有时候在特种场景环境比较狭小,比较复杂。轮式、履带式根本进不去,但是人式可以进去。

还有一种是需要很多工具去完成工作,当时用机械手臂或者其他机器人时也很难完成,所以当时我们就说如果那个时候有人形机器人,应该是很好的解决工具或者解决方案。但是当时也看到日本本田的P1、P2时代给我们提供了很多启发。所以那个时候我对人形机器人就非常感兴趣,后来毕业一直在这个领域做机器人相关工作。上海2012年我和周剑一起创建了现在的优必选。所以后面一直在做人形机器人和机器人研发工作。

去年从深圳到北京筹建北京具身智能机器人创新中心,现在也是一直在聚焦人形机器人方面的研发,主要想法是希望能够解决人形机器人方面共性的关键技术。比如说本体技术研发不足,实际上我们现在人形机器人本体在关键核心器件,传感器上有非常多要攻克的地方。

另外,在运动控制,实际上我们也做了非常多的运动控制技术研发。包括原来基于MPC或者WBC的model based的运动控制研发转向,采用深度学习强化学习的运动控制方式。现在也用神经网络的一些方式去做运动控制,同时现在还在做关于智能方面的研发。比如说用具深智能的方式,刚才讲了我们要建具身智能一些基础的工作。比如说建数据集研发具身智能模型框架等等,这就是我现在做的事情。


Alois C. Knoll:非常感谢,我们之后再展开这个话题。下一位有请陈建宇博士,您为什么对人形机器人产生了兴趣?


陈建宇:其实兴趣是很小的时候一直对机器人或者智能机器人感兴趣。刚才兴兴说他是10岁的时候,我估计也是差不多类似的时候。当时关注的是阿西莫系列机器人,我当时就非常着迷。创业的事情其实充满了挑战性,像marc创办了波士顿动力做了四十多年,我是非常尊敬的。你没有一个发自内心的天生热爱的话,很难坚持下来。所以对我来说,对机器人的热爱某种程度上是从小就有。真正开始做是本科的时候,当时在学校里真正意义上接触机器人研究,当时接触了双足机器人,主要做步态规划相关研究。

博士阶段继续做机器人,虽然不是人形机器人,但是也是相关机器人领域控制、学习包括无人车和机械臂。真正全力做人形机器人是在回国之后,在清华这边遇到一个project真实投入去做,后来也孵化了星动纪元公司。图上是最新一代的第六代机器人,展会也带来了实物,欢迎大家关注。


Alois C. Knoll:非常感谢下一位请王兴兴先生。


王兴兴:大家好,刚才提到我十岁时就看过Marc Raibert先生在MIT实验室做的双足还有单腿双足机器人,印象非常深。2009、2010年大一寒假做过小的人形机器人,当时做得不是特别满意。后来研究生期间做了Xdog这款机器人,差不多2013-2015、2016年。这款机器人采用了比较低成本的硬件,运动性能非常好,可以直接实现关节力控以及整机的力控。

后来刚才有提到,本身一开始我对人形机器人技术相对来说比较悲观,但是后来在2022年左右,整个机器人AI技术进步,再加上ChatGPT出来以后大家都看到了人形机器人和AI结合可能性,所以我们公司重新开始做高性能人形机器人。

其实说实在的我真正感兴趣的并不是人形机器人,而是新的智能体是什么形态。人形机器人只是目前大家比较公认的最有可能性的通用机器人和通用AI的结合体。但是这可能并不是唯一的,我真正希望的还是真正能诞生一个甚至比人更高级的智能体形态,可以大大推动整个人类工业变革,推动新的工业革命,谢谢大家。


Alois C. Knoll:非常感谢,下一位嘉宾是王鹤。


王鹤:大家好,我是北京大学计算机学院助理教授,也是北大银河通用具身智能联合实验室的主任王鹤。我和人形机器人和具身智能结缘主要是从我在斯坦福大学读博的时候。2016年当时深度学习技术已经出来了,也应用在了很多图像识别、分类这些任务当中。当时作为前沿研究,我们试图理解人类是如何把感知、思考、交互的能力融合在一起。

所以,博士期间第一个工作当时用一个视觉模型来看桌面上人的动作和物体的运动。推理人下一步想要什么,这是一个语言模型。最后再用简单的机器人,智能的马克杯去响应人的动作。这个工作,获得了欧洲图形学最佳论文提名,但是我们认为它非常不足。一个马克杯只能在桌面上移动,响应人的动作,它没有和人交互的能力。

我们的视觉只能看有限的几种物体,语言模型只能根据人和这些桌面东西的一些动作来做简单的推理。通过过去八年的研究,怎么样把机器人操作能力搞得更泛化,什么东西都能抓,都能够放置,还有和现在的多模态大模型技术结合,真的明白人类想让你干什么,言出法随地执行。所以去年我们就孵化了北京银河通用这家人形机器人公司。现在也是把视觉、语言、动作三种不同的模态融合到大模型当中,真正赋能人形机器人,这是我们的愿景,让人形机器人能够走进千行百业,千家万户。


Alois C. Knoll:非常感谢,我想给大家一点点引导。我们只有35分钟了,大家要注意时间,我们先从Marc开始,请各位两分钟内回答各自的问题,您认为我们今天拥有的哪些重要技术是十年前没有的,但是对于实用化人形机器人来说是至关重要的吗,未来5年,你觉得它将会如何发展?时间限制在两分钟内。


Marc Raibert:我认为硬件的发展会继续有重要性,未来5年毫无疑问。它的基础模型和其它AI可以将语义理解的障碍移除,这是有最大影响的因素,人类可以做的事情就是通用化,并且明白他们看的东西的意义,我认为这是AI还不能做的。如果AI真的能做到这一点,那影响很大。

另外现在大家都有长足的进步,在过去的十年,计算机、传感器、感知、电池和控制,很多时候人们会忘记电池,尤其在工业方面,你不要忘记它的重要性,以及电机,在过去的5年我认为电机的发展非常巨大,我们会看到更多这方面的发展,包括电车以及消费电子这方面。


陈建宇:如果按照十年前的话,其实是2014年左右,当时是DeepLearning刚刚出来不久,它其实解决了一部分图像处理问题。后面我认为有两个重要的里程碑:

一个是以2016年AlphaGo为代表的深度强化学习,不是强化学习,强化学习有非常长的历史了,深度学习出来之后,紧接着把它用在了强化学习上面,做深度强化学习。

第二个以ChatGPT为代表的大语言模型。

这两个我认为是过去十年没有的,但是又对未来人形机器人或者具身智能的发展起非常大的决定性作用。

在接下来的这几年时间,这两项技术会非常深度的跟人形机器人、具身智能去融合起来,但它们也分别需要经过一定程度的skill,我们的强化学习也需要去skill到能训练比较通用的模型,我们的大语言模型为代表的foundation model也需要去skill到能够解决更加丰富的物理世界的数据。

我相信在接下来的5年,这几项技术都能取得非常大的进展,我们可能会在5年内迎来机器人的ChatGPT时刻。


王兴兴:最大的还是AI技术带来的大家对AI能做的事情有更多信心了,除了AI技术本身,最大的点对于人形机器人包括对AI,整个社会共识的增加也是非常关键的,目前大家更加相信AI,更加相信人形机器人可以诞生更多的价值,这在十年前是完全不能想象的,当时整个社会对这个都基本上完全没有信心。

另外一点,我觉得在未来5年,总体上AI模型的变化会非常快,因为目前的AI真的是日新月异,大家可以用AI底层技术去搭建各种自己的模型,去做训练,整个已经变成了非常的扁平化以及容易操作的过程,其实大家都可以参与进来,去做机器人模型并且去做训练,所以我觉得未来5年,这块各种AI模型的创新,包括更新的一些神经网络模型都有很大的机会。


王鹤:2014年(10年前)那个时候人形机器人甚至不是一个在西方的学术界比较受欢迎的词汇,过去的十年我觉得一大技术的进展就是我们在具身智能里头已经有一些技能实现了非常强的泛化性。

以我个人的研究举例,在抓取的问题上,我们取得了比较长足的进步,我们从智能抓方块,圆的这些特定形状的物体,到基于三维视觉传感器,我们可以抓不透明、不反光,也就是在深度传感器里头能完美成像的这些物体,到我们最近的技术能够预测透明、高反光、金属吸光这些非常有挑战材质的物体的深度,基于它去做泛化的抓取。

我们现在已经能把抓取这件事情做的相当好了,在今天的展厅我们都接受观众给我们的各种形状、各种材质,随便堆叠乱七八糟的物体,我们的机器人展示了非常泛化和高成功率的抓取能力。

现在的问题是像这样的每一个技能,大家都在分别去做开发,很多人会提问,你能帮我抓这个水瓶,你能不能帮我把瓶盖拧开,我非常不好意思的说,现在泛化的开瓶盖技能,我们还没有训练出来,这就是大模型能够带给我们的机会。

语言大模型里的涌现,它能够在只见一次或者是0次演示的情况下,它都理解你要生成什么样的文字,我们相信未来的5年给我们的机会就是发展机器人的基础大模型,能够实现涌现能力,它吞吐了足够大量的数据以后,以灵巧手为例,它能够抓,能够夹,能够拧、掰,各种基本的手的各种运动能力都有了以后,它能涌现,我们给它看一个视频,它就能理解这个活怎么干,到那个时候我们真正的就有一个通用的至少做操作任务的机器人了,这是我认为未来5年的一个机会。


熊友军:我觉得这一轮技术的进步主要是由AI来驱动的,毫无疑问。

AI驱动体现在各方面:

第一,人机交互的性能得到极大的提升。我记得十年前我们做人工智能、做机械手的那些交互,如果说我要加语音、加视觉,首先成本非常高,其次我们要做大量的研发工作,我们需要几个博士硕士带着一个团队,花很长的时间才能完成一些物体的识别、语音的合成、自然语言理解的工作,甚至包括导航。

但是现在随着技术的进步,我们现在做大模型,把指令给它,很快它就可以有比较好的行为输出,有很好意图的理解,有做任务的规划等等。我觉得这对人机交互、对用户的规划、对执行都有巨大的提升,在十年前这些很难去想象。

第二,硬件方面也有极大的提升。体现在两个方向,首先是关节性能的提升是非常快的,大家可以看到很多公司的机器人开始去做一些非常动态的剧烈的运动,实际上这离不开关节性能的提升、高的能量密度比、高的性能等技术的提升,实际上在十年前我觉得是很难去做到的,当然这也有运动控制能力的提升,当然也有电机的提升,现在其实要采用更多结构设计的方式,布局都有非常大的进步,包括转成惯量,把电机往上提等等,有各种各样结构设计技术的变化。

另外刚才还提到能量,十年前我们做机器人的时候,一个电池就像我们背后要背一个非常巨大的电池包、能源包,而且能够持续的时间很短,但是这几年随着新能源汽车对电池技术的推动作用,其实我们看到电池的能量密度大幅提升,现在一个比较小的电池可以支持比较长的时间,我觉得这是一个非常重大的技术突破。

未来5年之后这几个方向可能还是一个重大的要突破的方向,像刚才说的在人机交互方面我们希望大模型能给我们提供更长程的任务规划,做地图的理解等方面,我们人只要给它一个非常模糊的指令,它就可以给我们输出很自然的交互结果。

规划实时任务也是一个非常重大要攻克的方向,我们的环境会经常变,我们面对的是一个动态的环境,希望机器人能够根据环境的变化实时去改变它执行的策略,当然像能量这方面我觉得是持续要提升的,毕竟现在能量执行效率和我们人相比还是有非常大的差距。

我要说的就这么多,谢谢!


Alois C. Knoll:非常感谢,我刚才记了很多笔记,我也觉得很有趣,没有人提到网络这个词,哪一位想要就此再多说几句。刚才各位嘉宾也说到了像现在的人形机器人也得益于很多技术的融合,也可能有一天它也可以帮助这些技术获得快速的发展,如果我们现在业界有人形机器人得到大规模部署,可以反过来助推其它技术的发展。

我们看到机器人可以站,可以行走、可以跳跃等等,但是我不太确定它对大众是否有很多的用途,Marc做的机器人是工业机器人,用在厂房里面,所以如果想要人形机器人大规模部署,它们需要以高鲁棒性执行的任务是什么,这样才能被业界或者公众接受,或者大家愿意花钱去买这些人形机器人,请大家分享一下。


Marc Raibert:我其实不在乎这件事。


Alois C. Knoll:对的,Marc是个研究者,他是学者,他不在乎。


Marc Raibert:我觉得在梦想当中,其实就好像是爬喜马拉雅山、珠穆朗玛峰一样,这是个挑战,不断的会激励你前行,会让你努力做的更好,让机器人做的更好,对我来说就是爬喜马拉雅山,我就是这么想的。


Alois C. Knoll:那我们展望一下未来,您刚才说你如果想要靠机器人挣钱的话,实际上不会进入这个赛道了,但是其他人也需要在这个行业当中养家糊口,所以你觉得人形机器人要大规模部署,需要执行什么任务呢?


Marc Raibert:我认为要有长远的眼光,要得到真正的进步,我们应该暂停个人的一些梦想,而是让机器人整体变得更加可靠。比如说我们在加州有自动驾驶的汽车,它当时在事故当中造成了一个人死亡,它甚至可能都不是自家系统的问题,但是现在整个地区就禁止了自动驾驶汽车。

我觉得这种问题很容易发生在机器人身上,所以系统的可靠性是重中之重,我们不希望大家投入了大量资源和精力的这些项目,未来反而对人类造成更多的问题,我们希望它可以造福子孙后代,我的话就是我心里想要说的表达的意思,不理解什么叫做真正有用,但是我认为可靠性、安全性是非常重要的。


Alois C. Knoll:确实,我们在座其他也有一些业界的专家,看看其他两位中国嘉宾。


陈建宇:要做到大规模应用的话,有非常重要的两个事情。

第一,能不能找到大规模的需求。

第二,我们的技术能不能去满足这个需求。

要真正达到大规模应用,现在其实有很多零散的需求,一些表演等等,但如果你真的非常大规模的话,我觉得主要还是看劳动力非常密集的一些产业,非常大面的划分是三个阶段:工业、商用、服务,大体我认为技术也基本上是按照这样一个方向去成熟。

我的感受,我认为工业可能会比较快就能够用上,其实刚才Marc已经展现出来了,不管是人形还是轮式机器人在工厂搬运的这类环境里面,已经是达到了非常接近人类的节拍,在未来它可能会更快、更强大以及成本更低。达到这个时候的话,其实它的第一个大规模应用的点就到了。


王鹤:我觉得具身智能的今天自然不能讲完全成熟,但是我们今天有的能力搭配上人形,其实已经能够在很多场合干事情了,像我们今天在展台展示了一个零售的场景,用户可以下单,我们的机器人可以根据你具体下单的内容,是拿一个冰红茶还是拿一个巧克力,我们从货架把它取下来,同时我们也可以从地面的篮子里头把这些货不断的上到货架上,我们也可以从更大的仓储料架上抱着一箱东西放到传送带上。

这些场景其实都展示了目前具身智能对于比较糙的活就是抓取、放置和双手抱持,这样的能力已经走向成熟。在这种情况下,我们还要问一个问题,为什么是人形,有很多人现场问我,你们为什么要做成人形,如果货架上的一个商品掉在地上了,我的这个机器人得有能力去捡地面这么低的东西,我的货架可能两米到,我要能够抓到两米那么高的东西,同时我还得来回走动,还要得有两只手才能抱住一个箱子,又有两只手又能高又能低,又能够来回走,它基本上就把形态往人非常的靠拢了。我们目前用的是一个轮式底盘,没有腿,也已经达到这样的能力了。

我们认为像这样的抓取、放置、搬运的能力,在很多行业,比如说零售、工厂、服务的场景全都可以用起来,所以我判断人形的大规模应用,2025年、2026年将从百台级到千台级快速的增长。


王兴兴:我个人对目前整个人形机器应用落地总体还是需要一些时间,但是当下包括今年和明年对一些简单场景,像特斯拉场景里面把一个电池从什么地方装到什么地方里面,这种简单的用模仿学习能做的事情,目前的AI技术成功率做的比较高了,今年或者明年可以做一些应用,包括把整个的节拍速度提升。

但是我觉得真正要人形机器人大规模应用,确实还需要更多的时间把机器人的模型本身做的更好一点,让它更通用,无论更精细化或者更泛用性的事情都可以做起来。我还是希望社会大众对AI和机器人能更多些耐心,但是中国还有很多人比较心急,但是大家可以多给一点耐心,谢谢。


熊友军:我觉得人形机器人大规模应用,这个涉及到商业化场景选择问题,并不是说现在人形机器人不能应用,而是看什么场景。有一些刚需场景或者对人有伤害,对人不是很友好和不可达到的场景,还是有些可以用。尤其是刚性需求对人有伤害的场景。比如说抢险救灾,对于核辐射,有毒,有害的气体环境等等,这些是可用的。

大家更多想技术怎么提升,怎么让人形机器人快速适应更多场景,把成本快速降下来。只有这样一方面通过技术提升,让人形机器人有更多的工作效率,更好的体验感,更多人愿意用它。第二个把成本继续往下降,让大家更能买得起,我觉得这个是要想的方式。

另外还有商业模式的探索,人形机器人是集大成者,基本涵盖了激情和人工智能绝大部分技术领域。人形机器人上的研究可以大大推进技术成熟、技术市场化。可以采用沿途下蛋方式获得商业利润,通过人形机器人产品孵化的其他技术的商业化产业化来推动人形机器人的研究。

一个典型的例子,现在我们有些人形机器人公司已经在其他机器人产品实现了盈利,实现了很好的商业化,我觉得这是非常好的模式,谢谢。


Alois C. Knoll:非常感谢,您已经触及了下一个问题。就是作为技术专家,我们是否意识到在技术研发以外,人们对很多道德方面有所顾虑,比如Marc已经对此做出了回应。比如建立了一个部门或者一些小组如何管理,大家可以在这个问题上分享一下吗?


Marc Raibert:我认为最高级别的了解我们的技术如何发展以及风险、机会是重要的。各个国家的跨政府的探讨,如何更好治理AI,一个重要议题是聚焦在最不好的结局上。比如英国来的一位专家说大家特别害怕一些可能发生的恐怖事情,我们要防止最坏的结局发生。但是如果害怕坏事发生,不利用这些机会也很可惜。所以我认为要了解,并且做平衡。

我们写论文会说一开始就要列出所有做的研究的好结果,但是从来不谈有可能通过我们研究会出现不好的结果,我们必须在这方面解放思想,要两方面都顾及进行平衡。不想说人们因为特别害怕所以不敢抓住这个机会,这是我们很好的解决公众恐惧的方式。


陈建宇:人们对于人形机器人或者相应的具身智能或机器人技术担忧,其实核心来自于对自身安全性的担忧。这个安全有几个不同的层次,最底层的层次是物理安全,大家担心这个机器人会不会在工作的时候伤害到人,这是一个层次。

当然这个分情况,比如刚才说的在工厂里面,如果我们把它和人工作环境隔开,一定程度上能解决这个问题。同时,我们也需要从算法、硬件等等方面做得更鲁棒来优化这个问题。

第二个层次也是生存上的问题,但是不是物理层面。不是全人类的担忧,而是一部分人的担忧,他担心这个会替代某些工作。这个事情可能希望需要政府有些引导,我们尽量开始做劳动力非常紧缺的产业。比如恶劣的工业环境,或者养老等等。

第三个层次如果未来假如具身机器人真正拥有了意识,这个会对人类自我存在价值可能产生一些担忧。我觉得这是更远更大的topic。


王兴兴:我觉得人形机器人伦理道德和安全性问题是非常非常重要的事情。而且希望在场所有人大家共同维护这件事情。有点像现在新能源汽车以及无人驾驶,它其实还有很多安全性问题,比如早些年新能源汽车,比如有家汽车起火了,或者有家新能源汽车无人驾驶出了交通事故。这对整个行业包括媒体报道各个行业影响非常大,会降低普通老百姓对这个技术这个行业认可度以及信心,这个事情也很容易发生在人形机器人以及AI领域。所以我一直觉得当下及未来大家都应该在机器人安全性上,无论出台规章政策或者做更好的引导,或者需要全世界政府出台相关的政策共同健康地推动这个行业健康发展。


王鹤:我就补充一点,问题是as technology,所以我就从技术的角度出发。人形机器人面向终局的技术必然是大模型。其实只有大模型才可能实现非常高的通用性,把很多能力全部汇集在一起,把很多模态从视觉感知到语言理解、动作执行融会贯通。今天我们在技术上其实有方法对大模型的行为进行限制,就是对齐alignment。文模型里已经对alignment技术进行深入研究,未来会对vision language action model这样的联合模态模型进行更深入的对齐。让它不会伤害到人类,并且技能会被局限在服务的范畴里。这些是技术上能做的,技术之外必然需要政府、社会和国际的合作。


熊友军:我觉得前几位都说得很好,我就补充一点。应该由一些行业组织或者政府出来,更多地在法律法规、立法、全社会机器人使用包括道德方面的教育。因为我觉得任何一个机器人也是一种工具,放在不同人的手上可能会有不同的使用方法。

只有加强教育,提升人工智能对人形机器人的使用,让大家向着安全的角度考虑才是正确的方式,谢谢。


Alois C. Knoll:谢谢,您刚才提到机器人因为有人工智能可以学习,我们回看AI那代的机器人比如说交通事故还有自动驾驶汽车会有什么结果。会让AI以后就知道发生什么样的结果,但是现在这个技术还不能达到,以后有AI以后可能就会自己意识到会有什么样的后果,所以要避免,我们以后也要增加系统的可建设性。

其实还是想问一下大家,我们在工业发展和产业发展方面,回答这个问题不是技术而是行业。虽然可能有些人有自己的看法,或者认为自己对这个行业定位不一样。我们有很多人认为AI寒冬,但是您比较乐观对吧,可以分享一下行业观点吗?


Marc Raibert:我认为人形机器人的出现让问题又变得复杂了,工业使用已经有很大的进展了,现在还有很多担心,大家都说技术已经有了,可以让机器人越来越成熟,并且还会继续成熟。我认为这个产业会继续前行,人形机器人还没有完全成熟,至少可以看到一些人形机器人的展示。他们还和汽车公司合作,但是一定程度来说这更多是一种展示而不是行动,如果我们要做这种需要系统集成。

不是说重新为了机器人建一个工厂,很多机器人工厂仓库的提供者他们都有很多问题。因为要建这种工厂已经将很多资金用了,真正运行工厂和仓库的人他们不想改变传统的方式,希望机器人做的事情也可以让人去做,所以这个在行业应用里各种形式的机器人都有困难。

但是刚才也说了对于一些特定场景的使用,五年后人形机器人行业发展,有些特别令人印象深刻的例证,我认为以后还会有更成功的例证。我们做的一些实验,比如可以有他们自己的传感器,因为不知道人们想要什么样的传感器,所以找各种传感器制造商去做实验。现在我们对于用户如何使用机器人更加了解,所以开发者更加关注这写潜在机会,让那样以后有更多使用机会。


Alois C. Knoll:可能我们还需要更多具有企业家思维的人士在这方面探索,但是仍然在实验阶段。人形机器人可能还有更多想法,问一下中国的企业家,哪位嘉宾想回答一下五年之后会怎样?


王鹤:我对人形机器人的发展总体比较乐观。未来五年我们要完成真正的大规模应用,这件事情对于整个人形机器人仍然是先慢后快其中的慢的阶段。一个里程碑应该是什么?就是五年的时候我们能达到万台级别应用。这样的市场大约对标现在什么机器人的应用?就是商业清洁机器人,我们举个例子。

在超市万达广场写字楼一层,我们看来回洗地擦地的机器人。中国最领先的公司大约每年出货一万台,它做的事情很局限就是做这么简单的事情。但是能达到各种场景不管是商超还是写字楼,很多不同的场景进行清洁,当然是平面清洁,对于人形机器人来说希望做到立体操作,但是能力可能是局限的。

我就是搬运、上货、取货,没有更多的能力。但是我也要实现跨场景应用,不是可以在超市里、工厂里,可以在服务场景等等。能达到每年一万台市场规模的话,相信后面有真实世界数据回流,我们能看到人形机器人应用的规模会快速加快,从慢时代进入快时代。


Alois C. Knoll:非常感谢,您就企业家角度来说五年以后展望如何?


熊友军:我觉得我对于人形机器人的应用可能会更加乐观一点。大家看到这两年人形机器人进步非常非常快,尤其是AI驱动下。市场应用方面已经可以看到国内有些企业,包括全球企业已经开始在一些场景做试点应用。比如说汽车厂,比如一些商用服务场景已经开始做试点。我觉得这个试点就是启动一个数据非组织的效益,所以试点进展会有更多的迭代,会有更多的数据驱动,机器可能会在这个环境里,特定环境里它的效率、速度,随着量的增长价格也会大幅度降低。

这样我觉得会更快地促进产业应用,今年年底大家应该可以看到有一部分公司已经能够在新能源汽车厂,比如说在一些对人有伤害地方的应用。明年应该可以看到千台左右量的出货,我看到了很多有些公司实际现场测试情况来看的一些结果。


Alois C. Knoll:是的,我们说五年,你说一年就能做到。现在从商业的角度确实时间不太够了。


Marc Raibert:我想分享一下,马斯克因为他的资源和野心,他自己可能就有一万台机器人几年之内部署出来。不一定通过这个直接赚钱,但是就像他最开始对电动汽车的热衷。我其实对这个事情持批判性态度,所以从马斯克当年做这个事情的时候,大家都不相信,当时所有的汽车厂商还是在做油车。但是他说电车可能是未来的想法,当时是很疯狂的想法,人形机器人可能也是如此,我不知道马斯克对于机器人是不是有这么大的支持力度。但是确实我们知道model Y现在也是世界上最受欢迎的电车车型。


Alois C. Knoll:确实非常了不起,刚才的讨论很精彩,也看到了各位专家在这方面展现出来了热情。今天在座的有很多年轻人,想问一下各位嘉宾,您对于年轻人有什么建议?如果想要在年轻人心中点燃星星之火,让他们对人形机器人感兴趣,我们如何激发这些年轻人,能给出一些简单的建议吗?因为Marc是机器人领域非常资深的专家了,他先来吧。


Marc Raibert:我想刚才大家看到了人形机器人在跳舞,这其实并不是一个合适的方向。机器人越有趣,越能和人有更多的互动,越能激起人们的兴趣。我刚才也转过了展台,也跟其他的专家说到了,其实有一些机器人是很无聊的,他们总是保持云端的连接,跟人互动的可能性是有限的,如果我们能够把机器人做的非常有趣,那公众就会对它越感兴趣,越热衷。

我其实已经很感激了,对于我来说,受邀参加今年的机器人大会,最让人兴奋的一件事情就是见到了这么多同道,看到大家的一些事迹,而且很多人跟我说,我小的时候看过你的工作,你的机器人激发了我现在从事机器人,我也希望其他嘉宾未来也可以成为年轻人的引路明灯。


陈建宇:机会永远是留给有准备的人,像Marc做这件事情做了好几十年,包括台上几位也都是多年深耕在机器人或者相关的领域,人形机器人其实也是一个非常长周期的事情,同时它也包罗万象,从技术上、软件、硬件、AI,再到商业、到产品等等,其实各方面都有,所以说大家应该去问一问自己的内心,在这个范围内自己最有激情、最喜欢的、最热爱的是什么,然后从此刻开始就去积累它,等到未来总有时刻是你施展自己的机会。


王兴兴:我觉得对于所有年轻人,这个时代都是非常精彩的,机器人和AI都是阶梯性发展的,就像ChatGPT没有出来之前,大家觉得语言模型没什么用,非常差,但突然发生了僭越性的进步,非常好。

其实机器人AI也会遵循这种规律,大家现在可能看到机器人的AI都比较弱,但实际上这是好事,因为大家都有机会去做的更好,真正把人类目前可以预估的最伟大的技术就在当下,就在未来几年,所以这个事情大家都是非常值得去的。

而且机器人和AI另外一个比较适合年轻人的点是它没有那么多历史包袱,不像数学有几百上千年的(历史),要非常天才的数学家,你一定要比他们做的好才可以做,但是当下的AI和机器人都非常新,尤其是AI技术,就最近几年的东西,非常适合年轻人。

如果在未来5年到10年或者几十年回看我们现在这个时代,跟我们从现在这个时代看原始人其实都是差不多的感觉,想想这种感觉吧,真的非常激动人心。


王鹤:其实未来的15年在我心目中会是人形机器人从当下在产业中没有规模化应用,成长到跟今天汽车每年产量万亿市场的过程。在这个过程中,大家做好自己就可以了,因为15年之后,很多工作都是跟人形机器人相关的,今天可能你负责卖车,15年后你可能岗位就调到卖人形机器人,今天你是班级里头的佼佼者,你学AI,你可能发现你的职业生涯就是围绕着进一步提升人形机器人能力展开的,所以大家做好自己,我们一起共享光明的人形机器人的未来。


熊友军:其实我经历过智能手机时代、移动互联网时代,现在我们正在经历智能汽车的时代、电动汽车的时代,我觉得下一个时代实际上就是具身智能的时代,而具身智能时代的典型代表其实就是人形机器人。我给现在年轻人的建议是保持野心。


Alois C. Knoll:非常棒。Marc刚才其实已经说到了,他其实也曾经激励了在座的一些嘉宾,这些嘉宾也激励了在座的年轻人,我想问一下各位嘉宾,向对方有没有什么问题,我们还是有机会能够提出来,大家每个人有机会提一个问题,我相信大家私下已经交流了很多,但是Marc在台上,是不是几位中国的嘉宾可以借机问他一些问题。


陈建宇:好的,我来问Marc一个问题,您认为最重要的研究需要克服的问题是什么呢?说AI和机器人,选一个研究项目,您认为最重要的是哪个呢?


Marc Raibert:我来试图非直接的回答一下问题,我不是不想回答你的问题,我最后一个幻灯片没给大家看到,它实际上是一个视频,是机器人摔倒的视频,大概有两分钟时间。

在这两分钟时间,机器人有25种不同摔倒的方法,所以我想在研究的过程当中从失败当中汲取教训是最有趣,也是最有用的一些过程,大家要留意失败和错误,从中学习,不要再重蹈覆辙,这是最有趣的。不能说是一个研究主题,而是一种研究的精神,永不言败。

我没有看到目前为止大家就曾经失败的产品和研究做一个报告,但是我们也相信教会你们的机器人去后空翻等等,这中间应该犯过很多次错误,你享受这些错误吗?


Alois C. Knoll:我想说他是很喜欢的,我记得应该是1995年的时候,我当时看他第一个视频,我们第一个部分做的非常好,然后他会说在实践当中机器人是犯很多错误的,我给大家看了这些失败的视频。


Marc Raibert:是的,这个视频我反复拿出来放。


Alois C. Knoll:还有其他人想问Marc问题吗,或者可以回答其他人的问题。


王兴兴:Marc先生,很荣幸今天见到您,我好奇想问一下,您觉得对于人形机器人的手,您觉得未来几年比较合适的有几个手指或者几个电机是比较好的一个方向?


Marc Raibert:我还是要试图非直接的回答这个问题,我们之前在人工智能研究所召开了一个研究的主题,就是关于操控的一些问题,我想灵巧性是很重要的,但是目前我们的进展还不是很多,很多人在这方面有大量的研究,至少15年大家都在研究灵巧手。

但是我想大家可能会尝试不同的事情,就好像我今天最开始说到的一样,可能我们需要更多的一些动力控制,而不是静态的抓握。我想在整个学习的世界当中,要达到要求,获得相应的灵巧性已经很困难了,哪怕做很容易的任务也是不容易,但是我想这里有很多的需求。多少个手指,我觉得最多5根手指吧,但是我也不知道未来会怎样。

可能更有趣的重点就是我们的手心怎么样,其实我们的手心也有很多的用途,它不是一个静态的肌肉的总和,但是很多的机械手有很多的手指,但是它掌心、手心这个部分做的不是很好,这些手指必须是独立的运作。


王鹤:如果说人形机器人可以实现自动化,最后能够用什么样的科技可以实现这种通用的视觉和语言,能不能实现人形机器人的自动化呢?


Marc Raibert:这比较困难,也许最后可能会有这方面的发展,但是我认为我们知道的太多了,说实话人们太多关注学习了,有点过誉了。我们对学习应该有乐观的态度,但是现在我们看到学习的作用并不是很重要,在我们那里,今天我们做的学习很少,其实我们有做,我认为控制理论和方式以及我们过去30年的监视系统是更重要的。

我希望我们真的能够迎接学习,但是将它和我们现在已有的技术结合在一起,在未来5到10年也许会有不同的情况发生。


Alois C. Knoll:我也同意,为什么要用几百万个神经系统去学一个AIT的传感器,现在就可以做的事情了,要用那么大的成本去做简单的事情,我们有很多的理论、技术以及方法论,为什么我们要将传统这些成果扔入废纸篓,我们既要学习,也要使用过去传统的智慧,将它们结合在一起。


熊友军:我的问题是说Marc作为波士顿动力的创始人,您之前引导开发了像阿特拉斯这样非常令人惊奇的产品,但是前不久我们看到阿特拉斯应该是终止了研发,由原来的液压驱动转向纯电驱动的方式,这方面是处于什么样的考虑,是因为成本的考虑吗,因为我们知道阿特拉斯的制造工艺非常高,现在转向电动方式是出于成本的考虑还是处于商业化的考虑,同时我还想知道波士顿动力未来5年商业化的计划,谢谢!


Marc Raibert:为什么转变,有两个主要的元素,我喜欢液压,我们建的很多机器人都是用液压,包括建筑机器人、人形机器人还有更多的空间可以继续使用液压。

但我认为有两个情况,一个是它特别的大,特别的重,而我们想要做一些更高的性能,我希望它们完全没有流出来,比如说到工厂或者家里面,它们不能够滴油,这是一个问题,很难找到这方面的人才,因为人们认为这是比较老的技术,我们也做了很多的研发创新,在轴承器上面怎么用液压来实现。

我认为现在的电机变的足够功率强大,所以它有竞争之地了,虽然我现在还是董事会成员,并且是它的创始人,但他们现在有自己的计划,他们会自己去复盘,您可以去看公司的公开信息,非常感谢。


Alois C. Knoll:本来我们想问更多的问题,但是我们确实没有时间了,感谢参会者和专家,我认为这个环节非常的令人印象深刻,明年我们也会有同样的会议,希望我们可以邀请大家再来。

(本文根据录音整理)


返回列表页

加入会员

学会官微