2024-09-25
2024世界机器人大会以“共育新质生产力 共享智能新未来”为主题,为期三天的主论坛和26场专题论坛上,416位国内外顶尖科学家、国际组织代表、院士和企业家聚焦前沿技术、产业动向和创新成果,深入研讨人工智能与机器人技术深度融合带来的新趋势、新机遇,共同打造了一场十分精彩的机器人领域前沿观点盛宴!
在8月23日上午的主论坛上展开了一场以“机器人产业链的创新与突破”为主题的对话,对话由中关村智友研究院院长,北京航空航天大学机器人研究所名誉所长王田苗主持,浙江人形机器人创新中心首席科学家,浙江大学求是特聘教授熊蓉,中国科学院沈阳自动化研究所副所长刘连庆,UniX AI 具身智能机器人公司创始人、首席执行官杨丰瑜,帕西尼感知科技(深圳)有限公司创始人许晋诚参与对话。
数说2024世界机器人大会
论坛
26 家国际支持机构
3 大主题 26 场专题论坛
416 名国内外顶尖科学家、国际组织代表、院士和企业家
74 位国外嘉宾及港澳台嘉宾参会
线上线下听众达 160万 人次
展览
27 款人形机器人集中亮相
首发新品 60 余款
近 170 家参展企业 600 余件参展产品
参观人数近 25万 人次
大赛
全球 10 余个国家和地区的 7000 余支赛队
13000 余名参赛选手
每天参赛人数 4000 余人
媒体关注
近 400 家国内外媒体
短视频平台话题播放量达 2.9亿
对话——机器人产业链的创新与突破
以下是演讲内容实录
王田苗(主持):感谢大会组委会邀请我来参加这次对话,其实对我来说又是一次向年轻科学家、企业家学习的机会,今天这四位都是博士而且都是机器人这方面的博士,有年轻的科学家浙江大学的熊教授。有最年轻的也是机器人中国黄埔军校基地,我们的基地基本是杭大和沈阳自动化所,他是沈阳自动化所的副所长刘连庆。还有一位是杨总,他是耶鲁大学的博士,也是密西根大学的本科,自己还创办公司。
还有一位许总,是早稻田大学的博士,只要提到早稻田它是日本机器人的黄埔军校,其中1973年第一个人形机器人就是早稻田加藤一郎所发明和提出的,他也是创业。
难得有这个机会,先让四位分别介绍一下他们这段时间标志性的成果和未来自己的一些打算,每人大概2分钟左右。
熊蓉:我是来自浙江大学的熊蓉,2000年开始从事机器人方面的研究,主要关注的是机器人的智能化,智能移动和操作,2006年开始从事人形机器人方面的研究,包括乒乓球对打、室内外快速稳定行走,从去年开始在浙江省宁波市政府的支持下,建设浙江人形机器人创新中心有限公司,这次世界机器人大会上也带来了刚刚发布的新品领航者二号NAVIAI在A馆,展示了我们机器人整体的产品设计理念、人机交互、稳定控制和智能作业的能力。
后面还是要继续的把产品做深,进行场景的落地应用以及各方面能力的增强,谢谢!
王田苗(主持):她可能是在国际上第一个提出并且实现和他们浙江大学团队设计研发的打乒乓球的机器人。
刘连庆:我的导师是席宁教授和王越超教授,王田苗老师跟我两位导师是非常好的朋友,我在做博士期间包括毕业之后,很多工作都是得到了王老师的指导,所以说今天王老师做主持,看到王老师有点紧张,就像博士答辩的时候看见您一样。
我主要做微纳机器人和类生命机器人,微纳机器人一个是微纳操作,我最开始在博士期间跟着席老师一起做的,后来在所里做了一些微型机器人,就是机器人尺寸真的是在像头发一样,期望进入人体还没有进入人体。
最近更重要的一个工作我们叫做类生命机器人,今天看到了很多人形机器人,我们都希望这个机器人越来越像人类,但是真的要像人类不只是形要像,而是内部的结构比如说有血有肉,其实我们做的类生命机器人就是把活性的生命物质和机电系统在分子细胞尺度融合起来,真的希望做一个像科幻电影似的一半是肌肉体,一边是机械体,这样就把机械的速度和我们这些肌肉、人体生物亿万年进化最先进的结果和机电系统融合起来,从而希望未来造一个超人。
王田苗(主持):在中国谁要获得了杰青,证明他在这个领域是最顶级的年轻的科学家,所以他是杰青获得者而且在席宁老师的指导下,尤其在控制理论以及类生命体做出过突出的贡献,等会听听他的一些高见。
杨丰瑜:跟前面两位老师比我算是刚刚入行的新兵,我是UniX AI的创始人,在这之前我在耶鲁大学读计算机的博士,原来在学校里主要的研究方向是触觉传感,触觉在整个机器人当中其实扮演了非常重要的地位,要人完成一种精细操作,比如说把充电线插到手机孔里,视觉能告诉你一个大概的位置,但是很多精细的操作包括力的控制都是要使用触觉完成的。
我一开始是做计算机视觉做机器学习出身,后来转到了交叉学科多模态融合的具身感知,触觉最大的下游应用就是机器人,我也是一步步转到机器人这个里面做这个事,今年也是回国成立的UniX AI,我们主要是一家面向2C端场景的机器人,这次展会我们也是带来了轮式机器人和双足机器人,在B112的展位上,我们的轮式人形机器人已经可以完成包括像叠衣服、做汉堡完成一些长序列的洗衣服的场景。
我们整个公司的宗旨要让具身智能最终走进千家万户。
王田苗(主持):不知道大家通过他的介绍了解了没有,我是学到了。
第一,可能是世界上第一个提出多模态触觉大模型的作者,而且发表的论文影响力很高,回国创业了。
第二,如果要让机器人灵巧操作,与人形进行紧密装配,没有触觉是不可能完成灵巧操作的。其实这句话反过来听就是如果让机器人和物理实体进行接触性操作的时候,光有视觉是不够的。
下面直切主题,这几位都是机器人年轻的科学家,见证了机器人从70年到最近的20年的发展,其中最近这4、5年一个很重要的发展就是大模型,而且大模型通过数据的在线驱动,训练有的是监督,有的是强化,有的是模拟,让人想象的未来机器人只要有一个任务指令,然后通过大模型的映射就能完成规划,然后机器人进行行走操作。
基于这样一种冲动,人们就探索是不是将来对机器人有一个统一的通用的基础大模型,有人把它称为scale law或者是我们称为另外一种多层次的,先请许总自我介绍一下。
许晋诚:各位嘉宾大家好!不好意思晚了一点,我是帕西尼感知科技的CEO,我们主要做的是触觉传感器相关的核心零部件,对于我们而言目前视觉以及文本已经有大量的数据存在了,我们相信触觉传感器以及相关的数据会提供给机器人物理接触相关的信息,让我们的成功率大大提升,这是我们的职责。
王田苗:我做了一点工作,关于许总在深圳创立的公司,他是视觉传感器和模组目前在行业里出货量算是比较头部的企业,而且已经产品化了。
接着刚刚的问题,所以会出一个问题,如果通过算力,通过大量的数据包括数据生成能够设计出一个统一的机器人大模型,还是不可能,也就是说运动有运动的大模型,认知任务有认知大模型,感知有感知的大模型,这三个大模型是动态通过分层也好,Agent调用也好来实现机器人复杂的动作,我的问题是你们相信有统一大模型吗?还是没有?先让两位博士和企业家先说一下。
杨丰瑜:我是非常相信eventually有一个通用大模型,我们讲说scale law核心是scale,今天讨论这个具身智能,刚刚王老师提到了有感知、操作,local motion,甚至今天local motion和manipulation还没有完全合在一起做这个事情,我觉得当数据足够多的这么一天,我们是非常有希望训练出一个通用大模型。
客观上讲,今天距离通用大模型还有一段距离,分层大模型和通用大模型不是一个对立的关系,我觉得是一个时间上的先后的顺序。
王田苗(主持):这个之间不是矛盾的,这是大家认可的,大家主要焦点就是说它的模型是不同的,是由若干个专用小模型组成,只是在概念上有个统一,我们现在有时候很希望无限的数据、无限的运动控制的数据疏导的,让它能够形成统一大模型,你的意思是随着时间的推移应该有一个统一的,还是将来在一个机器人操作里有很多专业小模型,触觉就是触觉的,视觉就是视觉的,这个之间只是在动态的调换。
杨丰瑜:我是这么看这个事的,今天为什么没有一个通用大模型,我们讲说不同的任务,我自己是全世界第一个做触觉大模型的,因为每个模态、每个感知或者每个任务之间数据量不一样的。
我们在视觉和语言已经有非常多的通过自监督的方式,从大量的互联网上获取这个数据,其它的模态不是专家,但是在触觉这个里面,全世界最大的视触觉的数据集都是我做的,我可以讲说今天视觉和语言可能已经到了几十亿这么一个量级,但是触觉生态今天可能只有几千万甚至不到的数据采集的量级。
甚至运动层面上获得的轨迹分摊到每个人物上更少了,今天这个角度每个模块有一个大模型是对数据分布的最好的利用。
许晋诚:到底会不会有一个非常通用的大模型出现,本身它会跟我们人非常相似,人是怎么思考的,对我们而言有大量经验的积累,遇到一件未知的事情会观测推理出一些规则,我一直认为最近也有大量的人问我们,这个模型到底能不能通用,最近一两年还是会比较难,但是如果我们通过大量的规则的植入,人通常也都是学习大量的规则才会有规则的操作某些东西,所以我认为大量的规则植入之后让它慢慢学习这些逻辑应该是可以实现的。
王田苗(主持):再问两位科学家,科学的发展中有演绎法也有归纳法,归纳法都是case by case然后摸索出一个规律来。演绎法是指找到了一个基本的理论框架,不断的扩容我的算力,扩容我的模型参数。
我的问题两位科学家如果对于一个创业公司,您觉得让他们以专业模型case by case积累归纳法找到机器人的相对实用的模型方法好呢还是应该攻克一个相对体积比较完善的大模型,研究里面的机理的算法好?
焊接就先研究焊接,上下料就先研究上下料,我们所说的搬运就搬运,这两个里面所涉及的复杂程度是不一样的。你们两位是什么建议?
熊蓉:我觉得这两条路径其实都是可以做的,如果是在美国一个创业公司,我会觉得第二条路会是非常有前景的。
王田苗(主持):为什么呢?
熊蓉:在中国的投资要求下可能是会希望有一个好的技术,能够尽快的落地验证,这个时候就必须要从通用做专用,把你真正的场景做透了,这往往也会限制一个企业创新的发展。需要积累到一定的程度然后再来做。
王田苗(主持):我还以为你的潜台词是由于中国有举国体制,所以可以搭建一个模型获得很多的数据,这样的话中国可以从通用数据生成,训练入手,所以说能够找一个相对通用的机器人模型的平台。假如让你创业的话,你倾向于从专业入手还是通用入手?
熊蓉:我们一开始像在2016年创办迦智的时候,其实我是从通用入手的,我是想做一个通用的移动导航的控制器。但是在不断的跟用户的交流,投资界的交流,最终选择落地在制造业,真正把这个场景做好做透,然后在这个基础上再去进行场景的拓展,往往已经落在工业上了,这时候要进一步做,有的企业会落在服务场景上,这个时候再做通用,其实会发现在那个场景里也有同行在做,那你怎么竞争就会是一个问题。
现在我们浙江人形机器人创新中心这边属于还是打着通用的想法先去做,我们也会选择一些点做透,目前是有条件在政府和社会资本的共同支持下来走这条路的。
王田苗(主持):连庆所长你的建议是什么?因为人力和资源有限,打算从具身技能入手还是具身智能入手?具身智能还对通用一些。具身技能叫约定在一个范围内。
刘连庆:如果是我的话我会从具身技能入手,咱们叫语言大模型,现在简称大模型,最开始是语言大模型,基本上把全世界各种语言所有写的文章所有的文字全部训练了一遍,但是语言是有逻辑关系的这个token已经容易找,有了token有一定的规则,所以说是在一个维度上有一个逻辑的关系,但是如果我们做机器人的话,不只是有逻辑关系,还有空间的位置关系,还有交互关系,我们只是用这种逻辑关系大模型也经常出错,比如说大模型逆转诅咒,比如说我问一下熊老师是王老师的好朋友,如果告诉它了,再问大模型谁是王老师的好朋友,他不会说熊老师是,他会在基于他的模型库,会说席宁是,这是一个逆转诅咒,虽然说刚告诉它,它就不行。
还有前一段比较热的,就是问ChatGPT9.11和9.3谁大,他认为9.11大,就是这个token的泛化,所以说就是一个一维信息,token就如此复杂,如果做机器人的话我觉得这个token他们说要对齐直接用电机的电流直接做大模型数据的输入输出,我也一直在探讨,我说这个token怎么定义,所以说总的感觉我觉得现在机器人从技能型入手,未来有希望走到大模型时代,我也同意熊老师的意见,像Transformer,ChatGPT最开始从谷歌产生的,但是谷歌没赌,它觉得现在公司发展的挺好,有一个创新公司愿意赌,美国不知有多少公司赌输了,才出了这一家赌赢了的公司。
您是搞投资的,不知道中国的创业风投的环境允不允许这么高风险、高失败率、高投入的企业存在?
王田苗(主持):谢谢你的回答,我发现你既有科学家的思维也有应用实践的思维,你回答前我猜想你的回答是科学家应该搞通用大模型,企业应该搞专业大模型,也就是说科学家可以搞具身智能,企业应该先从具身技能入手,但是我发现你的回答更加辩证。
下面一个问题,这次世界机器人大会有27款人形机器人,可以说中国在供应链、创新人才上非常有优势,迭代速度也非常快,我的问题还是先问杨总和许总,人形机器人我们把这个尺度拉到这5年内,你觉得聚焦最重要的两个挑战的问题攻克了,这个人形机器人可能就会在物流、汽车、商超以及养老能得到应用,最最重要的两个问题无论是技术和工程问题。这样好让我们能在5年内看到这两个问题只要解决了,这27家里的层次就拉开了。
对我学习也好对大家也好好像有一个启示。先是杨总来说。
杨丰瑜:这两个问题我从算法和硬件各来讲一下。我觉得从算法这个层面上来讲,我是搞机器学习出身也信scale law,我们客观上来讲面临的问题是什么,我用一句话总结,所有和物理世界交互的数据都是匮乏的,这里面包括和物理世界交互的操作数据,也包括我跟许总做触觉传感,这个是和物理世界交互的感知数据。
我们要实现在机器人总结下来三个维度的泛化,分别是物体的泛化、场景的泛化和运动轨迹的泛化。谁能够突破这三个层次的泛化,从算法上来讲就是一件非常重要的非常巨大的突破。
第二步聊到专用通用这个问题,我觉得专用是通用的基础,每一个小的模型做好了之后才说任务上泛化是再下一个层次的事。
硬件层面上感触最深的就是末端执行器,前段时间马斯克也讲特斯拉会投入50%的精力投入到末端执行器上,包括我相信各位做人形的老师都深有体会,今天为止没有一款不管是灵巧手能够做到真正的通用,大家都是在根据自己不同的场景而做这件事,二制工业甲爪对一些比较复杂的铰链物体不是一个特别好的方式,包括我们前面讲到五指灵巧手,需要解决很多耐久性、成本上包括控制上的问题,我们自己做的三指甲爪,虽然做的很多工程化的思考,其实我觉得距离一款通用的末端执行器可能还有一段的路要走。
王田苗(主持):硬件灵巧手这句话让我理解也就是人形机器人如果灵巧手无论在它的安全、性能和成本上不攻克,人形机器人走不到应用,这是一个很强烈的观点。
第二个是三个泛化,而这三个泛化的数据很缺乏,包括了任务泛化、感知泛化和运动操作的泛化。
有一个问题我一直没有理解,比如数据生成,叠衣服和骑自行车,这个数据很难得到,这种泛化确实是有挑战性的,下面还是再问一下许总,您觉得人形机器人最重要的两个是什么?
许晋诚:我蛮认同杨总的说法的,最重要的两点会提出第一个是它的攻克会带来很大的提升,机器人全身更多传感器的植入,目前来讲传感器还是远远不够的,这就意味着必须攻克的。
第二点是怎么把这个数据用起来,这个也是没有一个很好的算法让它做的非常好的。
根据第一点目前在我们公司实际的情况就是有大量的数据传感器,集成在机器人身上,能够做到非常好的力反馈控制,但是仅仅是力反馈控制而已,我们能不能做的更好一点,能不能借鉴人在感知上或者跟思维上的碰撞,现在做的一件事情是把全部的触觉做文本化,这样的话可以跟语言模型串接在一起了,更多的传感器、更多的文本化的东西互相碰撞才能带来更好的结果。
这是第一点远远不够, 还需要更多的传感器,不管是视觉、触觉、听觉甚至是更多的,我们人身上有几千万、几亿个类似的传感器,对于人而言,我们自己是很普遍的对我们的日常生活中,因为有大量的传感器支撑着我们,所以我们并不有这种认知,但是当我们剖析开来从微观层面来看希望有更多的输入。
第二点就是我们的数据,杨总这边是做机器学习的,我是做硬件出身的,我是非常希望有很多的不管是厂商还是客户还是专家,可以更好的把这些数据用起来,甚至不管是在未知的层面上,这件事情是把它和人做结合。
王田苗(主持):谢谢你的补充,你们两位科学家和所长你们理解如果聚集到最重要的两个技术,有没有什么补充?人形机器人希望慢慢由一个小的细分领域开始迭代。
熊蓉:第一个可能还是在整个关节驱动能力上,高爆发的电机、高精度的减速器高爆发的驱动器,这个我觉得目前性能还需要进一步提升的,真正做到类人尺寸下灵活的运动是需要这些核心零部件进一步的进行攻关和解决的。
第二个要多模态融合下的具身技能作业,我的观点反而是觉得现在的传感器,我们在人形上装的是足够多的,但是并没有把它真正的融会贯通起来,也并没有真正的打通我们有了这么多数据到底如何进行快速的学习发育。
王田苗(主持):第一,一定要重视全电驱动一体化的高扭矩、高动态。
第二,要把这些数据以机器人的工作环境,充分的利用多模态。
刘连庆:我还是呼应一下。第一个就是两位年轻博士说的臂手协同。
第二个就是技能学习。
咱们说人形机器人现在20多款,看一个技术能不能走向市场,第一就是看刚需在哪儿,第二个就是技术能不能真正实现。第三市场能不能接受实行快速迭代。
我们今天探讨了好多技术的问题,到底刚需在哪儿,市场能不能接受快速迭代,也是一个挺关键的,市场的拉动作用可能不亚于创新的作用。
王田苗(主持):你这个问题引起了启发,我还是想问一下四位,15个或者27个人形机器人,通过一个什么样的测试能把它分层呢?从逻辑上理解,技术大家都会说研究了这个技术,那个技术,单人部件有触觉、传感、头,能够转身,然后集成到人形,我的意思是用一个什么测试把这个能够分层呢,不要一下子局限在技术测试、单元部件测试。
美国一个计划始终都是一个测试来引导工程的,由工程引导团队攻关,再有攻关带动技术。
杨丰瑜:我是搞机器学习出身,一还是接触到的领域所有的任务都会有一个公开的数据集,大家都在这个数据上测谁好谁不好。
首先因为机器人是个软硬结合的东西,很难非常标准来做这个测试,包括今天讨论机器人抓取这件事,大家都抓的很不错,如果一定要有一个通用的测试基准来测试,这个测试基准相信一定会是bios,大家都会为了这个测试基准去调自己的模型,自己的机器人,我反而觉得现在机器人领域百花齐放。不能要求做搬运的机器人叠衣服,也不能要求叠衣服的机器人搞一些非常复杂的事。
我一直讲机器人这个赛道非常大,每家公司每个机器人能够在自己擅长的领域发挥作用,我觉得这是一件非常好的事情。
王田苗(主持):不要局限出一个功能性的测试集,2016年谁都说视觉识别、深度学习,最后斯坦福搞了一个集,由这个集来看待你的复杂程度、准确率、时间效率等等,这个观点我觉得挺有代表性的。
熊蓉:我是觉得测试集对于研究的推动是非常重要的,美国办了几个比赛都是在技术刚开始具身这方面布局的时候通过这样一个场景来牵引了一大批技术人员投身于这方面的研究,无人驾驶也好,2015年的机器人挑战赛也好,但是这种测试场景我们在参赛的时候其实会有很多策略性的,但是总体来讲是通过这样一个比赛带动了技术的发展,然后再进一步进行推动产业化。
王田苗(主持):你建议还应该设置小范围的一个功能测试集,然后围绕这个测试集来训练机器人的模型,机器人的灵巧操作和结构进化。
这个测试集让你做这个规则,特别倾向于把哪个功能集放到你的里面,举几个例子。
熊蓉:我觉得要从现实中提取需求,我不认为人形机器人做搬运是一个合适的事情。如果在一个我们人类环境里能够非常安全灵活的移动作业,这个是一个更合适的。
王田苗(主持):对这个问题我也在思考,这个事情对于每位从事机器人研发包括具身智能未来产业化还是有很多的思考的,下面接着刚刚连庆说的这个问题,让我一下引起了思考。机器人落地的场景,假如举两个的话是什么?
刘连庆:人形机器人其实从国家各个部委各个层面都在论,咱们现在因为人形机器人变成有点举国之力要把人形机器人做好,我们一直想找个场景非人形机器人莫属,场景也找到了但是太小众,根本支撑不起来万亿赛道的产业,他们总问为什么人形机器人一定有腿,残疾人难道不能工作吗?
所以说人形机器人定义成刚刚各位说的手臂协同,能有一些技能学习,这样的场景还是挺多的,小米他们做人形机器人很多,汽车工业还是拉动机器人发展的第一动力,工业机器人就是从汽车工业开始的,这也是为什么马斯克包括BMW罗校长讲的都要做人形机器人,这里面有一些排线主要是软线的操作、接插,但是这些操作如果有手臂协同、技能泛化学习已经到这个程度,我下面不一定是两个腿。
当然了他们也举了两个特殊的工位,一定要人侧着身子腿一弯才能把线接上,倒是有这样的场景,你刚刚说的测试体系,其实我觉得测试体系就是找一个量大面广有可能产生万亿产值赛道的场景,然后让机器人做技能化的测试。
王田苗(主持):我们把这个人形定义一下是泛化人形,可以双足也可以轮,可以固定没关系,但是很希望在5年内人形机器人把口子给撕开,你刚刚说了汽车工业布线,能再给一个场景吗?
刘连庆:因为主要是关注汽车工业,所以说其它的场景也有但是都太小了,华龙一号里面的核电站,过去都要人过去,其实就要有一个灵巧操作,这么过去也行,但是使用量不是太大,但是产生的经济效益包括对工人,每年只能过去工作一次,两三分钟出来一个,几十个工人在排队,过去两三分钟他就出来,然后再过去一个两三分钟把这个事做完,这种是比较特殊的。
王田苗(主持):杨博士从产业界给我们初创企业落地的人形,给两个场景的方向。
杨丰瑜:我先讲一下整个思考逻辑,今天具身智能机器人或者说按照王老师定义的人形机器人,两款其实都算在广义人形机器人的范畴里做这个事,今天整个人形机器人产业还是在非常早期的阶段,我们最后的目标是瞄向通用,必须面临的情况是今天硬件上实现了部分通用,算法上距离尤其是任务上的通用还差的很远,我有三个考量的维度。
第一,场景需要相对来说容错率比较高一点,今天的人形机器人大模型泛化这个事,为什么GPT普及率非常高,它就是一个容错率比较高的一件事,刚刚刘老师讲到分不清楚3.11和3.2谁大,这个不要紧,大不了不信他就好了,我们用GPT也知道有很多幻觉,有很多不真实的地方,但是很多程度上还是能给我们提供帮助,而且失误的时候不会带来巨大损失的时候,我们还是愿意尝试这个的。
王田苗(主持):你来引导一下场景,刚刚连庆所长说汽车值得关注,另外特种危险环境下值得关注。
杨丰瑜:第二,我们觉得这个场景愿意为了这个通用性买单,刚刚熊老师说搬运不是适合人形机器人的好场景,我们也看到了有一些AGV加一个协作臂也能完成这件事,我们希望找到一个场景会为了你的通用性付溢价,因为通用性和效率性是两个矛盾的事。
我一直跟我们同事讲,我们做洗衣服这个动作,其实最高效的洗衣服的机器人就是做成一个桶,我在屋子里逛一圈,所有衣服都往桶里装,再走到洗衣机门口来一件件往里放这个事。
我们既然在讨论人形机器人硬件上这个通用性,我是觉得大家就要找到一个愿意为了通用性付溢价的场景。
第三,要找一个对终局有益的场景,我本人包括整个团队是相信通用具身智能一定会来的,只是时间长和短的问题,我们希望收集到的数据是对未来通用性有用,因为收集数据本身这件事已经很难了,如何发挥这个价值是非常关键的事情,我们在数据的层面上不仅要考虑数据绝对数量的多少,更重要的是数据的丰富性。
如果每天都干一模一样的事,本质上来讲干一万年可能对于其他的场景或者对于底层的技能能力栈学习意义不是很大。
为什么我们公司选择了非常有挑战的家庭服务这个场景,我们反而觉得这个家庭服务是一个比较好的场景,当然在里面也不说指望明天一口气吃成胖子,虽然瞄准家庭服务,但是不觉得明天能够替代保姆做这件事,一定有一个循序渐进的过程。
第二点引申开来有一些泛商业、泛消费的场景,可能也是一个比较好的场景。
许晋诚:我补充一点,我认为对于机器人首先落地必须是对环境改造的程度是相对低的一种场景,对我而言,分拣是一个非常好的场景,对于我们目前的这些物流公司而言,分拣还有打包这些工作有大量的劳动力存在的,这些劳动力是不可能7×24×365干这些事情的,总会有大量的问题存在,分拣对于环境改造率基本为零,就把人形机器人引入就开始干这件事情。我认为是一个比较好的。
王田苗(主持):其实你这个问题对于杨总的问题也是一个补充,杨总要很大,所以说消费很大,大家都知道只要进入消费集群,那真的就是万亿市场,如果是工业,我们往往就是千亿和百亿,如果进入到特种,可能就是50亿。
但是许总补充一点,他认为分拣或者是泛商业化,可能是率先落地的消费,是这样的吗?我们要看时间。
许晋诚:大部分我们日常生活的事务,我们人在做的事情,分拣其实就是极大利用了这些工具的场景,在生活中也是一样的。
王田苗(主持):我有一个问题引起来了,跟大家分享一下,未来10年我们把机器人算100%,人形机器人会过50%和60%吗?还是说它只有20%?因为这个我没有想明白,原因是我就想看未来20年、30年,机器人产业的终极生态是什么?我们搞机器人20年、30年,我们总觉得机器人是一个需要二次开发的,维护成本很高。
比如说我们的汽车、手机,我们把钱一付,拿回去一打开就能用,所以这个问题就让我想起会不会有机器人公司,其实还有很多的机器人设计公司,它把目前各种通用的经济结构,还有专业数据能够集成给客户,反过来就有软件、数据技能公司、专业机器人公司,还有包括零部件。
我的问题是未来终极会不会这种形态?还是机器人箱子一打开,电一插它就走了,不需要定制,不需要工程师不断的给你维护?因为这里面我们要理解这个生态的时候,其实你就能理解你定位在平台公司,还是定位在产业链某一个环节的公司,你攻关的任务和重点是不一样的?
首先你认为将来人形机器人,我们说20年的,你觉得会超过现在机器人比例的50%到60%吗?按照马斯克说的1亿万台,还是它只是占了整个机器人的20%和30%,不会过50%?
熊蓉:我觉得技术等一系列问题的解决,是能够让人形机器人超过50%的。
王田苗(主持):很好,那生态上你同意吗?是不是有很多机器人的设计和服务组装公司?就像我们的装修一样的,不同的客户因为生产环境要求不一样吗?
熊蓉:可能不同家的会在人形机器人的设计上面有所不同,但是当它成为一个通用的本体,就像我们现在的手机有不同的厂商,但是手机里面有很多的APP。
王田苗(主持):许总有没有什么观点?她很乐观,20年以后通用人形机器人可能占50%-60%以上。
许晋诚:我也蛮赞同熊老师的,以我们目前的观点来看,我们最终的目标是大部分机器人能够帮助人类或者是替代人类原本的岗位,然后解放人类做其他的事情,这样看的话大部分人类的这些岗位都有机会让机器人来做这件事情。
王田苗(主持):也就是说人形也一样,将来会超过50%-60%。是不是会有很多像你说的二次开发的团队,帮助来推动人形机器人?还是钱一付,科学家把它一打开,一插电就能用?
许晋诚:我相信会有针对特定场景这种优化的公司会出现的。
王田苗(主持):我们还有6分钟,抓紧时间最后一个问题。我觉得你们很年轻,有梦想,而且都是高学历,都是名校的,而且你们好像也都在尝试着创业,有的已经在路上了,比如说杨博士、许博士,两位科学家也都有团队和学生,也都尝试着创业。
我的问题是做一个年轻的学者和科学家,在创业方面突出的优势是什么?劣势是什么?劣势靠什么能补掉呢?这样让你们的知识、智慧,能够真正的持续、长远的发展?先说优势吧,我想熊老师和杨博士你们两个先说,后面他们两个说,我们就结束了。
熊蓉:优势应该是在技术上面有深入的理解和长期的积累,从劣势上面来讲,如何去做好这个产品的定义,我觉得这个是一个非常重要的。
王田苗(主持):你还客气了,其实你还有战略思维,而且你还有特别优秀的学生人才的资源,这是优势。你刚才说的产品,那就是说你对客户角度来理解这个事情上还需要弥补。
熊蓉:之前是需要的,因为2016年创办了迦智科技以后,其实对整个市场的需求,企业的这些交流,上下游都很多,我认为我目前这方面的能力还可以。
王田苗(主持):杨博士,你们说一下吧,年轻科学家创业的优势和不足,泛化,不是指的你个人不足。
杨丰瑜:我非常赞同熊老师说的,我觉得尤其作为我们这一代年轻的科学家,我们算是走在整个时代最前沿,大模型今天讲整个的泛化,其实也就是过去的3年、4年才有了这么一个东西,我们看到今天很多的具身智能领先的工作,都是由一批一批年轻科学家完成的,所以我们知道技术的边界在哪里,我们也知道今天的机器人能做到什么,有哪些东西是做不到的,这个事我觉得在今天是一个非常重要的事。
第二点,劣势,我们从科学界出来,作为一家公司,熊老师讲产品,我们讲销售、渠道、供应链整个思维,我觉得还是很重要的。当然这个跟一些经验非常丰富的老兵比,我们会有一定匮乏。
我也很庆幸,我们整个公司在整个不管是产品端、供应链端,还是其它端,我们都有一些经验非常丰富,打过大仗的老兵,我也非常谦虚的向大家学习,我觉得年轻人反而最大的一个优点是学得快、跑得快,未来还有无限的可能。
王田苗(主持):年轻就有梦想,就有冲动,就有野心,其实这种野心驱使你去探索。当然你刚才说不足,可以通过商业合伙人来弥补,而且你还自知之明,能够自我批判,能够和团队一起把这个推到前面。
许博士,你同意吗?
许晋诚:我也蛮同意杨总这边的说法,我们科班出身的这些学生创业者而言,最强的优势在于我们的信息交流很频繁,我们有大量的学术,大量优秀的科学家,我们会在会议上讨论,我们的信息交流非常的频繁及其高效,大量论文的论坛可以帮助我们理解互相的研究成果,进而帮助自己提升,我们对于更多的产品怎么样实际落地,这些是需要再去加强的。
王田苗(主持):好学和敢于修正,敢于围绕客户需求,我的意思是从你来说你愿意跟不同的人打交道、喝酒、谈判,如果投资方让你对赌,你喜欢这两个事吗?我总觉得科学家不喜欢这两个事,希望产品和技术比别人领先,很希望测试,跟这么多人交道还要陪吃谈合同,最后投资人还告诉你要签字。
许晋诚:这点会有所抗拒,但是对我们而言如果有更好的deal,当然会接受的,我们会用更好的技术,更好的产品以及市场和订单来换取更好的处理。
刘连庆:我们的缺点,因为我做一点管理,对于青年科学家主要的缺点就是既要又要还要,目标优化的维度太多,我觉得对创业是不利的,创业是个九死一生的事情,不能既要又要还要。
王田苗(主持):人性就是这样,别人说企业家是反人性的,好的,这个环节就到此结束。
(本文根据录音整理)
扫描二维码关注
中国电子学会公众号
扫描二维码加入
中国电子学会会员
钟山县开展“惠民兴县”科技志愿服务活动——科技实验秀进校园
中国电子学会总部政策研究与国际合作处党支部赴中国机械工程学会开展主题党日活动
第四届智能人机交互技术年会圆满落幕
中国电子学会召开2024年统战工作座谈会
2024年全国导航技术与应用大会在京盛大召开
相约广西绿城 2024世界机器人大赛南宁锦标赛开幕!
“科创中国”新质生产力赋能电子智造论坛(宁波)成功举办
中国电子学会网络空间安全专家委员会走进山东大学暨第40期中国电子学会青年人才托举沙龙成功举办