雷峰网 //m.drvow.com //m.drvow.com/resWeb/images/common/lp_logo.png 雷峰网 //m.drvow.com 2015 m.drvow.com All rights reserved. zh_cn Mon, 03 Feb 2025 21:52:17 +0800 独家 | 原智元具身组长朱光沸加入众擎机器人 //m.drvow.com/category/robot/g8lhUctfa7b6t4gH.html

AI 科技评论独家获悉,原智元具身组组长朱光沸近日已离职,并加入深圳众擎机器人担任某技术一号位。

公开信息显示,朱光沸本科毕业于山东理工大学机械工程专业,硕士就读于上海交通大学机械工程专业。2018 年,朱光沸博士毕业于美国威斯康星大学麦迪逊分校机械工程系、同时在 2017 到 2018 年辅修了计算机科学硕士。2020年,朱光沸加入上海非夕机器人,担任资深算法工程师和医疗团队负责人。

后朱光沸加入智元,担任具身组组长。智元成立于 2022 年底,由“天才少年”稚晖君创办。作为具身智能领域亮眼的独角兽,智元经过层层融资加码,估值已超过70亿。

据了解,2024 年上半年,朱光沸领导的具身组在智元内部是“当红炸子鸡”,负责探索具身智能前沿技术,投入了大量资源。朱光沸在去年 11 月提出离职,据了解其提离职时,智元具身组尚未完成从 Demo 到落地的鸿沟跨越。朱光沸离开后,智元仍需物色新的具身智能大牛引领技术落地。

与此同时,众擎机器人正在招聘相当于具身智能一号位的技术人才。据 AI 科技评论了解,赵同阳给猎头的目标人选画像是“类似银河通用王鹤”这样的人物,具体而言是:AI 背景出身,掌握 3D 视觉专业知识。这可以与众擎机器人创始团队精通硬件本体、不擅长 AI 的情况相弥合,强强联合。

朱光沸的本硕博都是机械工程专业,与众擎团队有共同的话语体系,同时辅修过计算机科学、有一定的算法积累,但是否能满足众擎机器人在 AI 方向的需求仍待验证,据了解众擎仍在不断物色出众的 AI 算法大牛。

此外,智元近期动作频频,先是宣布开源 AgiBot World 数据集,随后具身算法团队再度推出 EnerVerse 架构,在生成未来具身空间的同时引导机器人完成复杂任务。

朱光沸此次加入的众擎机器人,同样是当前具身领域的明星企业。众擎机器人成立于 2023 年 10 月,创始人赵同阳是机器人领域连续创业者,曾创办多够机器人,后加入鹏行智能,主导研发了人形机器人 PX5。此前 AI 科技评推出《鹏行往事:智驾巨人的机器人启示录》一文,揭示了更多关于鹏行智能的故事。

目前,众擎机器人已完成分别由商汤国香资本和弘晖基金领投的天使轮、天使轮+融资,总金额近亿元。2025 年 1 月,众擎发布旗舰产品 SE01,这一人形机器人高 170 厘米、重 55 公斤,能完成上下蹲、俯卧撑、转圈、跑跳等动作,在深圳街头亮相。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/g8lhUctfa7b6t4gH.html#comments Wed, 22 Jan 2025 11:51:00 +0800
鹏行往事:一个智驾巨人的机器人反思录 //m.drvow.com/category/robot/2hLfOR84v2EPL74Z.html

作者 | 吴华秀

编辑 | 陈彩娴

一起干大事

2020 年秋天,距离小鹏 P7 发布没多久,何小鹏专门开着新车从广州到了深圳固戍。当时小鹏刚在美国上市,何小鹏正处于春风得意的状态,但此行也很低调,只带了几个同事同行。

而何小鹏此行,是为了拜访一家生产四足机器人的创业公司——多够(Dogotix)机器人。多够机器人成立于 2016 年,彼时推出了两款四足机器狗,公司虽小,但成果已被南方科技大学、国防科技大学等知名院校应用在科研中。

西乡工业园区的一间办公室里,桌上摆放着几只通体银色的机器狗。Dogotix 创始人兼 CEO 赵同阳向何小鹏详细讲解四足机器人的市场情况与发展前景,还做了机器狗 demo 的展示。

听完赵同阳的讲解,何小鹏很兴奋,跃跃欲试。当时赵同阳以为只是投资人过来参观、并不太在意,但临走前何小鹏向赵同阳暗示了一个更大的计划:“你现在只是小作坊,能赚点钱,但干不大。要不要考虑放弃小作坊、搞大事?”

当时,何小鹏正在密集寻找四足机器人项目。继 2019 年麻省理工学院(MIT)开源了一套四足狗方案后,整个行业显著进步,四足机器人产品快速迭代,商业化落地一时变得触手可及。

例如,海外足式机器人鼻祖波士顿动力成功对外发售其性能强劲的四足狗 Spot mini,国内宇树、云深处等厂商过去几年所发布的机器狗也进行了不错的市场教育,在巡检、科研等场景中不断获得正反馈。

相关技术的突破与提升、应用场景的广阔前景,让运动能力出色的四足机器狗成了市场的“香饽饽”,资本争先恐后地涌入,不少厂家将之视为新的商业机遇。

作为国内第一批实现四足机器小狗开模量产的团队,Dogotix 也得到了不少资本的青睐。不过一开始,赵同阳瞄准的并非四足机器人,而是双足人形机器人。

赵同阳

赵同阳一直对机器人有执念。2012 年本科毕业时,赤手空拳的赵同阳没有能力进行机器人创业。恰逢物联网热潮兴起,造富神话屡现,赵同阳选择曲线救国,创办了与物联网模块相关的安信可。四年后,安信可营收过亿。眼见安信可的发展步入正轨,赵同阳又判断机器人的创业时机已经成熟,于是转让安信可,将赚来的第一桶金再度投入机器人创业中。

然而,双足机器人作为前沿技术高地,无疑是一块难啃的硬骨头。自 2016 年起,尽管赵同阳严控各项开支,团队也始终维持在十人以内,但持续的高研发投入没有与之对应的商业产出,资金也难免捉襟见肘。

好在东边不亮西边亮。虽然双足机器人迟迟不见起色,但四足机器人却屡见捷报。

同样成立于 2016 年的宇树科技在 2017、2018 年相继推出四足机器人。宇树创始人王兴兴曾是赵同阳创业时想拉拢的对象。

赵同阳此前招兵买马组建机器人团队时,在时兴阿莫论坛(amoBBS)发英雄帖。阿莫论坛是一个电子技术论坛,创建于 2012 年。当时刚硕士毕业的王兴兴跟了贴,两人一来二去聊得火热。王兴兴读书期间推出了全球首款轻量型机器狗,赵同阳看好这一年轻人,想要拉他入伙。然而,王兴兴的兴趣在四足机器人,两人没谈成,于是各奔东西。

四足机器狗的成果逐渐涌现后,赵同阳经盘算,决定再度曲线救国,由双足转向四足。双足与四足在底层技术上存在复用空间,且四足技术相对更容易、落地也更快。研发期间,赵同阳曾因不懂运控算法,四足小狗趴窝动不了,只能四处搬救兵,后来得到山东大学机器人团队的援手。

机器人作为一个烧钱的行当,有限的资金再精打细算也有财务风险。就在弹尽粮绝之际,赵同阳团队迎来了转机。2020 年,Dogotix 陆续推出两款对标波士顿动力 Spot mini 的四足机器人,该产品的成功研制、量产与售卖让团队运转了起来。

推出两款机器狗后,赵同阳为将公司推上新的高度而开始寻找新的融资,于是开头的一幕上演了。不过,何小鹏并非是第一个向赵同阳抛出橄榄枝的人。

早在何小鹏登门之前,小米也曾接触过赵同阳团队。当时,小米也在调研四足机器人,Dogotix 很快进入小米投资部的视野。2020 年 9 月,赵同阳曾到北京小米办公室给雷军做演示,两人相谈甚欢。交流结束后,小米投资部立刻与赵同阳洽谈合作事宜。

整个流程推进得很快。小米具有完备的生态链、强大的资金支持,是一个坚实可靠的依托,但赵同阳最终没有接受小米的投资。坊间传言有二,一说是赵同阳团队开价高,小米最终放弃;二说是小米计划将赵同阳整个机器人团队并入小米生态链,而赵同阳更喜欢创业的独立性,这种差异最终导致两家分道扬镳。

小米顺为资本后来转去领投了宇树 A 轮融资。没多久,小米又选择亲自下场“造狗”,不过这是后话了。

虽然错过小米,但 Dogotix 当时还有其他资方的机会,包括索道资本。因此,面对何小鹏的口头邀约,赵同阳并没有当即答应。直到一个月后,时任小鹏汽车顾问的刘江峰打来电话,询问赵同阳为何还不联系何小鹏。

刘江峰曾任华为荣耀事业部总裁(2013-2015),也是跟何小鹏从广州来深圳考察赵同阳团队的一员。后来,在刘江峰的推动下,赵同阳经认真考虑后,决定放弃原来 Dogotix 的“小作坊”模式,喊停已在洽谈的新融资,与何小鹏联手。

随后,何小鹏出资将 Dogotix 的知识产权、人员、债务全部买断,新成立了一家公司,取名作“鹏行智能”,小鹏汽车占比 19 %,何小鹏占比 65 %,赵同阳占比 15 %。

至此,2020 年 12 月,深圳鹏行智能成立。

疾驰与狂热

何小鹏之所以选择入局四足机器人,一个看似和造车新势力并不相关的业务,这离不开一个大背景——小鹏汽车的造车大业取得了里程碑式的进展。

彼时,小鹏汽车刚敲钟上市数月,首次实现全年毛利率转正,正式告别以“烧钱”为主的阶段,业务渐上正轨。

熬过竞争激烈的造车初期阶段后,何小鹏并没有将小鹏汽车定位于一家纯粹的汽车制造商,而是继续寻找更多关于“出行”想象力的空间。基于这一理念,何小鹏一左一右迈进了两块面向未来的技术高地——四足机器人与飞行汽车。

与鹏行成立的同一时间,何小鹏也投资了由赵德力创办的小鹏汇天(一家专注于研发载人飞行器的公司)。小鹏汽车将这些非相关产业布局称为”生态协同“,小鹏主体可以为四足机器人项目输出算法,可以为飞行汽车提供制造和销售支持,双方还可以在动力、仿生学等领域产生协同。

何小鹏

鹏行智能一起步就迎来了飞速发展阶段。

何小鹏尤为看重鹏行,花了不少心思与精力在鹏行业务上,不仅每周亲自参加线下例会,还会时不时线上督促和推进项目任务与研发进程。更重要的是战略层面的思考与同步,鹏行内部经常聊方向、产品、技术与未来可能性。

何小鹏 “有闲”,是因为他从小鹏汽车的繁重事务中抽离了出来。知情人士方宪告诉雷峰网,小鹏汽车上市后,何小鹏认为小鹏汽车整体已步入轨道,计划着后撤,让联合创始人夏珩顶上。后来小鹏汽车失利后,何小鹏将重心放回造车大业上,才较少插手鹏行事务。

拉回到四足机器狗,彼时在业界正是个冉冉升起的“明星宠儿”。尤其在 2021 年这一年,可谓是空前绝后的热闹:前有春节晚会上宇树与优必选四足狗的双双亮相,后有新品不断涌现。例如宇树、云深处两家公司,分别接连发布了两款四足机器狗的产品。

就连后来跑去与追觅合作四足机器狗项目的新兵蛋子小米,也趁热打铁,不惜赔本赚吆喝,在 2021 年 8 月推出四足机器人狗蛋 CyberDog,吸足眼球。(关于小米机器人的故事,欢迎感兴趣的读者添加 youni_chat 微信交流)

尽管没能像友商一样快速推出一款成型产品,但何小鹏在微博上透露了鹏行内部四足机器人的研发进展。何小鹏谈及四足机器人在户外及家庭环境中行走时需留意的要点,并表达(鹏行)在软件、算法、电子电气以及嵌入式等方面都要进行全栈自研——虽然这样花费的时间会更长,但能让机器人具备更优的性能。

当时大部分四足机器人厂商都在做巡检、科研市场,少数几家如蔚蓝、哈崎则押注于 C 端陪伴市场。鹏行则是一改四足机器人惯常采用的“狗”的形态,宣布要做四足机器马“小白龙”,直指 C 端出行市场,以供儿童骑乘。(更多关于四足机器人场景落地的故事,欢迎添加 whx23999 交流)

鹏行对外宣称,“小白龙”融合了小鹏汽车全栈自研的智驾技术。2021 年年中,小鹏汽车做了组织架构调整,原自动驾驶产品部总监肖志光转岗至深圳,负责机器马项目。何小鹏对外表示,向机器马项目开放了自动驾驶代码,予以技术支持。

机器马“小白龙”

“智能”一直是小鹏的最大卖点之一。有了小鹏智能驾驶技术作后方支持,机器马被赋予厚望。“如果说智能汽车是智能智造的皇冠,那么智能机器人将是机器智能的皇冠。从长远来看,更大的市场,也需要更大的投入。”

鹏行用实际行动解释了什么叫“更大的投入”:不仅给得起钱,还招的人多。

首先,面对人才,果断一掷千金。

彼时足式机器人的火热已将人才的价格捧高。当时优必选为了留住人才,已经开出了远高于一般制造业的薪酬,但还是有不少公司杀出来,用高于优必选一倍薪酬挖人,原先 40、50 万年薪,一跃成 80、90 万年包,不少人流向了普渡、傅利叶、小米、OPPO等公司。

鹏行也是一个出手阔绰的金主,吸纳了不少人才。例如,成立初期,由于内部缺乏运控人才,鹏行曾一度开出 400 万年薪的天价 offer 吸引人才。在被鹏行收入麾下的一众人才中,包括美国密歇根大学在读博士生达兴烨,其后为鹏行运动控制负责人。

其次,广纳贤才,汇聚八方力量。

仅一年时间,鹏行团队就扩张到 300 人,分别在硅谷、北京、深圳、广州设立了研究团队。

2021 年是鹏行规模最大的时候。一位当年加入鹏行的业者向雷峰网回忆道,“眼睁睁看着团队从十几人到几十人,再到数百人,办公室一扩再扩”。还曾有部门领导特意跑去 HR 办公室,要求对方不要再招人、部门人数已经完全够用了。其中,规模最大的部门是名为“自动驾驶”的部门,拥有一百多号员工。

这 300 人里,细数下来,一共有三路人马。首先是小鹏汽车的人才;其次,是一众曾追随何小鹏互联网创业的旧部;再者是从优必选、博智林等机器人公司挖来的机器人正规军,包括赵同阳带来的 Dogotix 团队。

团队背景多元化,有利于碰撞出不同的火花。比如用造车的量产流程去造机器人、用互联网的思维去扩张团队。但有时结果事与愿违。这几股力量做事风格并不相同,虽然能够互为补充,但更多时候是难以团结、力往一处使,反倒衍生不少矛盾。

很快,鹏行内部开始意识到,机器人与互联网、汽车并不是一套方法论。

不是一套方法论

如果说堆人力是互联网大力出奇迹的理念使然,那么将车厂模式挪用于机器人上则是看中了两者的相似性。看起来,这确实是一个 1+1>2  的买卖。

但再相似也会有差异。自动驾驶经过几年的大浪淘沙,已收敛出清晰的目标和技术路径,而足式机器人只是长远目标清晰,当下的方向和技术路径还比较模糊,同时还有不少技术障碍待克服。

“如果说汽车已经定型 80%,机器人从硬到软的定型和标准化还不到 20%。” 2024 年底,峰瑞资本李丰在一次公开演讲中指出汽车与机器人的不同。

过去 3、4 年里,鹏行内部经历了两三次大摩擦,之后大家发现机器人与汽车并不完全一样,不能简单粗暴地在机器人上套用汽车与互联网的逻辑。随后,鹏行的汽车与互联网力量开始后撤,只剩下原来做机器人的科班人马。加之内部路线调整,鹏行逐渐缩减至不足百人。

从结果倒推,当鹏行想用生产车的经验去造机器人,还是有些出入。

首先在产品定义上,直接将造车逻辑搬用至机器人上,容易忽略两者的差异性。好比,鹏行内部有个部门名字直接叫“自动驾驶”。小鹏汽车智驾团队在美国硅谷有 1500 人,从中抽调了 100 人去“自动驾驶”部门,相当于人员直接从小鹏汽车迁移过来。

自动驾驶部门定义机器人产品时,直接以车为模板。想法虽好,但免不了碰壁。例如,汽车空间足够宽敞,能放置规格较大的激光雷达、大型摄像头,但这在机器人上行不通,机器人构型对堆叠空间极为敏感。

多位鹏行前员工向雷峰网表示,用车的设计逻辑造机器人,到最后发现不知道到底是在造车还是造机器人。但也有人表示,应该要分情况讨论,整体上车与机器人的逻辑有 80% 的相同性。(未来绝大部分机器人公司会是车企吗?欢迎添加 whx23999 一起讨论)

一位知情人士向雷峰网透露,鹏行的自动驾驶部门主要是完成了让机器人从 a 点到 b 点的物理移动,但对于机器人其他方面如交互的认知则有所欠缺。例如,汽车行驶过程中会遇到其他车辆和行人,汽车主要完成安全避让即可,但机器人工作期间却会与各种各样的物体产生接触与交互,而这已经超越了自动驾驶的能力范畴。

其次,是硬件自研与外采的矛盾。

鹏行在机器人上复刻汽车生产逻辑,即软件自研、硬件外采。问题在于,汽车与机器人的供应链不可同日而语。

汽车已经有相当成熟的供应链体系。以小米造车为例,后来者小米能够直接采买成熟硬件组装,其面临的更多是具体的工程化难题,并非难以逾越的技术壁垒。尽管汽车供应链在机器人领域也能有所复用,但复用有限。尤其是足式机器人,其适配的供应链还未真正成长起来,以往足式机器人的厂商们大多选择自行研制硬件。

这就导致很多机器人硬件难以向外采买,即使能买到,价格也很贵。所以机器人核心硬件的自研依然是刚需。

最后,是一个作业流程的效率问题。

小鹏汽车拥有一支规模宏大的团队,员工数量超万名。相比之下,鹏行在巅峰时期也仅 300 人左右,勉强能算是小鹏汽车人员规模的零头。前鹏行员工罗勇珉向雷峰网表示,鹏行内部用管理万名员工的汽车运营模式去管理一个小的机器人团队,就会导致流程体系变得极为复杂。

大企业由于规模庞大和员工众多,通常具有复杂的组织结构和漫长的流程链条,在管理上往往有一些战略性目标和管理损耗,对于需要快速迭代的最新技术并不够友好。而初创企业的一大特点便是灵活性强。小团队能够迅速反应、及时调整,进而快攻快打。

一旦大企业病落在初创公司上,则可能带来团队节奏的走形。

原先一个数人的机器人小团队,工作流程极其简单,非常高效。比如,要想设计一个东西,几个小时就能确定下方案,接着工程师赶紧画图,花上两三天即可完成,再发给工程师去打样,六七天后东西就能返回来,全程总共耗时就 10 天左右。

但这一趟要在鹏行内部的大体系里跑一遍,十天是远远不够的。

第一步是要先立项,立项前要做调研。这市场调研一做,就得十天半月,甚至长达两三个月。立项后又得收集信息、确认信息是否充足,可能又耗去半个月。好不容易立项后,要对每个部分的方案进行评估评审,这又得一两个月。评审完去采购,还要对供应商能力进行评估,得一切合规。小团队采购时的第一性原理不是合规,而首先是你哪家产品供应不错就用哪家、中间签个保密协议即可。

等这一整套流程正常走完,会发现一件本可能半个月、一个月就能够完成的事情,愣是给拖成了半年至一年的长周期。对于硬件项目而言,尤其是足式机器人,开模打样等流程是必不可少的环节,时间很宝贵,再叠加流程性的时间损耗,极大拖慢了项目的研发进度。

一位知情人士向雷峰网分析,大量“堆人烧钱”的打法策略运用在互联网、汽车等这类成熟行业中,确有奇效。其核心原因在于这些领域并没有过高的技术壁垒,大力能出奇迹。

但对于还在技术爬坡阶段的机器人行业而言,就有些药不对症。此时,并不是团队越大越好,投入越多越好,进展越快越好,而是要看实际执行中的反馈和所处的技术阶段。

所以,采用汽车成熟运营的模式去推进机器人这类探索性项目,不见得奏效。

做不做人形?

方法论的不适配,叠加足式机器人的技术难度,让机器马项目的推进举步维艰。

鹏行刚成立时,由赵同阳带了十几人去深圳湾生态科技园,花了两年时间在代号为“PX”的机器马项目上。第一代机器马由赵同阳主导,花了半年时间完成项目。项目初期的 PX0、PX1 由赵同阳负责,而后续的 PX2、PX3 则交给徐志根管理。

四足机器马技术研发难度大,鹏行内部研发路线多次发生转向。起初是四足机器人,后来改成了轮式机器人。鹏行前员工刘岑宪告诉雷峰网,原先要做四足技术探索,但做久了后,一线执行员工因为常被项目牵着鼻子走,开始失去了初衷,就变成:既然内部要的是快速落地,如果不好实现,那就把东西弄得简单点。

技术探索与快速落地之间出现了矛盾。在一些人看来,由足式转向轮式,无疑是技术上的开倒车,而持相反意见的人则认为这是朝商业化更进一步。

技术路线的差异,让鹏行内部渐渐撕开了一个口子。而“做不做人形”这一问题,更是让鹏行内部分化出了两种鲜明的声音。

2022 年底,特斯拉人形机器人和大模型的横空出世,让人们看到了人形机器人落地的希望。这让向来就热衷于做人形机器人的赵同阳心动不已,曾多次向何小鹏表达了做人形机器人的意愿。

人形在技术与落地上,在未来都会是个不小的挑战,至少要 5-10 年才能实现商业化落地。

鹏行内部团队曾评估过,按照当时的技术,双足人形机器人的本体和智能化应用,至少需要二三十年才能实现,甚至可能更久。因而,双足项目迟迟难以上马。

那时要克服的问题太多。好比硬件部分,技术原理虽然基本通关,但是工程化部分却很要命。鹏行前员工刘岑宪表示,工程化并不等同于技术本身,而是指将技术转化成产品,光懂技术未必能搞定工程化问题,中间有一段很长的路要走。

一山更比一山难,比起硬件,软件才是重头戏,“问题多到解决不过来”。先拎机器人大脑这一点,有效数据的匮乏使其面临着卡脖子的困境。虽然有人认为基于过去的图像信息可以快速催生机器人大脑,但这一可行性得打个问号。

首先是图像信息不见得够用。这就好比人,把人放到工厂去,看别人搬砖,如果只是看别人搬砖,一定难学会搬砖,只有自己上手去搬个两三天、才会发现怎么搬砖更舒服。说白了,就是光让机器人看,难以学会技能,还得是实践出真知。

其次,互联网所拥有的海量文字、语音和图像数据,固然能够迭代出大语言模型,但这些数据还很难整合在一起。强如 ChatGPT 虽然做了部分融合,但不同类型的数据大多还是独立处理。

对于机器人来说,这些数据的信息完备度并不充分,比如让机器人去理解杯子,究竟什么是杯子?这个问题机器人还做不到百分百成功识别。人会先猜测这是一个杯子,然后用力去接触它,但机器人并不会如此。

加之由于鹏行内部频繁更改技术路线,机器人的每一次迭代无异于回炉重造,可迁移挪用的部分太少,仅约莫 10-20% 的复用性。“嵌入式、结构、组装、测试、供应链、工程师等等,这些资源能够从 a 迁移到 b 的效率极低。”

于是,一种认知逐渐在一些内部人员中间形成:人形机器人成不了。

还有人直接表示,人形机器人难以实现量产。这些公司要么像特斯拉一样,以终为始,不差钱,每天投钱进去,不断砸钱;要么就不断地找商业模式,先射箭再找靶子。

但赵同阳并不这样认为。他体验过从 0 到 1 摸索机器人技术的过程,因而认为这些横亘面前的新技术难题确然是逆境、却不是绝境。更何况,鹏行过往“弯路”积累下的价值与技术储备,已然让鹏行拿到了具身智能浪潮的入场券。

起初何小鹏并不愿意直接做人形机器人,而是坚持继续已有的四足机器人路线,等技术再进一步积淀后,时机合适时便复用至人形机器人上,直到外界风向突变。

2023 年 3 月,不到半年时间,继推出 ChatGPT 后 OpenAI 又发布了 GPT-4。GPT-4 在多项能力上取得显著突破,令业界沸腾。这一速度,让市场看到了似乎能一竿子插到底、进而一举将人形机器人做出来。

见此情形,赵同阳再也坐不住,直接向何小鹏再度摊牌,坦言自己想做人形机器人。

2023 年 4 月,赵同阳从内部挑选了20余位精兵强将,专程从深圳转战到广州办公室,一头扎进双足机器人的研发中。事实证明,鹏行过往 300 人的投入并非虚有其表,双足人形机器人的整个研发进程推得很快。

小鹏 2023 年 1024 科技活动日

半年后,在小鹏 1024 科技日活动上,小鹏鹏行发布了首款人形机器人 PX5。PX5 除了拥有可爱优雅的外观和造型,还具备惊艳的行走稳定性。“直腿”、大跨步的行走方式不仅更节能,而且成功做到了极佳的平衡能力和越障能力。

随后,PX5 与一众人形机器人一同登上英伟达 GTC 大会,作为黄仁勋演讲的背景板。

凝聚鹏行过往心血的佳作 PX5 机器人收获不少业内认可,也给了鹏行机器人团队许多成员创业的信心。

从 2023 年开始,从鹏行离开的技术人才创立了多家机器人公司,参与到具身智能浪潮中,包括众擎机器人、艾欧智能、珞博智能、有怡科技等等。

写在最后

鹏行经过几年试错,曾有过一个结论:人形机器人做不了量产,这些做人形机器人的公司,本质上都是一个研究院。因为机器人作为前沿技术的高地,还面临着大大小小需要攻坚克难的技术挑战。

漫长的技术摸索,相对应的却是遥遥无期的商业落地,如何存活下来成了考验。

多位受访者向雷峰网表示,车厂做机器人其实是一条可行的路径,但核心是别乱花钱。其中一位业者向雷峰网反思,“国内大厂喜欢啥都干,烧钱特别厉害,但这并不适用于机器人。”

大跃进式的投入,只有在合适的时间点上,才能做到短时间内疯狂烧钱换产出。否则,真金白银的投入往往只能打水漂。

虽然在过去直接大刀阔斧做人形机器人未必是最佳选择,但并不意味着 3 年后、或 5 年之后,这事就是错的,关键还在于 timing(时间点)。

在 2024 年小鹏 AI 科技日活动上,何小鹏说:“小鹏在自动驾驶上是摸着石头过河,走了很多弯路,这是创新者的代价。”

同为创新者的鹏行,在过去几年里也从弯路中沉淀出不少价值。多位受访者表示,鹏行作为一个舍得投入的产业平台,为机器人领域培养出了不少历经机器人从 0 到 1 周期的优秀人才。此外,项目期间鹏行进行了大量机器人中间态探索,不断推演技术的发展,这也留下了许多宝贵的 knowhow。

只是,现在鹏行这家公司已不复存在。何小鹏在活动日上进一步表示,现在小鹏决定自己全力以赴去做机器人。2023 年 9 月,小鹏汽车发布公告,斥资 1 亿美元买下了鹏行,鹏行被收为小鹏汽车的一个事业部。

时隔一年,小鹏机器人推出了新一代 AI 机器人 Iron。Iron 外观极具科技美感,是 1:1 的拟人形态。在应用上,Iron已进入小鹏汽车工厂工作,承担拧螺丝等组装生产任务,未来还会聚焦在门店等零售场景。

小鹏 Iron 机器人

谈及机器人规划时,何小鹏强调,机器人技术投入非常大,没有 500 亿做不好 AI 机器人。既要把技术做好,也要多融钱,否则根本承受不起机器人全局性研发。“这是一个比拼耐力、实力、财力、运气、多项综合的竞争,也是一个马拉松规格的比赛。”

在一个长线技术领域,是需要有一小波人愿意长期信仰这件事。悲观者或许正确,但乐观者成功。

当下具身智能热潮起,一众早早蛰伏于足式机器人赛道的资深玩家们,终于熬过了一片漆黑的前夜。只是,在缓缓而来的黎明破晓时刻,是否还能与新下场的行业新兵一决高下?新的国际级企业或许就酝酿在如今风起云涌的浪潮里。

如今有不少人选择出发,但更多的人已在路上,朝着已经无比清晰的方向前进。这世界上,有人是因为看见,所以相信。但还有一些人,却是因为相信,所以看见。

具身智能的未来,是属于心有执念、使命必达的人,他们是伟大的技术布道者。

注:文中方宪、曹孟杰、罗勇珉、刘岑宪等皆为化名。

关于具身智能领域更多精彩的人与事,欢迎添加作者微信 whx23999 交流。

此外,雷峰网成立了机器人读者群,希望进群的读者请添加编辑微信 aitechreview、并备注姓名-单位-职位。

]]>
机器人 //m.drvow.com/category/robot/2hLfOR84v2EPL74Z.html#comments Thu, 16 Jan 2025 17:21:00 +0800
清洁再造新维度!追觅扫地机器人首次搭载“仿生多关节机械手” //m.drvow.com/category/robot/jX2PSsUFiCsNRIYD.html 2025 年 1 月 7 日至 10 日,备受瞩目的国际消费电子展(CES 2025)在美国拉斯维加斯盛大举行。本届展会主题为“DIVE IN”,AI 与硬件的融合成为本次展会的一大亮点。赶在这场科技盛会开幕前,追觅科技发布了搭载全球首创“仿生多关节机械手”的新品扫地机器人。据了解,新一代扫地机器人在原有功能基础上,增添了具备高灵活性、可自如伸缩的“机械手”,实现了清洁、整理等多功能一体化。

  • 三维空间清洁、整理物品

追觅曾在 2023 年上半年推出仿生机械臂技术,通过机械臂外扩以覆盖边角场景的清洁。而2024年推出的仿生机械足技术,则进一步提升了扫地机器人的清洁覆盖率。而近期追觅在Ces 2025上首次亮相的“仿生多环节机械手技术”,相比原先的地面清洁方案,这一回扫地机上长出的“手”有望实现三维空间清洁与整理。

具体来看,这只“手”具备 5 个自由度,类比于人“肩、肘、手腕、手指”四个核心关节,可自如伸缩,最长可伸缩至30厘米,能够拾取远距离物品。

为了更好识别目标物体,新一代扫地机器人搭载了两套相机系统,互相配合。主机双目系统支持识别地面所有物品,夹爪上配有 RGBD 摄像头,与主机双目协作,通过双视角实现物品全方位点云重建,以确认物品抓取点,从而完成物品的拾取。

除了硬件过硬外,大模型赋予了扫地机器人真正的智慧。据了解,追觅新品首次搭载了具身智能大模型系统,整体包括感知与决策双模型,有效提升扫地机人任务调度能力。追觅工程师介绍,由于家庭场景中障碍物种类繁多,传统CVA小模型难以穷尽所有品类,而大模型能从海量数据中提取常识,从而让扫地机器人具备泛化能力,有效应对各种场景问题。

因此当面对凌乱的家庭场景时,扫地机器人能够识别物体识并进行分类及判断,如将拖鞋放置玄关、玩具放回箱子等。在具体任务的实施上,扫地机器人会挨个捡走目标物品,甚至会优先处理更干净、距离更近的物品。

  • 单独配仓,自主使用清洁工具

家庭环境中难免存在狭小缝隙,例如桌柜之间等清洁死角,传统扫地机器人难以触及,往往需要人力进行二次清洁,费时且耗力。追觅自研的“机械手”能够有效解决这一痛点。

具体而言,灵巧机械手会配置一套巧妙设计的配件仓,仓内具备涵盖毛刷在内的多种适配清洁工具。清扫时,扫地机器人一旦感应到机身难以进入狭窄处或识别出特定脏污需求时,会在整体清洁结束后,自行导航至配件仓,精准拿取、安装工具,随后如家政人员般返回清洁缝隙,实现全方位清洁。

  • 兼具强大性能与轻薄体积

扫地机器人要足够轻薄才能覆盖更多家庭领域,穿梭于桌椅底部、床底等场景。然而,现在要在一个扫地机器人上加装一只“手”,俨然会对其硬件结构设计带来严峻挑战。对此,追觅凭借深厚技术积淀探索出新的解决路径。

在外观上,扫地机器人整体造型参考高端敞篷车设计理念,为机械手配备了一个仿照敞篷跑车蓬顶设计的机舱。当机械手启动时顺滑打开,回收时则折叠隐藏。为了让机械手动作丝滑流畅,追觅特地加装了三个电机。

然而,这对电机提出了新要求。若要满足机械手的夹取承重能力,电机组件必须实现 6Nm 扭矩,同时扫地机身空间有限,需要确保体积极致轻薄。一个现实情况是,市面上少有电机能满足这一系列要求。而追觅作为电机方面的头部玩家,最终决定通过自研,成功打造出厚度仅为 18mm 的电机,实现了机械手的强大性能与轻薄体积的完美结合。

追觅此次全球首创的“仿生多关节机械手”的亮相,无疑重新定义扫地机器人的功能边界,让拥有单一清洁功能的扫地机器人向多功能服务机器人迈进。未来扫地机器人有望不再局限于单一特定功能,成为人们生活中的得力帮手。可以看到,扫地机器人在具身智能维度上已走在人形机器人前面。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/jX2PSsUFiCsNRIYD.html#comments Wed, 08 Jan 2025 18:34:00 +0800
万字长文珍藏版:RL+Control 如何将机器人可靠性逼进 99.9%? | GAIR Live //m.drvow.com/category/robot/vaVqlj8hYqIKOq4b.html

稳定性是制约人形机器人落地的重要因素之一,如何利用强化学习(RL)与基于模型的控制(MBC)来进一步提高机器人的稳定性,已成当下业界的重要研究方向。

2024 年 12 月 8 日,雷峰网、AI 科技评论 GAIR Live 品牌联合石麻笔记一起举办了一场主题为“RL+Control:将机器人可靠性逼近99.9x%”的线上圆桌沙龙。

圆桌主持人为石麻笔记主理人、英诺天使投资人王建明,并邀请了浙江大学副教授与云深处创始人朱秋国、北京大学长聘副教授卢宗青、卡内基梅隆大学(CMU)石冠亚与加州大学伯克利分校博士后罗剑岚一起进行了一场深度的讨论。

会上,四位嘉宾围绕 RL、Control 和机器人可靠性之间的关系分别提出了自己的独到见解,其中:

石冠亚认为,可靠性包含多个维度:底层硬件的稳定性、兜底恢复(Recover)能力,而且可靠性不能一概而论,需要结合场景对泛化性的需求程度。当下,将强化学习与控制相结合,例如把控制的安全性融入强化学习中,或者借助控制良好的结构使强化学习变得更具稳健性,是提高机器人稳定性的可行路径。

朱秋国则表示,学界的可靠性和产业界的可靠性并不完全相同,很难将一种方法在实验中的可靠性(比如达到99%或者90%)直接套用到产业产品中。机器人作为产品形式出现,必然要解决硬件和软件融合之后的可靠性。他认为,RL 在控制领域里有点类似镇定器,在与环境交互接触的过程中,依靠强化学习的模型,能够确保机器人稳定可靠。但这并不意味着基于模型的方法就失效了,模型预测控制(MPC)与强化学习相结合也是当前的另一种趋势。

罗剑岚指出,机器人要想真正发挥作用,成功率实际上要达到 100%,因为每一次出现故障、失败都有成本,会直接导致收益减少。要达到这个目的(100%),需要将强化学习和模仿学习结合起来,并与环境进行交互,在动态的过程中去实现可靠性。

卢宗青认为,在现实世界里,要实现高性能的操作并达到高可靠性(100%),一定要与环境进行交互,而要实现与环境交互,就必须得运用强化学习(RL);而依靠模仿学习、强化学习这些控制方法,人形机器人不太可能达到99%以上的可靠性。从场景需求出发,许多任务并不需要100%的成功率,而是满足设定的目标值即可。

除此之外,四位嘉宾围绕机器人的移动(Locomotion)、操作(Manipulation)以及未来 RL 的创新方向等话题展开了精彩分享。以下 AI 科技评论进行了不改原意的整理:

“机器人是一个很棒的平台”

王建明:先请嘉宾们做一个自我介绍,从罗博士开始吧。

罗剑岚:大家好,我是罗剑岚。我目前在伯克利人工智能研究实验室(BAIR)担任博士后研究员。我曾在伯克利获得博士学位,并在谷歌工作了两三年,后来又回到伯克利。自 2015、2016 年起,我开始涉足机器人学习领域,当时这一领域还未被称为“具身智能”,我的研究重点集中在机器人操作技术。

石冠亚:大家好,我是 2023 年入职 CMU 机器人研究所的助理教授,资历尚浅。我的博士毕业于加州理工学院控制系,该系云集了 Richard M. Murray、John Doyle 等控制领域的大佬。我从 2017 年开始研究 Control+Learning,当时很多控制领域的人都在考虑加入 Learning 元素,到目前为止我在 RL+Control 这个方向的研究已有七八年了。

博士毕业后,我在华盛顿大学做博士后,师从 Byron Boots,开展了大量机器人学习方面的工作。读博士之前,我在清华念本科。我对今天的主题极为感兴趣,我思考这个问题差不多有十年了,从本科时就开始琢磨,所以特别高兴能和大家探讨,可能等会我会有很多暴论(笑)。

卢宗青:大家好。我来自北大计算机学院,主要做强化学习算法研究。我 2017 年回国后便一直钻研强化学习算法。近期也涉足机器人相关工作,并且在跟进大模型研究,重点关注视觉标记化(Vision Tokenizer)以及交互学习的相关内容。

朱秋国:大家好,我是浙江大学控制学院副教授兼云深处科技创始人。我一直专注于人形机器人与四足机器人研究。早期运用传统控制理论方法,2019 年起便与国外学者合作开展 RL 相关研究, 主要带领课题组研究生开展这方面的研究工作。

王建明:感谢老师们的自我介绍。今天的讨论主题是“RL + Control”。作为热身,咱们先简单聊聊。很多人觉得 AI 和机器人结合是当下最大的机遇和浪潮,各位老师在浪潮来临前的十年甚至更久就在这个领域深耕了。能不能讲讲当初为什么选这个方向?现在风口来了,又有什么感受?

石冠亚:我觉得机器人和其他领域有个很大的不同之处,就是它属于系统性工程,由很多模块组成,像大脑、小脑、肌肉这些。大脑对应的是一些高层次算法,小脑则是全身控制算法,还包括硬件等方面。

以前我跟着导师读博时,有位叫 Joel W. Burdick 的老师,他在机器人领域造诣很深,可能都做了50年了。他常跟我说他的机器人波浪(Wave)理论,意思是每次机器人领域成为风口时,就会有很多浪潮往前推进,虽说没办法达到通用人工智能(AGI)的程度,但总会留下些成果,而这些成果对机器人领域来说是很大的贡献,等到下一波浪潮来临时,又会基于之前留下的成果再掀起新的浪潮。我对这个观点挺认同的。

回到王老师提的问题,我为什么喜欢机器人、为什么做机器人做了这么多年。我觉得机器人就是个载体,你想做的任何研究都可以通过它来开展。举个例子,要是你想挑战极限,去做个跑步机器人,那完全没问题,又或者你从材料科学角度去组装一个机器人也行,还可以专注做算法。总之,我认为它是个很棒的平台,能让我们去做很多想做的研究。

有没有和别人意见相左、坚持不下去的时候?对我而言,最大的不同可能就是我一直不太相信端到端学习算法能直接在real world里work,或许这与当下很多人的观念不太一样,但我觉得它并非非主流观点。很多人都觉得我们这个领域最大的争议是:“是不是 Data is all you need?”实际上,去年针对这一话题有过一场讨论,会后现场投票的结果是 50:50,所以我也不能说这是个非主流观点。

我其实一直挺坚持我们要在 real world 里做一些学习(Learning),并且要有一些真实的数据、一些结构(Structure)。我觉得这算不上冷门观点,但它确实是我的一个看法。

王建明:朱老师您也一直在这一领域里耕耘了至少 15 年,从最开始的双足人形机器人,到后面的四足机器人,您可以分享下这一路以来的感受吗?

朱秋国:我长期从事人形机器人相关研究工作,四足机器人是跟人形机器人并行的一个方向。因为早在最开始的时候,我们还和清华一起参加了 ROBOCUP 人形机器人比赛,当时就有一个预言,说到 2050 年时,要组建一支人形机器人队伍,最终能够打败人类足球队。可以想象一下,这中间的时间跨度非常大。

对于我们从事控制领域工作的人来说,人形机器人本身就是一个很棒的研究平台。机器人缺乏稳定性,如何控制它们是一个挑战,没有现成的理论或稳定性标准。我们的目标是让机器人走出实验室,适应真实世界的复杂环境,然后考虑如何实现实际应用。

对我个人而言,首先要热爱机器人,其次,在实现最终应用的过程中,需要经历不同阶段,包括理论的升级和机器人性能的提升。2010 年之前,我们实验室导师就提出要求,能不能让机器人走到室外,比如到实验室外的坡上、操场上走走。现在看来轻而易举的事,在那时却难如登天。光是迈出这一步,我发现都花了近十年时间。所以机器人本身就是个需要长期坚持的赛道或方向,要么放弃,要么长期坚守。

罗剑岚:实际上,我最初在伯克利从事控制领域的研究时,开始接触机器人学(Robotics)。当时我参与的第一个项目是操作(Manipulation)任务。在传统的控制方法中,需要采用分离原理(Separation principle),也就是将状态估计(State estimation)和控制(Control)分开。然而,很多操作问题中,状态估计并不是容易实现的。正因如此,这种控制方法在一些复杂场景下遇到了很大的挑战。

后来,我看到了伯克利在2015年发表的端到端(End-to-end)方法相关论文《Guide Policy Search》。这篇文章让我眼前一亮,因为它跳脱了传统分离控制的框架,为操作任务提供了一种全新的思路。通过端到端的学习方法,直接从感知到控制进行优化,绕过了对状态精确估计的依赖。

尽管操作任务至今仍然是一个巨大的挑战,很多问题还没有被完全解决,但端到端的学习方法以其广泛的适用性和潜力,正在成为解决实际操作问题的重要方向。

卢宗青:我先讲讲我的历程。我和其他三位老师不太一样的地方在于,我本身是做强化学习算法的,所以此前大部分工作都停留在做强化学习实验上,主要涉及两块,一个是 MuJoCo(通用物理引擎),另一个是游戏。实际上,我们之前主要聚焦在游戏这方面。

不过在大模型出现后,我们做了很多尝试,就是把强化学习和大模型结合起来开展工作。去年也做了诸多尝试,包括通用计算机的控制等一系列工作。我们期望能打造出一个通用智能体(Agent),让它能够控制并完成电脑上各种各样的任务,但是后来发现,尤其是在大模型方面,目前还很难做到这一点。

所以,我觉得即便有了大模型,它也需要与真实环境进行交互,基于这样获取到的数据去更好地学习。我跟剑岚刚才表达的意思相近,就是确实需要与物理环境交互,基于与物理环境交互得来的数据去学习,或许才能催生更具通用性的智能。

而说到与物理世界交互的载体,自然就是机器人了。因此,从今年开始,我们会把更多精力放在机器人方面,涵盖 Locomotion、Manipulation,以及思考在真实数据的基础上如何更好地学习大模型,特别是针对视觉这块,毕竟就目前的大模型而言,其对视觉的理解还比较薄弱。所以,怎样通过视觉也好,触觉也好,去更好地理解物理世界,是我们当下所关注的重点。

RL+Control 之于 Locomotion

王建明:接下来探讨一些更具体的问题,咱们先聊聊 RL 和 Control 在机器人移动能力(Locomotion)上的情况。

当 RL 和 Control 应用于 Locomotion 这一领域,其实很多时候二者是分开工作的。比如,有些老师一开始是运用基于模型的控制(MBC)方法来处理 Locomotion。而现在,很多强化学习的应用是先在仿真环境里进行,然后再通过 Sim2Real 的思路去解决机器人移动的相关问题。

石老师,我前段时间看了您在 YouTube 上的一个视频,是介绍 RL 和 Control 相结合的内容,像在四足机器人、人形机器人等方面都能结合。您还提到了 Leaning dynamics from real world 等概念,您可以系统地讲讲过去十年您是怎么把 RL 和 Control 结合起来的吗?

石冠亚:这个问题有些大,我先从一个小角度来切入吧。首先表明我的第一个观点,算是个“暴论”吧。我觉得 RL 以及 Control 本身都算不上是一种方法,而应该是一个问题。

我觉得强化学习的定义就是有一个马尔可夫决策过程(MDP),包含奖励(Reward)和系统动态特性(Dynamics),目标是优化奖励,找到策略用于控制,这和 Control 本质上是一回事。其定义就是面对动态系统去设计策略以满足一些限制,不能因为 Richard Belle man 提出“S、A、R、S” 这套表述就说它们不同。

因为它们本质是问题,所以有很多算法,像 RL 就很丰富多样。比如 Sim2Real RL 就是很具体的方法,我可以在像MuJoCo、SR 游戏这类做 Locomotion 的主流仿真器里,用近端策略优化算法(PPO)训练策略,再应用到现实世界中,这跟剑岚做的很多真机+ RL 完全不同,我觉得它们的差别比 RL 与 Control 的差别还大。

我的观点是,它们是两个不同的问题,得更具体地去探讨。就拿强化学习来说,我们得明确具体讨论的是哪种类型的强化学习。比如是 “仿真到现实的无模型强化学习(Sim2Real Model - Free Reinforcement Learning)” 呢,还是当下很热门的 “学习世界模型(Learning word model)”、也就是基于模型的强化学习(Model-based reinforcement learning),亦或是在真实世界里开展的无模型强化学习呢?像剑岚近期就有不少很棒的相关工作。

我觉得这些不同类型的强化学习其实差别挺大的。另外,还有离线强化学习(Offline reinforcement learning),有很多演示数据(Demonstration)的时候,不光能做模仿学习,还可以进行离线强化学习。我觉得它们之间的差别甚至比强化学习(RL)内部不同类型之间的差别还要大,这是我的第一个观点,第一个暴论。

第二点,说到 Locomotion,目前在这方面最流行的 RL 方法就是仿真到现实强化学习(Sim2Real RL),就是先在虚拟仿真(Simulated)环境里,运用近端策略优化算法(PPO)或者其他类似的算法去训练出一个策略,之后再把这个策略部署到现实世界当中去。

我的第二个“暴论”就是,我认为 Sim2Real RL 是一种基于模型的方法。你想想它的操作流程就能明白,首先得有一个你比较信赖的模型,比如仿真器(Simulator),然后在这个仿真器里训练出一个策略(Policy),之后再把这个策略部署到现实(Real world)当中。

不过我觉得它和 MBC 在两个维度上是不一样的,那它的优势在哪?在我看来,Sim2Real RL 最大的优势,在于其离线计算能力近乎无穷。也就是说,它可以离线从成百上千乃至上万条轨迹(Trajectory)当中去学习策略,有充足的时间去进行优化,从而找到合适的策略。 像 MPC 这类大多数基于模型的控制方法,其实它们所有的算力运用都是在线上的。就是说,我得在线去确定机器人下一步往哪儿走,它并没有离线的算力。

所以我觉得这就是 Sim2Real RL 和 MBC 在算力运用方面第一个主要的不同点,也就是算力到底是用在离线阶段(Offline)还是在线阶段(Online)。“离线”的定义,就是在机器人开始运行之前进行相关运算;而“在线”就是机器人一边运行,一边去计算相应的内容。

然后第二个我觉得 Sim2Real RL 相对 MBC 最大的优势在于,它在一定程度上绕开了状态估计(State estimation)的问题。在传统的控制里,我们一般遵循分离原则(Separate principle),比如说要用模型预测控制(MPC)去控制一个人形机器人,在这之前,大概率得先搞一个状态估计器(State estimator),去估计机器人自身的速度、角速度等物理量。

从某种程度上,在传统控制里,状态估计(Estimation)其实和 Control 一样,都是要面对的问题。说到底,你得清楚机器人所处的状态、得知道机器人此时此刻在什么位置。我觉得在现实世界里,状态估计(Estimation)其实和控制一样,都是要面对的问题,说到底就是得知道机器人的状态,清楚它此刻所在位置。而强化学习(RL)在一定程度上能绕开这个问题,因为它可以同时学习策略(Policy)和状态估计器(State estimator)。

拿目前在 Locomotion 方面最成功、最流行的逻辑来说,师生网络学习(Teacher Student Learning)。自 2020 年 Science Robotics 发布论文“Learning quadrupedal locomotion over challenging terrain(在具有挑战性的地形上学习四足移动)”之后,大概有几千篇文章都遵循这个逻辑,一直到现在,差不多5年时间把师生网络学习推到了顶峰。

师生网络学习是什么意思?就是先在仿真环境(Simulator)里训练出一个所谓的“教师策略(Teacher Policy)”,这个“教师策略”知晓一切,比如它知道仿真器里的所有信息,像地面的各种情况、机器人的速度等等,这些我们称之为特权状态(Privilege state)。 然后,这个“教师策略”(Policy)是没办法直接部署到真机上的,因为在现实中,你没办法知晓地面情况,也不清楚机器人的绝对速度等信息。不过在 RL 里,利用这个“教师策略”后,可以将它提炼到一个叫“学生策略”(Student policy)的东西里,这个“学生策略”的输入是你所能观测到信息的历史记录,也就是“过去 n 步”的相关情况。目前这套方法已经很成熟了。

我觉得,就是因为有这种师生学习框架,所以绕开了状态估计(State estimation)这个问题。相当于在实际应用中,你不需要获取真实的状态,可以直接利用感知信息的历史记录就可以进行控制操作了。 我觉得这两点就是强化学习(RL)最大的优势。

而对于 Control,我认为它也有两大优势。第一点是跟 RL 刚好完全相反。首先,Control 具备在线计算能力。Sim2Real RL 存在的问题是,你在仿真环境里训练出一个策略后,一旦应用到线上,这个策略就固定住了。哪怕这个策略效果很差、很不理想,你也没办法去实时调整它,除非你再去做真实世界的 RL,而且基本上都会受到 Sim2Real GAP 的影响。如果仿真器质量很差的话,那产生的误差就会很大。但 Control 有个很重要的思路,就是可以进行类似 MPC 那样的操作,能够一边让机器人运行,一边进行相应的计算。

Control 的第二个的优势就是它具备很多很不错的结构。现在大部分流行的 RL 算法,其实就是近端策略优化算法(PPO),大家都用它,因为它是同策略(Onpolicy)的,大家也不太在意采样效率。它最终呈现出来的性能表现还算比较好,而且操作起来也相对简单,不过它本身并没有什么特定的结构,这就导致有时候它会收敛到一些我们不想要的状态,比如一些很奇怪的状态。但控制就不一样了,它有很好的结构,能够借此提高采样效率,这就是它的一个优势所在。

我很多研究的核心思路,就是尝试将 RL 与 Control 相结合,例如把 Control 的安全性融入 RL 中,或者借助 Control 良好的结构使强化学习变得更具稳健性。最后,我和前面三位老师有一个共识,最有效的学习方式最终还是要落实在真实世界当中去开展和验证

我对于当前仿真(Simulation)方面的进展并不是特别乐观,因为我始终觉得,开发出一个非常完美的仿真器本身就是极为困难的一件事。我们不能期望能有达到通用人工智能(AGI)水平的仿真器出现,然后凭借它去解决所有问题。所以,一定要以某种方式,在真实世界里去做学习(Learning)才行,只不过我所采取的角度是将 RL 和 Control 相结合去做真实世界里的学习。

王建明:谢谢石老师。我觉得您可以推荐一些您在 RL 和 Control 结合方面的工作,可以让同学们参考学习一下。

石冠亚:好的,我分享几个相关内容吧。

第一个,我做过很多人形机器人相关的工作,其中有一套逻辑是我个人特别喜欢的,那就是别让 RL 直接进行一对一(n to n)的输入输出操作。我觉得当下有不少论文,就是用 RL 去输出比较高层的信息,打个比方,要是去控制一个人形机器人,为什么非得让强化学习(RL)去输出每个电机的扭矩呢?其实可以让它输出一些更高层的信息,比如可以让它输出速度、加速度等信息。 我觉得这是个挺有意思的方向,我有不少相关论文,大家可以搜一下“CAJun”就能找到,也可以直接进入我实验室主页看看那些视频,视频里机器狗跳跃等展示的成果,其实都是基于这个逻辑做出来的。

第二个给大家推荐的一系列工作,是带有“现实到仿真(Real to Sim)”的特点。我没直接做 Sim2Real 的工作,而是先进行 Real to Sim,再做 Sim2Real 。我个人挺看好这个方向,就是不在固定不变的仿真器里学习,而是到现实中获取数据来改进仿真器,之后再基于改进后的仿真器进行学习。 这个方向我觉得也挺不错的,我们近期在这方面也开展了一些工作。

第三个,就是基于 MPC 相关内容。更有意思一点的做法是,我们先学习一个世界模型(World model),然后再利用 MPC 去进行控制操作。这方面我们最近有挺多文章的,比如说 DIAL-MPC 的相关研究挺热门,很多人都在用,因为它的代码相对于传统MPC简单好用很多。我们做了很多关于学习动力学(Learn dynamics)的工作,就是在现实环境里把动力学模型学习出来,之后再运用基于采样的模型预测控制(Sampling-based MPC)去开展后续的 Control。 因为基于采样的模型预测控制算是一种最灵活的 MPC 方法了。

王建明:好的,谢谢石老师。朱老师,我觉得您在国内控制领域实力很强,整个浙大在控制方面也是如此,尤其在关节机器人控制领域经验丰富。从产业化角度看,朱老师所在的云深处近期的工作令人印象深刻,像四足狗、轮足机器人,它们现在很多控制都用 RL。能否请朱老师介绍一下,从传统的 MPC、更早的 ZMP(零力矩点)等方法的使用,到现在使用 RL,这整个过程您有什么感受?另外,对于产业和学术结合方面,您如何看待这两种方法?

朱秋国:早期在机器人上我们大量运用了 MPC +WBC(全身运动控制)这类方法,做了不少相关工作。但从整体效果来看,采用 RL 的方法能更好地展现机器人全身运动能力

MPC 和 WBC 在 RL 出现之前算是比较主流的方式,因为无论是面向人形机器人还是四足机器人,它们的全身模型很复杂,当要去求解这种高维度的最优问题时,不仅需要大量计算,还得保证在线的实时性才行。

所以我们运用 MPC 时,往往会对模型进行简化,也就是处理简化模型的长时域最优化问题。在这个过程中,需要进行建模,比如先将其简化成单刚体模型,复杂一点的话就变成机器人模型。在此基础上,通过预测来保障机器人状态轨迹的可预测性,进而确保机器人的稳定性。但做完简化模型那一步后,大家发现存在问题,因为简化后的模型很难真实反映机器人全身动力学的特点。

于是我们的研究进入了第二阶段,也就是处理复杂模型的短时域最优化问题,就是所谓的全身运动控制(WBC)。在这个阶段,要建立机器人的全身动力学模型,然后计算出当前的最优控制以保证实时性,用全身运动控制(WBC)来弥补模型预测控制(MPC)因简化模型而产生的问题。这项工作确实开展了挺多,也取得了比较好的效果,不过运动的灵活性还是比较固定。我们通过这种方法做出的效果,很难与波士顿动力 Atlas 机器人相媲美,Atlas 呈现出的效果是最好的。

在很多场景下,我们现在用的机器人算法还是以传统的模型预测控制(MPC)加全身运动控制(WBC)这种方式为主,因为这种方式比较稳定、可靠,也容易解释和分析。不过这种方式也会带来一些问题。

第一个问题,比如对于腿足机器人,它的运动模式是足部离散运动,在它跳跃或者行走、跑步的时候,要怎么保持它连续跳跃的稳定性?如果采用传统方法,就会遇到几个问题,像怎么保证机器人在规定时间内接触地面,还有接触地面后怎么保证它能快速响应之类的问题。

要是还用传统的优化方法框架去处理的话,比如把时间纳入到优化问题里,就会发现这个优化问题会变得极为复杂,而且现在大部分人运用这套方法时,往往会忽视这个问题。

第二个问题是,关于触觉感知,怎么能让它在模型预测控制(MPC)起作用前就发挥作用呢?很有可能等检测到相关信息时,机器人就已经摔倒了。这些是我们在使用传统模型控制方法过程中会碰到的一些问题与挑战,有些问题很难解决,甚至根本没办法解决。

那么 RL 还是有它的优势,前面石老师讲过的那些优点我就不赘述了。我觉得 RL 在控制领域里有点类似镇定器,在与环境交互接触的过程中,靠着这样一套强化学习的模型,能够确保机器人稳定可靠。所以现在我们推出的人形机器人、机器狗、轮足机器人,我们实际运用的都是 RL 这套方法。在运用过程中,无论是发挥全身动力学的能力,还是实现全身的协调性,都能展现出更高的灵活性。

所以我们目前主要的研究重点还是放在 RL 上,但这并不意味着基于模型的方法就没用了。在浙大这边的研究中,我们带的研究生已经开始尝试在 RL 技术基础上,融入一些 MPC 的思路或设想,去开展一些更具挑战性的工作。

我觉得从原来单纯用 MPC,到后来使用 RL,再到现在进行 MPC 与 RL 相结合,可能就是在这个领域不断摸索的一个过程。

王建明:那请卢老师先介绍一下,您在强化学习领域深耕多年,能否跟大家分享下您目前在这方面的工作及经验积累?

卢宗青:好的,我先回应一下冠亚刚才提到的问题。首先,无模型强化学习(Model free RL)和 Control 解决的其实是相同的问题,面临的数学问题也是一样的,只不过解法不同罢了。

我一直在从事强化学习相关工作。对于机器人,尤其是人形机器人的解法,我们侧重的角度可能和大家不太一样。从人的角度来看,我们更多基于一种分层的假设框架,在高层可能更多涉及姿态方面的调控,或者说并非传统意义的控制,而是通过姿态去影响,而在下层,比如低层级策略,去进行具体的控制操作,好比针对人形机器人,就是过控制电机或其他控制量来实现相应姿态。

所以我们更关注与物理世界的交互,而在交互过程中需要融入视觉信息。毕竟人在控制自身身体时,会融入大量视觉信息,还有触觉信息等各类从外部能感知到的信息。也就是人形机器人如何与物理世界进行交互。

而且就人形机器人而言,我们可以利用大量与人相关的数据,包含互联网上能获取到的视频等资料。那如何依据这些数据让机器人实现对自身身体的控制?对于下层策略来说,不管是运用近端策略优化算法(PPO)在仿真器里训练,还是采用模型预测控制(MPC)的方法,只要能达成上层所给出的目标就行。我觉得这样的思路或许更容易构建出一套系统,从而更好地解决相关问题。

对于 Locomotion,目前多数情况下,不管是用 RL 还是 MPC 的方法去处理,解决的都是同样的问题。但我觉得其中更关键的是,怎样融入额外的模块,以此来考量物理世界中的相关信息。另外,就物理世界中的信息而言,学习动力学(Learning Dynamics)可能是相当困难的事。像其他学者提到的构建世界模型,要想在视觉层面以及触觉层面真的构建出一个完整的仿真器或者世界模型,我认为难度很大。所以从我的角度来看,在现实世界中去学习或许会更好一些。

Manipulation 之所以用 RL

王建明:好的,谢谢卢老师。刚才三位嘉宾的讨论多聚焦在 Locomotion 方面,接下来我们探讨一下操作方面 RL 和 Control 的相关内容。请罗剑岚博士介绍一下这七八年来在这条路径上的情况。

罗剑岚:大家刚才都在聊 Control,我本身也是控制背景出身,虽说现在不写控制方面的论文了,但也接受过完整的相关训练。我觉得控制是非常有效的,它的有效性已经体现在我们生活的方方面面了。汽车需要运用控制,我们靠着控制技术把人送上了月球。就好像如今我们做科研也不会再去专门引用牛顿三大定律了,因为它已然是既定存在且确实有效的。

我们具体把控制放到机器人这个范畴里来看,其实很多方面是存在不少问题的。因为就像冠亚所说,机器人是一个很大的系统,你可以说汽车是一种机器人,飞机也是机器人,腿足机器人同样是机器人,机械臂做操控也是一种机器人技术。这涉及到的很多问题都不一样,无论是无模型(Model-free),还是基于模型(Model-based),都需要具体问题具体分析。

总体来讲,大家可能主要在做三件事,第一个是导航(Navigation),第二个是移动(Locomotion), 第三就是操作(Manipulation)。我们探讨的这些方法论,要是套用到这三个不同的问题、不同的情境当中,那实际上是在说不同的事。

比如刚才冠亚提到的端到端,在这三个问题里,它的表述其实是不一样的。比如说针对导航做端到端,我不知道该怎么做,感觉要是把整个地球都绘制一遍地图来做,那这肯定不行的。应该是通过视觉基础模型获取语义信息,接着进行地图构建、同时运用即时定位与地图构建(SLAM)等技术。

而对于 Locomotion,这是个很有意思的问题,大家刚才一直在说仿真器之类的工作,从本质上讲,这其实意味着要对物理规律进行逆向推导。 “在对物理规律进行采样时,其实就是在做基于模型的控制”,对于这个观点,我其实挺认同的。 仿真器提供了一个更好的计算工具,但它并不能直接给出一个策略(Policy),得使用优化器(Optimizer)才会有相应的策略。

然后再来说说 Manipulation 方面,这其实是另一个问题了。在机器人学里存在一个著名的悖论,叫莫拉维克悖论(Moravec's Paradox)。它所阐述的内容是这样的:回顾50年的人工智能发展历史,我们会发现,对人类而言简单的事,让机器去做却很难;而那些人类做起来难度较大的事,机器人操作起来反倒简单。比如,我们能够教会机器下围棋,像 IBM 的深蓝早在 20 年前就可以下棋了,后来 AlphaGo 打败了李世石。然而,像拿起水杯这类在人类眼中极为简单的动作,对于机器来说却异常困难。针对这一现象,有着诸多解释和争论。

之所以会出现这种情况,是因为人类历经了数十亿年的漫长进化,而数字化以及真正拥有智能,其实是相对较近几千年才发生的事。所以,让机器掌握相应的动作(Movement),要比让它获得推理能力(Reasoning)以及内在的推理智能难得多。不管怎么说,这实际上就是操作(Manipulation)需要解决的核心问题。我们怎样才能让机器人像人类一样去操控,去与物理世界进行交互,并且能可靠地完成这些事。

在这里,无论是端到端的方法,还是其他方法,与之前提到的导航(Navigation)或移动(Locomotion)其实存在一些显著的不同。为什么这么说呢?因为在操作任务中,通常会涉及到一些具体的物品和任务情境。比如,当你有一个机器人,它的前方往往会有一个相对固定的工作区域。无论是移动机器人,还是其他类型的机器人,通常需要先通过局部运动等方式导航(Navigate)到指定的位置。之后,在这个固定空间里,不论是工厂、家庭,还是其他应用场景,机器人面前的物体尺寸和任务范围一般是相对确定的。

在这种情况下,使用端到端的方法是有一定成功概率的,因为机器人的工作范围是有限的。在一个固定的工作区域中,不管是在工厂、家庭,还是其他场景,机器人面前的物体尺寸和任务范围通常是相对确定的。这种环境特点使得端到端方法能够在特定任务上表现出一定的效果。然而,这种成功依赖于对特定环境的数据训练和验证,确保模型在有限范围内具备可靠性和鲁棒性。

我不太容易陷入关于到底是端到端还是非端到端的争论中。我可能更关注这个问题究竟要如何才能被解决。至于是不是端到端,我们可以想想这样一件事,Jeff Hinton 在他 2018 年的图灵奖演讲上,说了这么一句话。他说最开始的语音系统,如果你想用一个神经网络去替代系统中的一部分,那这个神经网络会慢慢地把其他部分侵蚀掉,然后开始在整个系统里循环运转、不断扩张,就如同杆菌那样,会把系统的其他部分也全都“吃”掉,最终整个系统就完全变成由神经网络主导的样子了。

但是即便如此,我的重点在于,对于 Manipulation 而言,实际上是可以学到这样一个策略的。端到端的优势在于没有中间的偏差,并且可以直接针对目标进行优化。而且,Manipulation 为我们提供了这样的环境和设置来做这件事,实际上可以使所有情况都适配到。

现在我们再回到这个问题:我们为什么要使用真实世界的数据呢?我们先抛开那些非常具体的技术问题,先来思考一些基本的问题。今天研讨会的主题是如何将机器人的可靠性逼近到 99.9% 或者 100%。我们可以思考的一个问题是:机器人为什么达不到 100% 呢?

既然达不到 100%,这就意味着我们的模型、或者其他什么东西也好,和实际环境是存在一定差距的。只有缩小这个差距,才有可能达到 100%。那么,在一个存在未知信息的环境中,要如何缩小这个差距?除了和这个环境进行交互,把未知信息获取回来,然后以某种方式进行优化之外,没有别的办法。这是最通用、最具扩展性的方法。

你可以说我们能够设计一些东西来满足特定需求,然后构建一些模型,让它们去适配一两个特定的任务。就好比如今我们有这类专用模型,它就专门负责做一件事,速度特别快,而且成功率能达到 100%。

但要是有 1000 个任务、1 万个任务等等情况的话,那不可能每个任务都按这样的方式去做。尤其是我们现在想要的是通用型、带机械臂的机器人去执行任务的话,虽然各个任务具体细节或许不一样,但总体的基本逻辑都是一样,你得先有一个初始的设想、猜测,然后再与跟环境进行交互,最终把那些缺失的部分补上。

通过某种方式来构建这样的机制,比如说 RL,确切来讲就是强化学习的定义所描述的那样,具体如何操作,我们有很多种做法,有人说要用基于模型的强化学习(Model-based RL),有人说用无模型的强化学习(Model-free RL)。其实我可能不会特别倾向于其中某一种,它们各有各的长处。

总结一下,先说说为什么要采用 RL。在现实世界里,要实现高性能的操作并达到高可靠性,对于每一个环境来说,最通用、最具扩展性的办法必然是强化学习。而且它并非是一种被动的数据学习,不是简单地去收集一些离线数据就可以了。如果想要达到100%的可靠性,那就一定要与环境进行交互,而要实现与环境交互,就必须得运用强化学习,这是比较基本的逻辑。

在 Manipulation 领域选择强化学习而非传统控制,有着深刻的原因。今天我们讨论的一个重要主题是 Manipulation 和 Locomotion 的对比,这两者在本质上是完全不同的问题。

对于 Locomotion,主要的挑战在于机器人本体的不确定性。这种不确定性相对有限,例如机器人可能踩到石子,或者路面出现打滑等情况。从机器人本体的角度来看,这些不确定性的影响是可以量化的。在控制领域,我们有一整套数学工具来应对这些问题,其中之一就是鲁棒控制(Robust control)。鲁棒控制的核心思想是对不确定性进行定量建模,进而确定最坏情况的界限(Worst-case bound)。只要实际的不确定性在这个界限范围内,设计出的控制策略就是有效的。

然而,Manipulation 的情况则完全不同。Manipulation 的主要挑战来自外部世界的不确定性,而不是机器人本体的不确定性。机器人本体是一个经过精心设计的确定性系统,但外部世界的复杂性是无限的(Unbounded complexity)。这些不确定性可能来自视觉、物理交互、触觉感知等多个方面,而对这些因素进行全面、精确的建模几乎是不可能的。尽管我们可以对其中的某些部分进行建模,取得一些成果,但始终无法完全掌控这些外部复杂性。

这正是 Manipulation 问题需要强化学习(RL)的原因所在。RL 通过与外界的交互,能够更好地适应外部环境中的不确定性。从本质上来说,Manipulation 和 Locomotion 是两类截然不同的问题:Locomotion 可以通过控制理论中现有的工具(如鲁棒控制)较好地解决,而 Manipulation 则需要通过 RL 等数据驱动的方式,去应对外部世界的复杂性和不确定性。

Manipulation 路线之争

王建明:接下来谈谈商用以及机器人本身落地可靠性的问题。我们可以从 Manipulation 方面开始说起。

在 Locomotion 方面,虽说有不同的方法和途径,但大家的共识程度还是比较高。 但在 Manipulation 方向上,由于操作任务的复杂度、面临环境的复杂度以及路线选择方面的情况都更为多样。

目前技术路线不一,我留意到主要有几个,首先是模仿学习加真机的路线,像以扩散策略(Diffusion policy)或者其他以 Aloha 为代表的模仿学习路线,能产生一系列比较好用的策略(Policy);其次是罗博士近期一系列工作所代表的 RL+真机的路线;第三是 RL+仿真来解决操作问题的路线;还有一条是对仿真进行优化,比如添加一些可微的元素进去,例如通过可微分模拟的方式来构建虚拟环境的世界模型。

石冠亚:我一直有个比较大胆的暴论,我觉得彻底解决机器人的操作问题其实和解决 AGI 没有区别。

打个比方,就拿“开”这个动作来说,像开瓶子、开杯子、开可乐、开门,虽然都用“开”这一表述,但实际的动作完全不一样。我觉得要是有一个策略(Policy)能解决“打开任何东西”这个问题,那它和 AGI 就没什么区别了。

而且,从衡量指标来看,我个人很容易分不清到底是因为任务选得好,所以效果不错,还是因为方法本身确实有了一些实质性的突破。

另外,我特别赞同刚才说的那几个分类。不谈利弊,我可以跟大家讲讲我对它们的看法。

我觉得第一类属于“大力出奇迹”的做法。就是先收集大量的演示数据(Demonstration),然后采用行为克隆的方式。其实现在做离线强化学习的人挺少的,大家普遍都是直接进行行为克隆。刚才提到的扩散策略、ALOHA,还有近期在物理智能层面的 Pi 0,都是遵循这一个逻辑。

第二类 Sim2Real,采用这种方式的人相对少一些,但我觉得还是挺有意思的。其中最有名的应该就是 2019 年 OpenAI 做的用 Sim2Real 方式转魔方的项目。

第三类,有很多微调相关的做法,就是先进行预训练,然后再做微调之类的操作。

另外第四类,你之前没提到,我可以补充一下,就是用传统控制来做验证的情况其实也是存在的。不过它最大的问题就是不太能泛化。比如说,你要是设计了一个转笔的策略(policy),可能就只能转某一种特定的笔,要是笔的质量变为原来的2倍、长度变为原来的2倍,可能就没办法转了。

第五类是基于模型的方法,感觉这类比较小众。就是先学习一个模型,然后再去做控制。就像剑岚说的,它的难点在于你不仅要预测状态、帮助预测目标数据,而且做建模本身就很困难。这类工作虽然小众,但确实存在。我知道像加州理工学院(Caltech)、麻省理工学院(MIT)有人在做,他们研究诸如粒子动力学(Particle Dynamics)之类的内容,然后基于此开展工作。

罗剑岚:我也来谈谈自己的看法吧。如果我们想要实现 AGI,要对人类智能进行逆向工程,那所需的计算能力,单是用来处理人类的各种动作行为,几乎就是无穷无尽的。

就 Control 方法用于 Manipulation 来说,它存在不少问题。在机器人学刚开始形成一门学科、逐渐兴起的时候,那时并没有视觉相关的技术,就如同处在“盲人摸象”的状况里。从理论构建角度看,控制的核心是 HJB 方程,该方程要求输入的数据起码得是可微的,或者说要相对平滑,理想状态下要比上一时刻更平滑才行。

然而,要是遇到高维度并且不平滑的输入感知数据时,与之相关的那些理论基础就会出现状况,HJB 就会失去作用,如此一来,控制的基础也就被动摇了。一旦出现这种情况,不管在何种场景下,控制方法基本上就没办法发挥作用、失效了。

而机器人操作(Manipulation)必然是涉及感知这一要素的。如果你要处理感知相关的问题,就目前来看,最好的办法是通过学习(Learning)的方式。既然操作(Manipulation)是需要感知参与的,那么操作就必然要借助学习了。

不过,这并不是说控制(Control)就完全没有作用了。就拿现在机器人应用中一个比较大的话题来说吧,比如在码头场景下,有体型巨大的机器人要完成搬运货物的任务,可能是四五个机器人一起协作,把货物从里面取出来、然后再放上去。在这种情况下,我们应该运用运动规划(Motion Planning)的方法。并且,我们不但要采用目前最快、最好的在线运动规划模型,还要利用相关验证机制,把这些运动规划都逐一验证一遍,确保其准确性达到100%才行。要是不这样做的话,就很容易出现机器人之间相互碰撞,或者机器人误伤人之类的严重情况。

再说回操作。我们说的是那种有机械臂的机器人,它前方有一个工作区域,区域里有一些物体需要进行操作。看上去策略学习在这种情况下并没有那种特别复杂、特别难处理的动力学问题,但关键在于,如果我们能够解决其中哪怕仅仅 5% 或者 10% 的问题,那对于我们实现机器人走进千家万户的梦想来说,都会是一个很大的进步,机器人也会变得非常有用了。

第二点,来谈谈仿真的问题。我觉得当前存在一个比较突出的点,就是如果我们采用基于学习的操作方法,涉及到仿真与实际应用这两方面对比的时候,会出现这样一种情况:由于机器人目前还没有被大规模部署,所以就没办法获取到足够多的实际数据,进而也就难以开发出更好的模型

当大家围绕“操作”这个核心进行讨论时,有人会说,操作能够生成大量的数据。但要是采用仿真的话,其难点就在于要把仿真做得准确、完善。

我并不是仿真方面的专家,所以只能从一些比较基本的原理角度出发。这就好比,要去做仿真就相当于要去模拟整个宇宙。可要是我们有真实的数据的话,我们要做的其实就是构造一个机器人的大脑。而宇宙是包含了大脑的,建一个宇宙比建一个大脑要难得多,所以我们应该先去建大脑。

以特斯拉为例。特斯拉一开始在车辆投入使用前,可能还面临数据不足之类的情况,可一旦它的车跑起来之后,情况就大不一样了。我昨天还看了些相关数据,特斯拉现在一年生产出来的真实行驶数据能达到 500 亿里程,这时它面临的问题根本不是有没有数据了,而是这些数据多得完全存不下,他们现在都没有足够的硬盘去存储这些来自各个摄像头等渠道的数据。

我们现在思考相关问题,总是想着仿真器能够生成海量的数据,可实际上,真实世界里像特斯拉这样的公司产生的数据量都已经大到难以处理了,关键问题在于:我们要拿这些数据怎么办。我们应该是思考怎么去利用好这些数据,而不是仅仅着眼于仿真器能生成多少数据

我确实觉得仿真是非常有用的。如果今天要开一家自动驾驶公司,要是有人跟我说不打算构建仿真器,那我肯定得问问这是为什么,因为没有仿真器的话,软件集成之类的工作根本没办法开展,整个业务流程也会难以运转起来。仿真器对于像抓取放置(Pick and Place)这类相对简单些的、涉及运动学(Kinematic)的操作问题还是挺有帮助的。

不过,操作(Manipulation)问题的核心在于,一方面,我们得先处理好视觉输入;另一方面,我们还要处理非常复杂的物理相关情况,像物体之间的接触、流体的影响以及物体的变形等等复杂因素。与其费很大力气去构造一个像模拟整个宇宙那样复杂又庞大的仿真,还不如利用真实的数据,用真实数据就不存在任何的 GAP,然后再去深入思考怎样基于这些真实数据来制定出更好的策略,这就是我比较核心的一个观点了。

石冠亚:我非常认同剑岚的这个观点。哪怕是人也是如此。我们平时叠衣服、叠被子,我们之所以能做到这些,绝对不是因为我们会去求解纳维-斯托克斯方程。我们端起一杯水的时候,我们也不清楚这杯水具体的动力学原理。人在进行这些操作的时候,往往是凭借着直觉来更好地利用经验和感觉的。

说到仿真器,很多时候它其实是有点“用力过猛”了,做了过度的模拟(Overkill)。我们没必要去模拟所有的东西,只需要模拟那种凭直觉就能把握的、关键的部分就可以了,这其实也和 Locomotion 相关联。

那为什么局部运动在现有的框架里是可行的呢?这是因为目前它基本上只处理到了一类仿真相关的问题,就是刚体动力学方面的问题,它其实并没有过多涉及到像流体、颗粒材料等等更复杂的情况。

罗剑岚:谈到直觉物理学,其实在操控(Manipulation)任务中是个很有意思的话题。换个角度来看,操控通常存在于一个较低维度的流形(Manifold)中,也就是说,我们并不需要真正去解那些复杂的物理方程。例如,许多动态操作场景,比如鞭子的挥动、筋膜的运动等,实际上几乎无法用传统方法去求解,因为它们涉及非常复杂的偏微分方程(PDE),而这些问题本身的求解难度极高。

如果尝试在偏微分方程的外环上进行优化,再在线上进行实时计算,这种方法在人类操作中显然是不现实的。我可以肯定,人类的大脑并不是通过求解偏微分方程来完成这些任务的。相反,人类依赖的是一种直觉物理(Intuitive physics),这种能力是通过与环境的长期交互逐步形成的。比如,当你看到某个物体的位置,伸手去拿,或者在某处翻找,这些动作看似简单,却反映了人类对物理世界的直觉理解。

事实上,这种能力的形成远早于现代科学的发展。几万年前,人类已经可以钻木取火、拉弓射箭,而现代科学和数学体系的建立不过近 300 年的事情。当时,我们既没有偏微分方程,也没有用抽象的数学工具去理解世界。由此可见,人类大脑在操控和操作中一定不是通过解偏微分方程来实现的,而是通过直觉与环境交互形成了一种与物理世界高效对接的能力

我们再来谈谈模仿学习和强化学习,我觉得这两者并非是完全相互排斥的。模仿学习能够给我们一个很好的起始点,但如果要达到 100% 的成功率,那就必须得用强化学习了,也就是要和环境进行交互,把最后的那部分性能提升上去。

而且我们从现在的相关工作中也能看到,强化学习其实原本是需要大量数据的。不过最新的成果显示,它其实只需要和真实场景交互 1 到 2 个小时就行了,并且我相信在未来,连这 1 到 2 个小时都不需要,因为很多时候它是在弄清楚一些非常基础的操作能力,一旦我们有了预训练,这个时间可能会缩短到 20 分钟。

最后我再补充一点。我们为什么要把某个指标逼近到 99.9% 呢?

如今部署在全球的机器人大概有 500 万台,其中 95% 都是位置控制型的,它们就跟“瞎子”一样,只是简单地重复编码好的程序。它们就是固定地从 A 点移动到 B 点再到 C 点,从1961年通用汽车发明了第一条生产线起,一直到现在,我们所做的不过是在原有基础上进行了一些优化,从根本上来说,其实并没有太大的改变。

要想真正发挥作用,成功率实际上得是百分之百才行,99% 都太低了。每一次出现故障、失败都是有成本的。要是在生产线上,成本体现就是整个生产线得停下来,直接反映就是你的资金收益在减少,得有人去弥补这个损失成本。

有人可能会讲,你说的是工业机器人需要百分百的成功率,可家庭机器人有个百分之七八十的成功率就够了 。其实我也思考过这个问题,我可以举个很形象的例子。就在昨天,我去伯克利的体育馆打球,那儿有个自动售卖机器人卖水,用的时候就是把信用卡贴上去,它就会把水拿出来递给你。我过去这一个月里经常去那儿,可昨天我把卡贴上去后,水本应该从出口出来的,结果却掉下去了,而且我还没办法把水取出来,这就产生了成本,明码标价就是那瓶水的价格,2.75 美元。所以说,这不是没成本,任何情况都是有成本的

大家再想象一下,要是星巴克的机器人每 5 个小时就把咖啡洒地上一次,又或者家里的机器人每周都把厨房的杯子、盘子之类的东西往地上摔一次,这些都是损失,毕竟这都是在和物理世界做交互。我倒不是说我们就别去做家用机器人了、只搞工业机器人。我觉得当下是处于一个比较关键的阶段,在急切需要半约束、受约束的环境里,这样的环境能让我们去研发解决方案,探索新的科学成果。等我们把相关问题弄明白了,或许就能把成果拓展到家用机器人等领域了。而且家用机器人还涉及数据收集以及隐私方面的问题,毕竟谁也不想家里的机器人在自己睡觉或者做别的事情的时候盯着自己,或是把数据传回去用于训练。

所以我觉得,我们现在所处的这个阶段真的是首次开始系统、全面地去思考一种比较通用的解决方案,未来咱们不用太担心数据方面的问题,数据会像飞轮转起来一样不断积累、运转起来。那一旦到了那个阶段,我们该怎么去思考这 99.9% 成功率的问题呢?那肯定得是强化学习和模仿学习相结合才行,这两者并不是完全相互排斥的关系,关键是一定要和环境进行交互,它是动态变化的,而不是静态的。

  机器人可靠性难以衡量

王建明:好的,谢谢罗博士。卢老师,您一直研究强化学习,对于人形机器人的 RL,还有您刚才提及的引入物理交互和视觉交互的内容,您可以详细讲讲这套方法吗?或者您认为强化学习对人形机器人控制的可靠性方面,未来会以怎样的速度迭代?

卢宗青:我先聊聊刚才提到的 Manipulation 方面的事。今年我们在操控方面做了不少工作,先是在模拟器里用强化学习进行训练。我发现只要把问题定义清晰了,强化学习是比较容易解决问题的,当然这里指的是给手部添加触觉信息的情况。

不过在模拟器里训练出的强化学习策略,解决不了实际问题。因为我们发现训练完后,模拟器里大多是基于点云的,但是很难泛化。真机采集的点云和模拟器里看到的点云完全不一样,所以在我看来,Sim2Real 的 gap 比较难解决。

但是这项工作有个启示,给我们传递了一个比较重要的信息:机器人要是具备触觉信息,完成 Manipulation 任务就会更容易些。我觉得这也是个比较直观的见解,毕竟盲人也能完成各种各样的操控任务。

不过我认为,对于 Manipulation 来说,就像刚才冠亚讲的,这本身就是个大难题。其实对于某个特定的问题,不管是模拟器、Sim2Real,还是真机+RL,都能比较好地解决这个特定问题。最关键的是泛化问题,就是我要怎么得到一个策略,让它可以完成各种各样的操控任务呢?在我看来,这是非常难的。而且对于这个问题,目前来看,很难有数据来驱动这样一个模型的学习,这是比较关键的点。

所以对于你刚才问到的人形机器人相关内容,人形机器人有两条胳膊、两只手,我们解决相关问题采取两步走的方式,因为目前我们没有从机器人端采集下来的数据,或者说数据量没那么多。我们前期会利用人的数据去生成人的姿态,输入是视觉信息,输出就是姿态。我们把这一步称作“预训练”,也就是用互联网上大量但质量不算高的数据去训练模型,使其输出手部的姿态。然后再依据一些真机的数据,比如遥操采集的数据,去做后训练(Post training),以此来实现泛化性。

我觉得这是在刚才提到的四条技术路线之外,另外一条可行且值得尝试的技术路线。这条路线主要聚焦在泛化性上,而不只是着眼于如何完成某个 Manipulation 任务的思路。

王建明:您如何看待人形机器人达到 99% 以上可靠性这一问题?还有,它未来的发展路径和周期是怎样的?

卢宗青:我个人觉得,要是依靠模仿学习、强化学习这些方法,人形机器人不太可能达到 99% 以上的可靠性。就好比人去抓东西,可能抓一万次也会有一次失误。毕竟它不像工业机器人处于固定场景中,我希望看到的具身 AI 的应用,肯定是在开放场景里的应用。就像剑岚刚才说的,不同场景下的产品有不一样的需求,在有些情况下,可能百分之七八十的成功率就够了。

另外,对于我们这套技术方案而言,RL 主要是为了执行上层模块给出的指令,不管是姿态(Pose)也好,普通指令也好,本质上是用于控制电机之类的控制量。所以在我看来,它的完成度并非特别关键,反而更上层的高层次策略或者像姿态生成模型这类做法,怎样达到较高可靠性才更重要。

下层的 RL 策略,即便去训练,也就是那样一个结果,在最佳情况下,能找到一个最优策略(Optimal policy),可它的上限是由给定的问题本身决定的。至于怎么去给出这个问题,可能是我们需要进一步思考的地方。

王建明: 关于可靠性,也想听听朱老师的想法。您如何看待目前四足机器人的可靠性?在为客户部署机器人时,传统控制和强化学习哪个用得多?您之前也提到人形机器人 10 年前走出实验室很难,我们现在期望人形机器人能稳定完成一些任务。

朱秋国:关于可靠性这个问题,从学术界角度看,很难将一种方法在实验中的可靠性(比如达到 99% 或者 90%)直接套用到产业产品中。我想其他老师也会认同这一点,因为实验数据和实际应用中的可靠性不太一样。

就产品可靠性而言,我认为可以分为几个阶段,其中包括我们内部也在讨论的机器人本身硬件的可靠性问题,我们经常会提到一个“无故障运行时间”的概念。

“无故障运行时间”是评判机器人是否稳定可靠的关键指标。比如在电力巡检场景中,客户要求机器人在三个月内不能出一次问题。

那如何评判机器人的稳定可靠性呢?正如几位老师所讲,主要涉及几个方面。一是硬件本身的问题,对于机器人而言,连接的部件、关节越多越复杂,出问题的概率就越大。所以要让复杂的人形或四足机器狗在行业应用中长久保持稳定,就得提高硬件本身的可靠性。而在提高可靠性方面,首要解决的就是系统本身的可靠性问题,像机械结构、电控系统以及底层软件系统能否长期稳定可靠,这是个很大的挑战。

到了第二步,我们会更关注软件算法层面的问题,比如基于传统方法和基于模型的方法。从理论上讲,只要代码没写错,基本不会出什么问题。但要是结合其他算法,比如在机器人完成自主导航时,要让它实现精准定位,情况就不一样了。

这里面就存在挑战,因为算法本身还要解决环境动态变化,像随季节改变等环境变化时的适应性问题。所以,第二步可能要着重解决软件算法层面对于可靠性的评估问题。由此可见,产业界做可靠性和之前讲的情况不太一样,这是我们目前遇到的主要问题。

另外,关于四足机器人用 RL 还是 Control 的问题,目前更多还是用 Control 方法来进行实际运行操作。不过,现在我们已经开始逐渐尝试,尤其是面对 Locomotion 能力提升的情况,我们在想办法把 RL 方法结合进来,不管是传统的 SLAM 方法,还是新型的 Position+Navigation 这类方法,都在做相应部署。到今年年底,我们会试着在相对固定的环境中,采用 RL 方法去适应不同地形等应用场景。

但我们面临的一个关键挑战是,在这种场景下,如果机器人出现翻倒或其他问题,那要如何确保机器人不去破坏原场景,不碰坏周边的瓶瓶罐罐?我们考虑或许得引入 RL 或者一些规则进去,这样当机器人出现上述状况时,就能保证它不会产生额外风险,进而确保机器人在场景应用中的安全性。

从应用角度看,四足机器人发展到现在已经没什么本质问题了。就运动能力而言,虽说有时会展示一些极限运动能力,像从几米高的地方跳下来还能保持稳定,但从应用层面来讲,其实并不需要这么酷炫的动作。所以在我看来,当下四足机器人的 Locomotion 能力,已经可以满足很多场景下的运动需求了,这方面是没问题的。

刚才卢老师说得很对,人形机器人的关节复杂度更高,四足机器人就 12 个关节,人形机器人却有几十个关节。在应用过程中,如何保证其本身的稳定性是个很大的挑战。所以人形机器人确实还需要更长时间去发展。我跟很多人聊这个问题时,大家常常迫切希望看到人形机器人能在现实生活中应用起来,但我觉得这得循序渐进,得先看人形机器人适合在哪些场景中应用。

比如现在把人形机器人提供给高校老师当作课题科研平台,这是没问题的。让它站在咖啡机前给大家倒杯咖啡,或许也还行。但要是让它走进家庭、走向工业真正投入应用,我觉得还有很长的路要走,这会是个不断持续迭代的过程。不管是硬件层面,还是刚才提到的算法层面,特别是 Manipulation 层面,都得用更长远的眼光去看待人形机器人的应用问题。

王建明:好的,谢谢朱老师。石老师如何看待当下人形机器人在控制方面迭代的速度呢?我看你们有不少相关工作是关于 H2O、OmniH2O 方面,通过这些工作如何看待目前四足和人形机器人控制的可靠性问题?

石冠亚:我们做 Humanoid sim2real 相关工作大概有一年半了,MPC、RL 方面的工作也都做了,所以对人形机器人的可靠性挺有感触的。

我很认同朱老师刚才的观点,尤其是他对于当下哪些任务能实现、哪些任务可能还得等很多年的判断。我再补充几点:第一,Safe 和 RL 一样,是个很宽泛的概念,不能一概而论,Safe 有多个维度。最底层的是硬件的可靠性、稳定性,这非常重要。比如 Chris Atkeson 教授,他是电影《超能陆战队》里大白机器人原型的创作者,他认为除非做成大白那种机器人,否则 Safe 是不可能实现的,意思就是要实现安全,得让硬件本身就安全,无论怎么折腾都不会伤人,这和算法没关系,更多是结构、设计上怎么做到柔顺性(Compliance)之类的。

第二,很多人也在讨论,Safe 本身是一方面,另一方面是 Recover,也就是兜底。我觉得现在对很多机器人来说,Recover 可能比 Safe 本身还难。像波士顿动力与现代的合作、Agility Robotics 的产品 Digit 与亚马逊仓储的合作,还有 Figure 与宝马的合作,我觉得对它们而言,机器人摔倒这事的影响,远不如摔倒后爬不起来的影响大,它们目前的痛点就在没有兜底,机器人摔倒后不容易爬起来。而四足机器人现在有相对成熟的方案,本身就很稳定,即便有点趔趄甚至摔倒了,也能很快爬起来,人形机器人之前在兜底这块就比较困难,这都是不同维度的情况。

另外,谈 Safe 就跟谈毒性不能抛开剂量一样,抛开泛化性、成本谈 Safe 也不合理,到底要达到百分之多少的安全程度呢?一方面得看任务是不是对安全性要求极高,比如 Space X 火箭回收的安全要求肯定和其他机器人不一样。另一方面,泛化性也很重要,我很认同朱老师的判断,像一些简单任务,不需要很强的泛化性,比如在户外走走,只做 Locomotion,或者重复性任务,比如不停地给客人端咖啡,以现在的技术是比较有望打造出可靠系统的。

中间那层我称之为面向企业(ToB)应用,区别于面向消费者(ToC),机器人在企业应用中,像在工厂造车之类的场景,需要一定的泛化性,但又不需要特别强的泛化性。比如宝马与 Figure 合作中,机器人只需不断安装电池,安装电池虽有五个步骤,可能存在一些不确定性,但这些不确定性是可以控制住的。 然后车型是有限的,比如装宝马的七八个车型,我觉得在短期未来,从安全性角度这是可以去追求的方向。

但要是问什么时候能把人形机器人放进千家万户,让它完成各种不同任务,像扫地、看孩子、做饭,还要求达到 99.999% 的安全程度,我觉得目前技术还达不到,我们还有两三个问题没解决,哪怕是人可能也较难做到这点。

要是问我期望的技术路线,我不太相信 One Shot Safe,就是部署了就百分百安全。我觉得在现实世界中得有纠错机制,刚部署时可能还是会出些问题,这里我指的是在开放环境里机器人怎么实现安全,目前我们还没找到解决方案。我畅想的解决方案是,一开始可能会有不安全的时候,或许可以加入人工干预环节(Human in the loop),比如让人帮忙做些标注等,然后它能渐近性地(asymptolically)越来越好,我觉得渐近性安全(asymptotically safe)是目前我们能期望的最好状态了。

最后,Safe 还有另外一层含义,很多做安全性研究的人,是有比较特定的、可以验证的,类似创建规则那样的安全概念,这种 Safe 我们现在是有工具去实现的,比如规定机器人不能撞到物体,这种情况下,像可达性(reachability)等很多控制理论的工具就能拿来用了。

关于人形机器人的 Safe 问题,很多时候没办法给出一个明确的 Safe 定义。比如我们之前聊的很多 Manipulation 的例子,像开门,什么叫不安全的开门呢?可以列出一万种不同的故障情况,所以我觉得这很难定义。

总结来说,首先硬件的安全很重要;其次,兜底恢复能力(Feel safe)很重要,有时候在很多场景里它比安全本身还关键;第三,谈安全一定要结合场景对泛化性的需求程度。最后,我们课题组做的很多工作,包括很多控制器(Controller)相关工作,其实是针对比较特定的、可验证的、像创建规则里涉及的机器人碰撞这类安全问题,而很多操控方面的安全是没办法这么去定义的。

Make RL Great Again

王建明:对于刚才探讨的那些话题,各位老师看看还有没有要补充的呢?

石冠亚:我能不能问其他老师几个问题?机会难得。其实我有个思索已久的问题,我感觉现在 RL 算法本身的更新近乎停滞了。我想讨论一下 RL 算法本身还有没有创新空间?我一直觉得这些 RL 算法并不是专门为机器人设计的,它们太通用了。为什么 PPO 既可以用于语言模型的人类反馈强化学习(RHF),又能用于机器人学习呢?这本身不就有点奇怪吗?包括对于学生而言,我们还要不要去做一些强化学习算法的基础研究,去找到一种特别适合机器人领域的 RL 算法呢?

卢宗青:我先来回答一下。就像冠亚刚才说的,目前在 RL 算法层面的研究确实不多,从 PPO 到 SAC 之后,没有特别大的进展。在我看来,RL 本质上是一个 MDP,我们思考的是用什么方法来解决这个数学问题,所以它本身就是比较通用的的数学方法表述(Math method formulation)。

从数学角度讲,它是在实践中比较好的解决算法。比如 PPO 在实践中就是比较好的方法,实际上它是策略梯度(Policy grading)加上价值函数(Radio function)这样一种演员 - 评论家(Atercritic)框架。

对于机器人来说,能不能设计出一个好的强化学习方法呢?我觉得可以从机器人学习的特性角度出发来进行设计。我个人认为是可行的。因为机器人的一些约束条件(Constrain)和我们通常研究算法、做实验时的约束条件是不同的。如果把这些约束条件考虑到算法设计中,肯定会产生一些差异。就像剑岚做的 Real world 的强化学习,和已有的方法肯定不一样,它结合了离线(Offline)和在线(Online)的方法来做机器人学习。

总的来说,从强化学习算法角度,要得到一个特别好的通用算法是比较难的。但对于机器人学习而言,我们能否更好地定制一个针对机器人学习的强化学习算法,我觉得还有很多可以探索的空间。

罗剑岚:我谈谈自己的理解。 2017、2018 年的时候我就觉得别去搞 MuJoCo,因为没有解决实际问题。我们当时的问题就是为什么在 PPO 和 SAC 之后,没有新的算法出来?或许得看看 PPO 和 SAC 是怎么被发明出来的。当时它们是为了解决一些根本性问题,像在 MuJoCo 里小人跑不起来、Humanoid 站不起来这类问题,等这些问题解决了,MuJoCo 基准测试(Benchmark)被攻克了,自然就没新算法出现了。

所以我更多地在想,要是再有进展,一定要从根本上想清楚我们要解决的核心问题是什么。要是真有下一轮强化学习基准测试的突破、面临重大挑战时,得先想好要解决什么样的大问题,别重蹈覆辙。

具体到这个问题上,RL的下一个前沿方向在哪?分开来讲,对于 Locomotion 和 Manipulation,我觉得朱老师总结得很好,Locomotion 应该用 Control,Control 肯定是个解决方案。原因很简单,不管是 Locomotion 还是别的情况,都是有模型的,没模型机器人根本造不出来,既然有模型,那就得用 Model-based control,而且确切知道模型是什么后,要思考如何与 RL 较好地结合起来。具体来说,得考虑一些特定指标(Specific metrics),要是有模拟器,可能就不太需要考虑样本效率了,英伟达想卖显卡,估计也不会太考虑这个。

那比如要考虑性能(Performance)、安全性(Safety)等方面,思考它们怎样更好地有机结合,我觉得这是个挺有意思的待解决问题。 据我所知,现在就算是像 PPO 里“Teacher Student”模式,Sim2Real GAP 还是存在。要是真用控制的话,在处理物理模拟、进行下一步模拟事件等涉及样本物理、控制移动、物理移动等情况时,怎么用好这套机制来做自己想做的事 ?

Manipulation 和 Locomotion 相比,现在零次学习(Zero)的训练时间要一到两个小时,我觉得还能进一步缩短。要是想缩短的话,就得思考怎么构建一些基于视觉的通用能力,这可能就得回头想想怎么构建数据集、怎么构建任务以及怎么运用强化学习了。

再往远一点说,可能五年后会有 100 万台机器人部署在现实世界,不断传回大量数据,而那些数据都是异构的、隐藏的、广泛的,那我们该怎么做预训练呢?因为强化学习的预训练和行为克隆的预训练不一样,这也是为什么 BC+RL 看起来没太大区别,它们的训练目标不一样,一个是最大化数据集的对数似然(Maximize dataset log likeable),另一个是最大化价值函数(Maximize value function),所以实际上是超越数据集去发现新东西。

我们要怎么进行预训练呢?能不能模拟物理情况,利用 Meta 帮忙验证算法基准(Benchmark),搞出更具扩展性(scalable)的强化学习呢?在存在大量异构数据的这种情况下,要如何进行预训练(Pre training),并且实现快速应用(fast application)呢?我说的可是在真正大规模(massive scale)的情形下,这或许会是一个比较关键的重点所在。

我觉得在我个人未来五年的研究计划里肯定得有这一项内容。但为了做这件事,不可能说在开源算法开发的时候,真的把每个算法都放到 1 万台机器人上去测试,那样成本太高,对实际情况也会造成不小的影响。

总结一下,为什么 PPO、SAC 之后没什么新算法出现,就是因为它们把当时要解决的问题处理得很好了,我们现在需要新问题。我确实觉得,强化学习原则上提供了一种算法框架,如果它从根本上来说没问题、是合理可靠的,那不能因为现在有一些困难、存在局限性,就彻底放弃它,我们应该让它逐步变得更好,这样才能朝着更高更好的目标迈进。因为它不光是告诉你怎么复制、怎么预测、怎么从数据里找特征,要是想达到很高的优化程度,比如 99.99%、100%,光有数据不行,还得有优化,这是很关键的,所以未来的解决方案里肯定得有优化这一环节。 

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/vaVqlj8hYqIKOq4b.html#comments Thu, 12 Dec 2024 15:05:00 +0800
魔法原子:将于 25 年 Q1 发布人形机器人新品 已进驻工厂产线训练 //m.drvow.com/category/robot/DSAOMpXsbbHdEsCS.html 12 月 2 日,人形机器人公司魔法原子(MagicLab)发布视频公布产品进展,视频显示,人形机器人 MagicBot 已进驻工厂产线,进行多项作业训练。视频中,多台 MagicBot 人形机器人在执行产品检测、物料搬运、零件取放、扫码入库等工作,彼此之间实现了小范围协作。

魔法原子成立于 2024 年 1 月,是一家专注于机器人技术和人工智能的全球化机器人公司,旗下机器人产品包括通用人形机器人、仿生四足机器人等,覆盖家庭、工业、商业等多个场景。2024 年 1 月,魔法原子旗下人形机器人凭借自研 D190 关节模组,成为全球首个实现空翻的电驱人形机器人。

人形机器人 MagicBot 深入多个生产制造工序 展现多机协作能力

视频中,魔法原子人形机器人 MagicBot 展现了产品检测、物料搬运、零件抓取、扫码操作等作业能力。从视频中还能看到,部分工作场景中,多台人形机器人可以协同工作:某工序中,一台机器人从生产物料装配点搬起物料箱,搬运至另一台人形机器人所在工位放下,另一台机器人能够从物料箱中抓取零件放置在生产设备上进行作业。

“相比传统复合机器人,人形机器人凭借其拟人的特性,对复杂环境的适应度更高,能够适应不同的工作任务和生产线布局”,魔法原子公司负责人吴长征表示,“尤其适合 3C、家电等需要频繁切换产线的工厂工作,同时,高自由度、类人操作等特性,让人形机器人能够帮助制造业提高产线柔性,降低工厂部署成本。”

 据介绍,目前进驻工厂作业的人形机器人 Magicbot 全身拥有 42 个自由度,其双臂搬运负重最高可达 20 公斤,全身负重高达 40 公斤。MagicBot 机身采用高强度材料,同时进行了轻量化处理,以提升续航,目前其在连续执行行走、操作等动作下的综合续航最高达到 5 小时。

自研核心零部件和核心算法 赋能工厂场景落地应用

在今年特斯拉公开的一则视频中,特斯拉人形机器人擎天柱在工厂分拣电池、搬运电池。从魔法原子公开的视频来看,人形机器人 MagicBot 在工厂中同样进行了多项作业,包括物料搬运、零件取放、产品质检、扫码入库等操作。

这些作业能力,对人形机器人的环境适应能力、运动控制能力、操作能力都提出了很高的要求。

以物料搬运和产品质检两个场景为例,人形机器人的关节模组设计,能否为人形机器人提供足够的扭矩和力量来搬运重物,会直接影响其工作能力。

魔法原子自研了一系列关节模组执行器,覆盖了 550N.m 以下的多种力矩需求。不同系列的自研关节模组,为人形机器人 MagicBot 适应不同工作环境、进入更多产线乃至工厂奠定了基础。

 魔法原子的自研执行器还覆盖了行星减速执行器、谐波减速执行器以及直线执行器,具有高控制精度,高力矩密度等特性。

更精细的操作能力,对人形机器人灵巧手也会有更高要求。MagicBot 的灵巧手,可以模拟人手进行捏、抓、握、提拉等基本动作,也可以使用十余种工具。

此外,人形机器人 MagicBot 利用头部视觉传感器信息、编码器信息,结合全身多任务协调控制算法,形成了基于 6D 视觉伺服和全身模仿学习的浮动基座操作算法系统,操作能力能够不断进化,进一步能满足产线不确定环境下需要精细操作的工作要求。

在此次公开的魔法原子工厂训练视频中,还能够看到,人形机器人需要在不同作业工位、不同场景之间移动行走。而工厂作业环境复杂多变,人形机器人想要在其中自由穿梭、平稳运行,对其感知、规划、决策和执行能力无疑是一大挑战。

人形机器人 MagicBot 本体上,配备了多个不同类型传感器,传感器的感知数据,会被算法融合滤波,从而形成一个虚拟的超级感知传感器,让 MagicBot 具备 360 度超低盲区的周身环境感知能力及语义识别能力。在感知能力加持下,MagicBot 可依据自研导航算法规划出安全可达的目标路径,实时避开环境中的静态与动态障碍物,快速安全地到达作业点。

自研 MagicData AI 数据引擎 机器人智能化程度不断提升

数据是人工智能模型的基础。通过大量数据训练,机器人可以学会环境识别、任务决策和任务执行,从而实现机器人智能化程度的不断提升。

魔法原子人形机器人 MagicBot 会用到四类数据进行模型训练,分别是“合成数据”、“全身遥操作采集数据”、“三方模仿学习数据库数据”、“场景实时数据”。

这些数据源自研发团队在长期研发与生产过程中的积累,为了更高效地利用不同类型数据,魔法原子研发团队自研了 MagicData AI 数据引擎,通过该数据引擎,研发团队能够在本地、云端进行数据标注、处理,并在仿真训练场中实现模型训练,进而部署到真实应用场景中。

下一步,魔法原子将进一步完善 Sim2Real 的 AI 数据引擎,打通任务理解、数字资产生成、数据仿真生成、AI 模型训练的自动化平台,实现数据、训练的全链条的自动化、批量化及泛化。

吴长征表示,魔法原子已具备机器人“大脑+小脑+心脏”全面技术矩阵和持续研发能力,基于 AI 对于数据训练、感知导航、精密操作等领域的研发赋能,可以更快实现从实验室到商业化应用的转换,更快积累高价值数据,让机器人更快地学习现实世界,在现实世界中成长,最终于更多现实世界的场景中落地。

据悉,魔法原子将于 2025 年第一季度正式发布新一代 MagicBot 人形机器人产品,同步实现小规模量产,并快速于工业、商业服务场景进行落地应用。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/DSAOMpXsbbHdEsCS.html#comments Mon, 02 Dec 2024 16:26:00 +0800
战队的夏天 //m.drvow.com/category/robot/7Daa35hrHqVBrOjv.html 来自全国,从区域赛、复活赛中冲出重围的32支高校机甲战队、近1000名选手,聚集在赛场上,进行着这个夏天最后的战斗。

每一个到过赛场的人,都会被这里的气氛感染,惊喜、意外、失误、欢笑,一切汇聚成了这个战队的夏天。十年后,如果再回忆起他们的青春岁月,他们肯定忘不了一个个为RoboMaster比赛奋斗的不眠之夜,一场场或为胜利或为失败抛洒下的汗水与泪水。

这是属于他们的夏天。

01“三冠王”的崛起之路

2024年是一个特殊的年份,这一年的RoboMaster机甲大师超级对抗赛,竞技氛围达到了前所未有的火爆。

决赛的双方是上海交通大学的交龙战队和华南理工大学的华南虎战队。没有任何一场比赛能像这场比赛一样,将“龙虎斗”如此具象化地展现在观众眼前。

两支队伍都是两届冠军得主。交龙队拿过2021年、2023年的冠军,华南虎队拿过2017年、2018年的冠军。谁能拿到这座冠军奖杯,谁就能创造历史。

两发飞镖决定胜局,比分来到了1:0……

随着华南虎战队的机器人发生故障,2:0出现……

紧接着又是飞镖,精准命中2400点血,干脆利落的3:0……交龙战队连下三城,以大比分3:0赢取了胜利,带领RoboMaster进入了“新的纪元”,华南虎遗憾告负。

在赛场外,为交龙战队打下坚实根基的,2019年赛季的队长董勇和一群老队员此时正和队伍热烈庆祝着。董勇,是交龙战队的第三任队长。

2017年,董勇大二,第一次知道世界上还有RoboMaster(以下称为“RM”)这样的赛事。他很感兴趣,因为他之前是材料科学与工程学院的,学的更多是理论知识,很少有上手的机会,于是就转到了机械与动力工程学院。机械系不仅要理论考核,还有设计与制造大作业。参加RM,既能学到比赛中的技术,又能完成大作业,何乐而不为呢?

那也是上交大参加RM比赛的第一年,当时拿到了全国赛16强的成绩。作为一支新队伍,这个成绩非常不错。

但是2018年的比赛成绩令大家都很遗憾。2018年赛季时,组委会为了将当下的新技术与赛事做结合,将技术往智能化方向推进,于是在赛事规则中除了常规步兵、英雄、空中机器人之外,还新引入了哨兵这一新兵种,为的是提高比赛的自动化程度,鼓励参赛战队使用计算机视觉等技术来增强机器人的能力。

相较于以往,全新的哨兵机器人是安置在启动区外的哨兵轨道上运行,行动更加灵活,打击范围也更广;哨兵初始装填500发17mm弹丸;哨兵存活时基地还会获得50%的防御加成。综合来看,哨兵机器人是当年RM比赛中唯一一台要求全自动运行的机器人。

但是,这对于交龙战队来说是个不小的难题。那时候交龙战队的步兵机器人的上半部分还用的是官方步兵,连拨盘的设计都难以推进,如今又有新兵种需要突破,自研基础较弱的他们似乎根本无法招架。而且,当时整个战队在管理上缺乏完善的制度,比较混乱,研发进度也提不上去。

于是,在区域赛的时候,战队的这些弊端就逐渐暴露了,在区域赛没有直接进入全国赛,磕磕绊绊进入复活赛,后来在全国赛也是一轮游。

这一次的失败触发了交龙战队的斗志。

回来之后董勇已经大四了,经过一年的后备队员,一年的上场队员的磨炼,董勇接过了交龙战队队长的重担。

怎么才能将一支弱旅改造为强队?董勇交出了教科书一般的答案:

第一是团队文化建设要抓牢。

2019年交龙战队就做了很多团队建设,包括项管制度、运营制度、负责人制度,另外也把以前有的一些制度进行落地。另外,团队每个月进行一次大团建,比如轰趴、定向越野、看话剧等,为的就是让队伍劳逸结合,成员之间更多协作,提高队伍粘性、张力和后劲。

“在技术一时突破不了的时候,还是可以把大家的人心给稳住。”董勇这样解释。

第二是研发。

2019年的RM比赛中,交龙战队所有的机器人都是从头开始研发,甚至在参考论坛上的开源设计后,还要进行创新,做出自己独有的设计,并不断在实践中验证、改进。比如他们最开始只是将神经网络用在机器人的视觉系统上,之后机器学习大火,就又将其与视觉系统做结合。那一年他们设计的英雄机器人独树一帜,成为了经典设计。

交龙战队在2019年设计的英雄机器人

第三是有选拔机制。

当时所有的老队员留下,被定为正式队员,所有刚进队的队员被定为梯队队员,然后在团队里制定了一个项目,相当于公司中的OPM(企业项目管理),专门管理各个项目的新队员,考察他们的表现,决定最后能不能晋升为正式队员。而老队员如果在项目中表现不好也会被警告,甚至降为梯队队员。

也正是从那年开始,交龙战队开启RM校内选拔赛,为团队积攒了优质人才储备。

为了团队建设,大四那一年董勇几乎没回宿舍睡过,在学创楼买了一个折叠床睡在那边,而且身边的队友也很好,愿意跟着熬夜。到研究生的时候,董勇也经常在那个地方睡觉,“感觉习惯了,反倒是宿舍让人觉得陌生。”(更多RoboMaster比赛背后各大战队的精彩故事,可添加作者房晓楠微信youlinancy获悉)

令人欣慰的是那一年的比赛结果没有辜负战队的努力,原本,他们的目标是“保八争四”,但最终成绩是获得了全国亚军,一战成名。

回想起当时的胜利,董勇还是忍不住激动。他记得参赛回来后,战队指导老师冷春涛,平时不怎么说话,外表看着冷冷的,但实际上内心炽热,经常四处给队里找钱,甚至自己垫付,看到战队取得这样的成绩,内心的喜悦是可想而知的:“望子成龙”的心愿成真了。

这一战不仅扬了眉,吐了气,还赢来了大把的资金和资源。之前他们争取不到太多学校资源,很多费用都要队员垫付,董勇自己就垫付了2万元。从那以后,这样的情况基本没有再出现过,学校大力支持他们参赛,甚至可以称得上是RM比赛的“皇家马德里”。

两年后,在2021年的超级对抗赛冠军争夺战中,交龙战队捧回了他们的第一座冠军奖杯。2023年RM,冠军奖杯再次花落交龙战队。而在刚刚过去的2024年RM,他们又一次站在了最高领奖台,成为了RM赛事史上的首个“三冠王”。

他们创造了历史。

不仅如此,每一年比赛后,他们还会在赛事的官方开源论坛上开源优势技术,为其他战队提供交流、学习的渠道。据董勇介绍,这些年,他们开源的技术包括视觉系统,以及英雄机器人、工程机器人、步兵机器人自适应底盘等机械结构技术。

回想当初交龙战队刚起家的时候,好多兜底的方案都是从这个开源论坛上拿开源资料“抄”、模仿、再创造,如今,他们也在源源不断地回馈创新技术。而这或许就是这一开源论坛能够维持这么久的原因,新手学习知识,老手反馈知识,形成一个长期繁荣的开源生态。

02赛场上的今日瑜亮

从2019年绝地反击到如今,交龙战队近年来一直被看作是夺冠热门,一时之间没有对手。可在他们自己眼中,有这样一支队伍,实力强悍、作战经验丰富,知道如何去赢得比赛,“是对交龙战队威胁最大的对手之一”。它就是东北大学T-DT战队。

有意思的是,2019年交龙战队开始崛起、赢得亚军的那届比赛中,冠军得主正是T-DT战队。那是T-DT战队第一次拿起冠军奖杯。

彼时,T-DT战队是前一年即2018年的亚军队伍,也是2019年冠军呼声最高的团队之一。而交龙战队此前最好的战绩是全国十六强,不说是籍籍无名,但相比较而言,星光要暗淡得多,这次能冲到全国总决赛的赛场,已经出乎很多人的意料之外。比赛开始前,主持人对比了两队实力,就率先表达了大部分观众认为T-DT战队胜率更高的观点。

RM每一局限定时长7分钟内完赛。第一局就出现了RM历史上的名场面,双方地面战纠缠了两个来回,TDT战队的空中机器人腾空而起,弹丸像流水一样射向交龙战队基地。从满血的2000点血量到0,整个过程不到10秒钟,而其他兵种的操作员根本还没来得及反应,第一局已经结束。

全场气氛燃爆。

相似场景在这场比赛中出现了三次。除了第二局,交龙战队通过在地面抢夺“能量机关”成功,率先击毁对方“哨兵”夺回一局外,其他三局T-DT战队都以强大空中压制取得胜利,交龙战队几乎毫无还手之力。

如果要数哪支队伍在这几年能跟上海交大一较高下,甚至还能偶尔压制交龙战队的,东北大学T-DT战队肯定占有一席之地。毕竟这两支队伍,承包了最近五届RM的冠军奖杯。

诚然,作为从RM第一届比赛就开始参加的“老玩家”,经过这么多次比赛的磨练,东北大学T-DT战队早已形成一套独具特色的打法。

每年,T-DT战队会在学校里面举办校内赛,从中选拔出一批有潜力、有兴趣的新队员,然后留下来的老队员一起进行训练,投入到新一年的RM赛季中。

陈培泽就是通过校内赛加入战队的。当时是2018年,他大一刚入学,之后作为队员、队长参加过几次RM比赛。如今,他已经在读研三,即将毕业。

T-DT战队每一年的校内赛都是面向全校范围的大一大二学生进行的,不管是不是机器人或机械相关专业都可以报名,但需要满足两个条件:第一是要有激情,第二要能吃苦耐劳。

专业知识不会、没学过编程,并不妨碍队员去学习。因为被选中后,每个新队员都需要学习大量的知识,比如控制组和视觉算法组的队员会先从编程语言学起,学会语言以后再去学算法,网络平台上开源文件、课程很多,算法、代码等都很详细,队员循着清晰的路线去学习,基本上两三个月之后就可以上手调试机器人的一些功能,之后再慢慢去做研发等。

而战队选拔时之所以如此强调吃苦耐劳,是因为每一年的RM比赛都是一场漫长而又艰苦的征程。

总的来说,每一年RM赛事大概会在10月由组委会发布比赛规则开始,之后的全国赛会在来年的8月进行,整个赛季接近一年。在这些时光里,参赛队伍需要去研制完用于比赛的各种形态的机器人,期间还有新队员训练、筹备区域赛等,如此高强度的赛程对队员来说是一个非常大的考验。

“我们实验室,本科生除了每天的上课时间以外,基本上都要在实验室里面待着,每天晚上都要10点、11点才回宿舍。”

陈培泽第一次参加比赛就是在2019年,那一年也是东北大学第一次获得冠军。那年的战队队长是现在他读研的实验室大师兄王儒超,之前打过机器人领域的另一个重要比赛ROBOCON,而且还拿过三个冠军,可谓是比赛经验丰富。

大师兄刚上研一,来做战队队长,带领大家打RM,就是要拿着RC的经验,来RM当冠军。

结果得偿所愿。

赛场如战场,现场形势千变万化,有时候一个小小的颠簸都会摧毁一个机器人,进而摧毁一场比赛。在RM的赛场上,工程机器人倒在地上起不来,导致全队经济状况崩溃的局面屡见不鲜。唯一能够确定的是,台下多流汗,台上少犯错,把所有的突发情况考虑到位,赛场上才知道如何应对。

东北大学发挥了大学机器人超级强队的传统,出手惊人,站上了2019年RM比赛冠军的领奖台。

超级强队的诀窍无他,就是十六个字而已:稳定性高,方案执行到位,细节关注到位。

稳定性,这是机器人赛事上绝对绕不过的一个话题,也是最被看重的一点。因为不管在私下做得再好,如果稳定性不行,上场时发挥不好,那一切都是徒劳。

当年比赛,为了保证稳定性,东北大学战队在比赛前一个月就把所有需要的机器人都做完了,之后就紧锣密鼓打训练赛,几乎用整整一个月时间去模拟场上可能会遇到的各种突发情况。

而比赛方案上,主要是看如何基于对当年比赛规则的理解。如果制定的方案既符合赛事规则,又容易及时变通,更能够展示自己队伍的研发特点,那在执行中就几乎无懈可击。

所以每一年的方案讨论或战术制定,都很关键,需要队员与指导老师配合,而且这与团队的技术传承有很大关系。

一般情况下,战队在新一年里能把往年的技术完整复现出来,可能就花掉三分之二的时间,仅留三分之一的时间去钻研新的东西。但如果有参赛经验的老队员留队时间久,那在这一点上就打败了很多人。

“其实就是一种技术传承,而这种传承对比赛来说很关键。”

而经过这些年的技术传承,东北大学也形成了自己的优势技术,比如空中机器人。

东北大学设计的无人机

东北大学空中机器人的优势在于,主要是在实验室通过不断精准地测试,在过程中总结,在飞行控制、弹道控制的技术、自瞄技术得以非常稳定地实现,加上地面机器人的稳定发挥,能够在赛场上完成对应的增加攻击力的兑换任务,才保障了他们在赛场上的优势。

另外,陈培泽觉得除了飞行机器人之外,东北大学一直拿得出手的还有工程机器人。

机甲大师超级对抗赛中,工程机器人起着后勤保障的作用,主要是夺取“矿石”,兑换虚拟币,为购买弹丸、复活机器人提供“资金”保障。因为要上下台阶,以及“挖矿”,工程机器人是赛场上公认机械结构比较复杂的一个机器人。

东北大学的工程机器人一直以来无论是从结构上还是控制上来看,都做得比较稳定、突出,效率很高,可以称得上是战队的“王牌机器人”。

但是随着赛事的社区开源氛围日益浓厚,各个战队都会把一些先进技术或者稳定技术开源在论坛上,长期下来大家的水平差距越来越小、机器人整体的稳定性也越来越高。(更多RoboMaster比赛背后各大战队的精彩故事,可添加作者房晓楠微信youlinancy获悉)

比赛越来越难打。

陈培泽记得,2019年时,如果对面战队抽签抽到东北大学战队,那么很容易猜到结局,对方输一分、两分很正常。可现在不一样了,优秀的队伍之间差距并没有那么大,谁赢谁输都很正常。

或许这就是RM比赛的魅力所在,强者就是那些不畏风暴,全力以赴,厮杀到最后的人。

而从这些年的战绩可以看出,东北大学战队是一支名副其实的强者:2019年、2020年获得冠军;2018年、2023年获得亚军;2024年获得季军。

如今,曾经的对手上交大已然成为RM赛事史上第一个“三冠王”,那么下一个“三冠王”会是谁?东北大学只有一步之遥。

03今朝纵有疾风起,他日虎啸破长空

2019年夏天,距离那年RM全国总决赛落幕没多久,某一天,有位队员在华南理工大学华南虎战队的聊天群里“扔”出了一句诗:“今朝纵有疾风起,他日虎啸破长空”。

时至今日,袁泽锟已经不记得当时是谁说的、聊天框里的上下文语境是什么,“它就那么突然出现了。”

可以肯定的是,当时大家的心情都很低落。作为曾经的王者之师,一朝从高处跌落,那种茫然、无措、不甘,就像一片夏日午后出现的厚重乌云,笼罩在战队每一名队员的心上。

袁泽锟曾在2020年担任华南理工大学华南虎战队的队长,之后也多次以顾问身份指导战队参赛,今年他即将从华南理工大学研究生毕业。2019年RM比赛是他作为主力队员参加的第一次比赛,也是华南虎战队有史以来打得最差的一次。

华南虎战队有着辉煌的过去。

在2017年、2018年RM比赛上,华南虎战队曾接连两次获得冠军,是RM比赛史上为数不多的双冠王之一。

但2019年的比赛,华南虎却破天荒地遭遇了滑铁卢。

2019年RM总决赛获奖名单显示,那一年华南虎战队甚至没有保住全国16强的成绩,跌落到全国32强的队列中。

赛事的惨败,像是给所有参赛队员一记迎头闷棍。明明上一年还是站在掌声雷动、鲜花簇拥的冠军领奖台上,如今,仅仅过去一年,怎么会差这么多?

但正如那句突然出现的诗句描述的那样,作为传统强校,华南虎战队队风仍在。更重要的是,一个人可以被打败,但不可以被打倒。

这样的竞技精神,也让彼时作为新人的袁泽锟迷上了RM。他开始意识到,这或许就是RM比赛的魅力所在:无名的战队可能成为黑马,冠军也会跌落奖台,没有谁能保证永远站在聚光灯下,每一年的比赛都是洗牌重来,大家要做的、能做的,只有向前冲。

于是,抱着“还想再打一年”想法的袁泽锟,从前辈那里接过了队长的职位,承担起了战队的管理工作。

此刻摆在他面前的问题是,怎样才能带领这支老牌劲旅,走出失败的低谷,再创冠军的辉煌?(本文作者房晓楠微信youlinancy接下来将推出通义大模型如何在重围中冲出来的故事,感兴趣的读者可添加作者微信交流)

根据自己这一年在队伍中的感受,袁泽锟认真总结了一遍当下团队存在的问题。

首先是队伍的大方向问题,架构混乱,做事情缺乏规范和标准流程,导致项目推进缓慢,也没有人及时做跟进、把握方向。

其次,团队的技术开发和管理也是如此,流程混乱、进度管理缺少把控,从而在赛事的推进上无法按照正常进度进行。“甚至出现直到比赛前一天,机器人还没有完全装好之类的问题。”

短板已经摸清,那接下来面临的就是一场大刀阔斧的变革。

做好日常管理、做好技术、拿出性能稳定有技术亮点的机器人,以及制定好有力的作战方案,让机器人在赛场上能够发挥出该有的实力,这是华南虎重返巅峰的关键。

而这也在日后被证明,是战队所做的最正确的事情——不要放弃做正确但困难的事情。

如今在RM的赛场上,每支战队要派出8台机器人上场,分别是步兵机器人、英雄机器人、工程机器人、哨兵机器人、飞镖系统、空中机器人、雷达。

场上这么多的机器人,如果出现断电等任何问题对它们来说都是致命性打击。不能因为这些细枝末节输了比赛,所以,每一台机器人在上场前,都一定是经过成百上千次的测试,确定它不会出问题后,才可以上场。

近年很多参赛高校战队都在打造自己的技术亮点,像打得又准又快又远的英雄机器人,具备机械臂或能够做复杂运动的工程机器人,能够飞得又稳又快、还带自瞄的无人机等,深圳大学、浙江大学、南京航空航天大学、大连理工大学、西北工业大学的飞镖系统在赛场上的制导命中,都在赛场上发挥极大的作用。

袁泽锟告诉雷峰网,华南理工大学战队也曾试想过这些技术,但是由于投入过大、风险过高、稳定性差,他们认为如果在没有保证稳定性的前提下,去设想发挥更多的功能有些不切实际。所以,保证技术下限,也就是机器人的稳定性,走经济、性价比高的路线,是最适合华南虎的战术。

而且参赛过程中,场上机器人技术会占七成,实际操作也就是人的影响,会占三成左右。当然,实际操作中要看各个队伍的发挥,也要看日常训练的配合度。

战术执行更多是通过规则去提炼出比赛对于机器人技术以及一些形态上的具体要求,这一点是能够直接体现到机器人设计过程中的。这些都是在赛季初就能够做的事情,前期做得越好,后期走的弯路就越少,等到正式比赛的时候,即便场上操作有失误,也会有一个能够容忍的下限,即机器人的稳定性。

董勇在总结上交龙战队的参赛经验时也认为,对于RM比赛来说,强硬的技术能力是一方面,但很多时候大家比拼的不仅仅是技术,好的管理机制、研发成果成功转化成实力也很关键。

也许是低谷磨练了他们的性子,又或者他们从比赛中看到了更重要的东西,这头“华南虎”学会了耐下性子,磨练自身。

冠军的骄傲,化作了不懈的坚持。袁泽锟和所有的队员都觉得,过去的几年,不管成绩如何,永远没有遗憾。他们已经把每一年都做到了最好。

做到最好,那就够了。战队曾经的指导张东老师曾经告诉他们,“我们队伍不看重获得的名次,更在意的是培养了一批怎样的人。这批人培养得怎么样,之后获得怎样的名次都是顺其自然的事情。”而要说对结果有什么样的遗憾,更多是觉得可能今年在人才的培养上会有一些问题,那下一年就要做得更好。

做到最好,也就一定有回报。2020年因为疫情,RM停赛了一年,而等到RM2021年赛季的时候,华南虎积攒了两年的力气与不甘在赛场上得到了彻底的释放,那年,他们夺得了季军。

虽然并未重返“铁王座”,但这已经是他们的一次巨大进步。两年前那片萦绕在战队上空的乌云,散了。

之后的几年里,华南理工战队的成绩依然稳定。去年的RM上,华南理工战队捧回了一座季军奖杯,刚刚过去的RM2024赛季,华南理工获得了亚军奖杯,是全国公认的四强强队、对手战队认可的夺冠劲敌。

当然,这距离他们曾经的巅峰还有一段距离,但看着他们的表现与成绩,何日夺回铁王座,成为下一个三冠王,只是契机问题。但是虎啸之声,已经再次响彻全国。

04传统豪强区Up主

如果以资历来看,哈工大的机器人战队在全国大学中都是排得上号的。

2002年,哈工大组建了一支团队——哈工大竞技机器人队。原先这支队伍源于学生自发组织的学生社团,指导单位为团委,学生社团的活动经费有限,无法支撑参加大型比赛。

哈工大竞技机器人队主要参加RC全国大学生机器人大赛-ROBOCON赛事(以下简称RC赛事)。由于主要参赛学生出自哈工大机电学院,且该学院的机器人工程学科还设有国家重点实验室,重点实验室专门安排了老师给予团队指导,并且拨付了专项经费予以支持。因此,该社团依托机电学院提供的场地、政策和经费参加比赛,2020年之后,随着比赛成本的逐年增加,在学院的帮助下,该社团在本科生院申请了科创竞赛支持。

原本,这支团队的全部精力都是用来备战RC比赛的。直到2014年,事情有了新变化。

那年比完RC赛后,有个队员去参加大疆夏令营,也就是大疆为了筹备RM比赛设置的夏令营。

于是2015年RM第一届比赛的时候,为了参加比赛,哈工大竞技机器人队就从RC比赛的参赛团队中抽了一部分大二、大三的梯队成员出来,去参加RM比赛。

在现在的战队指导老师赵林杰记忆中,彼时RM作为一个新的比赛,为了吸引高校参与,组委会对参赛队伍给予具备基础功能的机器人等支持,允许参赛队伍在此基础上进行改进。

由于RM比赛是面向本科生的,所以哈工大竞技机器人队临时组建了以大二、大三为主的参赛队伍,队伍缺乏比赛经验、指导团队不够重视,再加上赛季之初在该项赛事上并没有预算,临时搭建的“草台班子”折戟黑龙江省赛。

作为RC赛事的常客,又要参加新的RM比赛,哈工大竞技机器人队不断地去适应两个比赛的赛程,调整内部组织节奏。

人员分配上,一直是RC比赛由大四的保研学生参加,但是随着升学以及工作压力的增加,大四学生进入实验室或出国读书的比例增加,团队的人才储备愈发不足。

而且,两个赛事的比赛时间接近,同时备赛RC和RM比赛对于团队的人员和资金要求越来越高,压力也越来越大。

为了更好地参与比赛,团队开始进行调整。因为两项赛事对队员的要求不同,RM赛事以大二/大三学生为主,参加RM比赛后,在下一届比赛中择优挑选学生参加RC比赛。

但长期下来,这种模式还是存在问题。

由于RM与RC参赛时间相近,团队一起备赛的形式虽然解决了哈工大团队整体的参赛难题,但对于学生来说连续两年的高强度比赛压力较大,并且在RM赛事中并没有取得较好的成绩。

没办法,还得调整。

于是从2019年开始,团队将RM与RC赛事并列,参赛队员可自由选择参与赛项,而不是强制将RM的队员作为RC的梯队队员培养。

学生的自由度更高了,参赛的自主性也提升了。

现在哈工大的RC队伍大概在30人左右,RM比赛需要更多人手,团队规模要比RC队伍多一些,大概在50到60人左右。加上留下来的几名老队员,哈工大的机器人队常年人数维持在100名左右。

赵林杰还记得,哈工大参加第一届RM比赛就是在组委会提供的机器人基础上进行的改进。

参加第二届RM比赛时,团队增加投入力度以及经费,但可惜的是仍然没有在小组赛出线,无缘去深圳参加全国赛。

一直到第三届,吸取了前两年的失败教训,哈工大才终于通过复活赛拿到了全国赛的入场券。而且,那年的RM队长是此前赵林杰做队长时的队员、参加过第一届RM比赛的老人了,那时他大三,大四参加了RC赛事,研一的时候做了RM队长,经验丰富。

有了这么有经验的队长,哈工大终于踏上了前往深圳的旅程,并且在第一次闯入国赛就拿到了全国殿军的成绩。

之后哈工大就是RM全国赛的常客,成为了全国高校队伍心中四强的种子选手,直到2021年获得亚军。这是他们迄今为止最好的一次成绩。2023年获得中部分区赛冠军。

哈工大获得2023年中部赛区冠军

具体来看,哈工大竞技机器人团队在2021年做得好主要基于两点。一个是哨兵,它在赛场上作为防御机器人,具备将“偷家”的对方机器人识别出来,并展开精准防守反击的能力。我方团队就可以倾巢而出,留一个哨兵在家就可以守住全部——这一点,哈工大的机器人可以做到。

第二就是团队具备击打高增益的能量机关能力,也就是视觉瞄准技术。据了解,目前RM赛事的记录保持是由哈工大团队自己创造、自己保持、自己去打破的。去年2023年的时候,只有哈工大达到40环以上,今年应该是46环,而很多队伍可能打到20环、30环就很不错了,哈工大团队去年最高记录是42环,当时是记录保持者,今年就破到46环了。

哈工大激活能量激光46环

“当环数到这个水平之后,相当于已经无敌了——环数防御力增加、攻击力直接增加到3倍。具备以一敌三的能力。”赵林杰解释道。

而这个能力强项的保持,主要是团队的良好传承和延续。

当初,哈工大队伍最开始成立的时候,就有一名队员把视觉瞄准技术做得很强,之后的每一年,战队都会针对这一优势基于技术传承,进行战术调整。比如每年都会把视觉当作重点,然后结合当年的目标,把机器视觉、机器学习等前沿技术给用上,不断进行性能改进、提升。多年来的坚持终于取得了回报,这项技术已经成为了哈工大在赛场上的杀手锏。

参加RM比赛并不是一件轻松的事情。

从第一年RM比赛到现在已经过去十年了,回头想一想,每一次的比赛,队员从9月份进队,到来年8月份比赛,中间大概10个月的时间,春节就只放7天假,除此之外没有任何假期。

从书本知识到亲身体会,从手绘设计图到亲手拧螺丝……整个比赛周期下来,全队机器人要迭代五六次,时间紧、任务重、压力大。

这个实践机会,比别人大学四年都要多,每一个完整参加过一年赛季的队员,他们的动手能力和工程素养都是极强的。

“这个经验很重要。”赵林杰告诉雷峰网,等到他读研究生的时候就明显感觉到,与他一起进来的研究生,在做一些课题研究时,参加与没参加过RM的学生相比,差别挺明显的。而对于前者来说,“做事情有点捷足先登的感觉,很多事情可以直接上手。”

现在,已经从队员成长为队长,再从队长成为指导老师的赵林杰,试着把很多自主权给到学生,没有管那么细,只是问问赛季目标、各个节点的进度等。另外更重要的就是帮团队筹集资金。

因为他们每年要从哈尔滨穿越整个中国去深圳参加全国赛,差旅费相对其他学校更高,团队的经费没有那么充足。今年8月份出发去深圳比赛的时候,去年的队员还来找他问去年的比赛经费有没有报销下来。

团队比赛获得好的名次或成绩,学生可以拿着RM的成绩争取奖学金,为保研加分,这些都是直接的奖励。另外,有比赛经历的学生,不管是去找工作还是去申请研究生保研等,都会更受重视,甚至学生想要申请国外学校的时候,这个比赛经历也很被国外导师看重。

现在哈工大竞技机器人队在B站上还有自己的账号,电控、视觉、机械、硬件的课程全都有,这些都是队内每个小组把相应的课程录制出来,发布到B站上,让学生去做线上学习。那些能够按时上课、也能按时交作业的学生,在新学年开学后,线下再组织一个竞培营,以类似校内赛形式,出一个赛题,让他们自由组队,由队里面提供些材料、加工基础等,去完成任务。

意料之外的是,现在这个账号已经成为了一个知识区的小网红,有三万的粉丝,也给不少校外学生提供帮助。

05他们属于未来

RM官网上的介绍是,“为青春赋予荣耀,让思考拥有力量,服务全球青年工程师成为追求极致、有实干精神的梦想家”。

后来,这成为RM这一开始于2013年的全国大学生机器人大赛的真实写照。

而经过这些年间,RM不止一次地将看似不可能的技术付诸实际的机器人上,带来新的突破。

比如,有很多技术,原本都是工业级的难度,但现在,很多参加RM比赛的大三、大四本科学生都能将其做出来。

这样的故事在RM赛事史上还有很多。

比如近些年出现的平衡步兵机器人。与日常生活中的平衡车不同的是,它具备非常强的运动能力,因为比赛中会有飞坡动作,而这些功能最开始就是被一个大二学生花费一年时间做出来的。直到现在,它仍然是GitHub上最好的平衡车开源项目之一。

梦想的力量是无穷的。

这批20岁左右的年轻人无惧无畏,没有任何难题能够困得住他们的手脚。他们愿意为了做出最好的机器人而夜以继日地奋战,敢于去挑战那些看似高不可攀的难题。他们在赛场上留下的,不只是一道道荣誉和名声,更是创新的心,能干的手。

他们是大国重器的未来。


]]>
机器人 //m.drvow.com/category/robot/7Daa35hrHqVBrOjv.html#comments Sat, 30 Nov 2024 11:45:00 +0800
灵宝CASBOT首款人形机器人产品—CASBOT 01发布,通用类脑智能机器人瞄准多场景落地 //m.drvow.com/category/robot/Gy0hnPSsUSGhp64Y.html 2024年11月13日,人形机器人品牌灵宝CASBOT正式发布首款全尺寸双足人形机器人“CASBOT 01”,一款多场景落地的通用类脑智能机器人。这是灵宝CASBOT在成立不到1年的时间内交出的一份亮眼的答卷,也标志着人形机器人赛道迎来一位极具快速商业化能力的新入局者。


成立至今,灵宝CASBOT已在航天航海、应急救援、井下作业、工业制造和商业服务等多个领域积累了众多合作伙伴,并探索出具身智能商业应用的新场景。得益于过往的重大项目承接和切实的落地经验,使得灵宝CASBOT打磨出一条以场景为导向,驱动技术迭代的发展路线。

 

以终为始,生而为人

在具身智能领域,关于终极形态的争论尚未达成共识。

在灵宝CASBOT团队看来,世界“以人为尺”。物理世界中,大多数环境、物品和工具都是依照“人”的尺度设计的。因此,和人类形态接近的机器人,才能更好地适配复杂的物理世界。比如,用视觉代替“眼睛”处理物理世界数据,机器人的理解就不会失真,最大限度的保障人形机器人的通用性,真正融入到“人”所处的工作、生活环境中。

 

美学设计,通用仿生

“CASBOT 01”,身高179cm,体重60kg,整机拥有52个自由度,算力达550T,续航时间超过4小时。它还有个更好记的昵称叫做“星期三”,通过友好的外观设计,使其与人更有亲近感。从灵宝发布的产品片中可以看到,“星期三”不仅可以双足站立及稳定行走,并且还能够整理衣物、组装台灯、更换灯泡、甚至打螺丝。

在ID设计上,CASBOT 01通过对人体肌肉比例的视觉化分解及抽象化的概括提炼,实现了机械工程和有机美学的完美融合。


全栈技术,打造应用级产品

在机械结构设计部分,经过多次优化,灵宝CASBOT平衡了运动范围和造型美观度。在整机极致减重的情况下,采用了高强度金属材料加工复杂曲面,形成了中间加固的超薄空心腔体,保证了结构的稳定性和抗冲击性。

灵宝CASBOT自主研发了包括行星、谐波,以及直线三大系列一体化关节,峰值扭矩密度最高可达207Nm/kg,关节效率超80%。关节使用基于电流或传感器的力控优化策略,辅以模型跟踪控制,采用振动抑制、惯量辨识、摩擦补偿及“增益自整定"等技术,实现高精度的"力矩环”控制效果,根据运控整体需求进行惯量匹配,提高单关节动态响应频率:高效稳定的通信,满足高动态力控 带宽需求:通过冲击工况优化能源管理策略,结合伺服、单腿及整机过流等保护措施,完成了近千小时的寿命测试,确保关节的长时间稳定运行。

本体的卓越结构性能,为机器人的运动控制训练提供了坚实底座。

CASBOT 01的整体运动控制框架结合了对抗运动先验和全身控制(WBC),实现了运动的一体化控制。通过这一框架,机器人能够在复杂动态环境中稳健地执行全身作业任务。在传统强化学习训练框架的基础上,灵宝CASBOT同步训练了生成对抗模仿学习网络、生成器和判别器不断进行博弈,使得模型会生成高度拟人的运动控制策略。

得益于丰富完整的数据库,可以根据任务内容展现出多种不同的运动能力,如行走,跑步,跳跃等,从而高效的完成指定任务,大大提高了模型的通用性。

“大脑”层面,在评估业内主流的“端到端具身大模型、分段决策模型以及示教模仿训练技能模型”后,灵宝CASBOT选择了分层端到端模型技术路线,能够结合各种路线的优势,同时规避它们的不足。

在模型训练方面,灵宝CASBOT采用了从实到虚、数据合成、混合训练、再从虚到实的创新技术路线。通过分层端到端模型和混合训练技术,能够让机器人更加智能、灵活和自主。 

当“本体”和“大脑”紧密协作,机器人便获得了高层认识、理解和决策规划的能力。

CASBOT 01的头部具有两个自由度,配备了多个RGBD相机、激光雷达和IMU等传感器,能够进行视觉和听觉的双重交互,在操作框架下,通过端到端多模态灵巧操作大模型、蒸馏与量化技术等,成功实现机器人手部对“环境、对象、任务”的泛化和适应能力。

作为完成精细操作的末端执行器,CASBOT 01的五指仿生灵巧手单手重量为800g,额定负载5公斤,采用了高紧凑度整机构型及驱-传-感-控系统一体化的仿生设计,以及触觉-力觉-视觉的多源感知系统设计方案,通过优化控制算法和动作规划,模仿人手在操作中的灵活性,面向精细化作业场景,力求解决“灵巧”和“作业”两方面的难点。在软件、硬件的强力支撑下,实现了可快速学习、可泛化的长时序灵巧操作。


场景反哺技术,掘金千亿市场

2024年被认为是“人形机器人商业化元年”,中国人形机器人产业大会近期发布的报告显示,2024年中国人形机器人市场规模将达到27.6亿元,2030年有望成长为千亿元市场。

数据背后,是人形机器人产业发展的一体两面:一方面,得益于其强大的产业渗透和产业融合能力,使其成为“新质生产力”的重要力量,成为推动中国经济高质量发展的新支柱;另一方面,千亿市场规模下,商业化成为人形机器人产业的“必答题”。

2024年9月,灵宝CASBOT和联想制造即服务签署了战略合作协议,成为了联想“火种计划”的首批核心合作企业。双方打造了“双向赋能”合作新范式,为灵宝CASBOT的人形机器人产品商业化落地与应用奠定了基础。

于联想而言,在联想智能制造工厂,引入灵宝CASBOT在柔顺力控、精密操作等方面的技术创新,不仅可以提升生产线的自动化水平,降低生产成本,直接为联想的智造工厂注入了新的活力,也为联想的智能制造升级带来突破性的助力。

于灵宝CASBOT而言,真实的商业化场景,能够赋能技术迭代,深耕应用场景利于未来在多样化的场景中游刃有余,进而达到行业内“通用”的诉求。

为了更好地服务于市场,满足不同行业的多元化需求,灵宝CASBOT还将人形机器人基础技能库开放给所有的行业合作伙伴,共建更加精细化的专业技能库,并期待可以更好地理解不同行业的需求,让人形机器人与具身智能技术服务于各个场景,并最终服务于人。

 

持续迭代,智慧共生

正如灵宝CASBOT发布会的主题“生而‘为’人”-这正是灵宝CASBOT的愿景,以智能科技释放人类潜能。

发布会上,CASBOT 01还代替主持人发布了“ONE MORE THING”—— “CASBOT NEXT GEN”,作为CASBOT 01的升级版,它将搭载Embodied Brain 2.0、视觉基础大模型2.0,以及升级版通用运动先验控制器,和灵巧操作大模型,可完成全身运动姿态跟随控制和人类操作视频数据混合训练,实现运动操作双向提升。

可以预见的是,灵宝CASBOT将持续走在技术创新前沿和商业落地场景中,通过在B端市场的不断深耕,为未来C端市场的“终极竞争”奠定坚实基础。随着一步步的技术进化和产品验证,相信未来,灵宝CASBOT终将实现“打造一个智创新物种,塑造智慧共生的新世界”的未来景象。

雷峰网雷峰网


]]>
机器人 //m.drvow.com/category/robot/Gy0hnPSsUSGhp64Y.html#comments Wed, 13 Nov 2024 20:26:00 +0800
贝索斯领投、OpenAI连续跟投,这家机器人公司再融4亿美金 //m.drvow.com/category/robot/1xyyOgARBHtsg0Bv.html 贝索斯又给一家AI创企 Physical Intelligence 投资了,一顿操作下来,使其估值狂飙至 24 亿美元

值得一提的是,这波融资除了贝索斯外,还有风险投资公司 Thrive Capital 和 Lux Capital 同时牵头,OpenAI、Redpoint Ventures、Bond 纷纷跟投。

让 Robot 叠衣服,一句话的事儿

这个让一众大佬纷纷看好的 Physical Intelligence,它的核心产品是一款名为 π0 (pi-zero) 的软件,这是一个通用的机器人基础模型,旨在使用户通过简单的语言指令控制机器人,类似于与聊天助手互动的方式。

在上周发布的论文中,Physical Intelligence 还展示了 π0 如何使机器人能够折叠衣物、清理桌子、压平盒子的技术分析等等。

其中,π0机器人控制模型集成了一系列高科技手段,使其能够灵巧地完成复杂的任务。

这个模型首先利用视觉-语言模型来理解图片和文字中的信息,然后通过一个特殊的动作输出系统,以很快的速度告诉机器人该如何动作。这种快速、连续的动作指令对于需要精细操作的任务非常关键,比如叠衣服或者装箱子。

π0模型的训练分为两个阶段:预训练和后训练。

预训练阶段,模型会学习大量的数据,这样它就能够掌握广泛的技能和适应不同的场景。后训练阶段,模型会针对特定的任务进行调整,以提高其在这些任务上的表现。

此外,π0还采用了一种叫做流匹配的技术,这让它能够处理连续的动作,而不是单一的、离散的步骤。这种技术的应用,加上模型的混合专家架构,使得π0在预测动作时更加准确。

总的来说,这些技术的综合应用让π0在多种机器人平台上都能够展现出色的表现,无论是在预训练后立即执行任务,还是经过特定任务的微调后。

网友直呼:我一直相信AI机器人的能力,现在它能帮我洗衣服,我就更喜欢它了!

还有网友化身“赛博乞丐”:给我来一个!

不过也有网友觉得演示中的内容在特斯拉的机器人面前有点太小儿科了,不过马上遭到反驳:人家只是初创公司!

而这也和 Physical Intelligence 的想法一致,联合创始人 Sergey Levine 就曾经表示:“据我们所知,我们正在训练的数据量比有史以来制作的任何机器人模型都要大。”

但他还补充道:“它无论如何都不是 ChatGPT,但也许它接近 GPT-1”,表达他们的软件更接近于 OpenAI 为聊天机器人发布的首个模型GPT-1,而不是那些更先进的、为 ChatGPT 提供动力的大脑,暗示他们仍处于早期开发阶段。

野心勃勃,要做机器人行业中的「OpenAI」

之所以Physical Intelligence能够拿到这么大的融资,可能是因为它和OpenAI一样,都是企图从模型与数据层面颠覆此前的技术惯性,或许将Physical Intelligence的π0与OpenAI的ChatGPT进行比较,可以更直观地理解其创新和潜力。

首先,ChatGPT的精准语义理解能力是其核心优势之一,对于π0而言,这种能力同样至关重要。

π0必须具备理解物理世界中的交互指令和上下文的能力,这包括但不限于视觉、语言和触觉等多种感官输入。

通过接受大规模互联网视觉-语言预训练,并结合丰富的机器人操作数据集,π0能够熟练地执行一系列多样化的任务。这不仅彰显了π0在解读物理世界指令方面的卓越能力,也体现了其在多模态感知和任务执行上的先进性。

其次,ChatGPT的卓越之处在于其能够将宏观问题细化为微观问题,并巧妙地整合答案。

对于π0而言,这表示它必须将复杂的物理任务分解成一系列可操作的步骤,并根据环境的实时反馈灵活调整其行动,以确保达成预定目标。

π0通过在广泛的机器人操作数据集上进行训练,已经能够熟练执行从简单的物体搬运到复杂的衣物整理等多样化任务,这充分展现了其在任务分解和解决方案构建方面的强大能力。

关于这点,Physical Intelligence 的创始人 Karol 也曾说过:“我们有一个非常通用的方法,它可以利用来自许多不同实施例、许多不同机器人类型的数据,并且类似于人们训练语言模型的方式。”

最后,ChatGPT的通用性体现在其能够将人类知识迁移至语言交流中。相较之下,Physical Intelligence的通用性则表现在将互联网规模数据中学习到的深层语义知识,成功应用到物理世界的实际操作中。π0继承了这种从大规模互联网预训练中获得的丰富语义知识,并将其有效运用于实时的灵巧机器人控制,从而在知识迁移和通用性方面展现了其非凡的能力。

值得一提的是,Physical Intelligence的一个关键特点是与物理世界的直接交互。与ChatGPT主要处理语言和信息不同,Physical Intelligence需要处理的是物理信号和实际操作,正是这一点可以看出,它的野心是成为机器人行业中的「OpenAI」。

总的来说,ChatGPT的里程碑在于其对自然语言的理解和生成能力,而Physical Intelligence之所以受到投资人重视,则在于其对物理世界的理解和操作能力。

π0所做的,就是将构建语言模型的技术与控制和指导机器的自有方法相结合,并通过大量的机器人数据训练来实现。为了获得更多数据,该公司使用了在图像和文本上训练大脑视觉语言模型和从 AI 图像生成中借鉴的扩散建模技术。

人均“大咖”的初创公司

Physical Intelligence 成立于 2024 年,至今不到一年时间。它是一家专注于将通用人工智能与物理系统相结合的机器人初创公司,总部位于加利福尼亚州旧金山。公司的目标是开发一种能够应用于各种机器人的基础软件,使其能够执行复杂的多步骤任务,而不再局限于特定的功能。

公司的联合创始人兼首席执行官卡罗尔·豪斯曼(Karol Hausman)曾在谷歌DeepMind担任机器人科学家,一直专注于深度学习和机器人技术的应用,目前在斯坦福大学当客座教授。

Karol 在慕尼黑工业大学获得机器人硕士学位,在南加州大学获得计算机科学博士学位,研究方向为感知-行动循环的重新思考,通过交互感知和学习表征来提升机器人的智能。自2018年起,担任谷歌大脑的员工研究科学家,领导机器人操作团队,并负责多个重要项目。2021年至今,担任斯坦福大学计算机科学系的兼职教授,教授深度强化学习等课程。同时也在NASA喷气推进实验室等多个顶尖研究机构担任过短期访问研究员。

同时他也在多个国际会议和期刊上发表了大量论文,涵盖深度学习、机器人操作、交互感知等主题。其论文《Rt-1: Robotics transformer for real-world control at scale》在2022年引起广泛关注。

值得一提的是,在谈及自家机器人在叠衣服方面的表现时,Karol 还强调:对于机器人而言,折叠衣物是一项特别困难的任务,因为它需要对物理世界有更深入的一般性智能,尤其是在处理那些会不断变化形态和产生褶皱的柔软物品时。

他还提到,现有的算法还不够稳定。就像人工智能聊天机器人有时会出现一些“人类怪癖”,例如摇晃 T 恤和短裤,让它们平整地铺开。并且这些家庭服务机器人有时也会突然“崩溃”,然后做出一些令人难以置信的行为:例如它们可能会把鸡蛋塞进已经装满的纸箱,然后强行关闭纸箱,甚至还有一次,在整理物品时,机器人突然将盒子从桌子上扔了下去...

其他联合创始人包括加州大学伯克利分校的教授谢尔盖·莱维宁(Sergey Levine),Sergey发表了多篇具有影响力的论文,其中《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》和《Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor》是其代表作,分别被引用超过13738次和9441次。

联合创始人切尔西·芬(Chelsea Finn),2019年至今,Chelsea 担任斯坦福大学的助理教授,并且享有“William George and Ida Mary Hoover Faculty Fellow”的称号,她在机器人学和人工智能领域的研究工作得到了认可和尊重。值得一提的是,在加入斯坦福之前,她曾在 Google Brain 担任研究科学家,专注于深度学习和机器人学习算法的开发。

联合创始人 布莱恩·伊赫特(Brian Ichter)在斯坦福大学期间获得了航空航天与航天工程的硕士以及博士学位,在攻读博士学位期间,他作为研究助理参与了多个项目,开发了基于GPU的算法,用于运动规划和不确定性感知。自2018年11月到2024年3月,Brian 担任谷歌大脑的研究科学家,专注于开发高效的算法和机器学习方法,使机器人能够在复杂的现实环境中进行规划和操作。

联合创始人拉基·格鲁姆(Lachy Groom),Lachy于2012年加入 Stripe,成为该公司的第30名员工。在 Stripe 工作期间,他参与了多个关键项目,包括支付产品的开发和全球扩展。最终担任了 Stripe Issuing 的负责人,领导团队开发用于创建、分发和管理实体及虚拟卡片的平台。在离开 Stripe 后,Lachy 积极参与天使投资,专注于早期阶段的创业公司。他通过自己的投资基金(LGF)支持多个行业,包括金融科技、气候科技和消费者互联网等。

“弥补遗憾” ?OpenAI跟投两轮

2024年3月,刚刚成立的 Physical Intelligence 筹集到了 7000 万美元的种子轮融资,这一轮由 Thrive Capital 领投,参与者还包括 Khosla Ventures、Lux Capital、OpenAI 和 Sequoia Capital。其中领投 Thrive Capital 是一家具有强大影响力的风险投资公司,通过其专注于互联网和软件领域的投资策略,为许多初创企业提供了资金支持与战略指导。

2024年11月,亚马逊创始人贝索斯又领投了4亿美元,至此,短短8个月的时间,这家AI创企的估值已经飙升至24亿美元

值得一提的是,Physical Intelligence 的这两轮融资中 OpenAI 都有跟投,可见其对这家初创公司寄予厚望,但作为行业领头的 OpenAI 为什么不去去自己做机器人,而是转为投资其他公司呢?

这也许是 OpenAI 的一些“遗憾”。

2018年OpenAI推出了Dactyl,一个类人机械手,通过强化学习算法实现了对物理物体的灵巧操控。Dactyl能够在没有特定编程的情况下,自主学习完成各种任务。

2019年,OpenAI展示了一款单手解魔方的机器人。这款机器人经过13000小时的训练,能够在一定干扰下高效地还原魔方。同年,OpenAI发布了Roboschool,这是一个用于模拟环境中控制机器人的开源软件,旨在为研究者提供一个平台来测试和开发强化学习算法。

但在两年后,OpenAI于2021年夏天宣布解散其机器人团队。

对于解散的原因,OpenAI 联合创始人 Wojciech Zaremba 解释说:机器人研究面临的数据稀缺问题使得研发受阻。相比之下,其他领域(如自然语言处理)能够获得更丰富的数据,从而促进更快的进展。并且随着OpenAI逐渐转向商业化,其资源和精力更多地集中于大语言模型的开发,而不是高成本的机器人研发。因此团队内部出现了对公司方向的不满和分歧,最终团队解散。

除此之外,一些分析人士指出,相比于机器人技术,研究语言模型被认为具有更高的投资回报率和更低的风险,这使得OpenAI更倾向于将资源投入到语言模型上。

尽管解散了机器人团队,OpenAI并未完全放弃其在机器人领域的梦想,近年来,OpenAI 开始投资与其技术路线相符的初创公司,如人形机器人公司Figure和1X Technologies,以及刚刚跟投的 Physical Intelligence。

具身智能大模型,还有更多

除了 Physical Intelligence,雷峰网总结国内外还有很多专注于具身智能大模型领域的初创公司。

例如由卡内基梅隆大学的两位教授 Deepak Pathak 和 Abhinav Gupta 在 2023 年联合创立的 Skild AI,其核心竞争力在于其构建的“可扩展的机器人基础模型”。

这一模型采用了基于Transformer的自适应架构,通过大规模数据训练,使其能够适应多种机器人形式和任务。与传统机器人技术不同,Skild AI不再局限于特定任务的数据收集,而是追求一种能够泛化应用于多种场景与任务的通用智能。

而它也在成立不到一年的时间内便获得了3亿美元的A轮融资,估值迅速攀升至15亿美元,吸引了包括杰夫·贝佐斯、软银集团和红杉资本等知名投资者的关注。

再例如由 Ivan Poupyrev 在在2023年创建的 Archetype AI,在种子轮融资中就筹集了1300万美元,主要投资者包括Venrock、亚马逊工业创新基金和日立风险投资等。

Archetype AI 的核心技术是其创新的物理AI模型Newton,这是一个大行为模型(LBM),能够捕捉人类难以察觉的复杂和快速变化的隐藏行为模式。Newton模型融合了多模态传感器数据和自然语言,实现了对物理世界的实时感知与推理。其核心技术能力包括时间序列理解、多模态输出、实时描述和多模态摘要等,这些能力使得Newton可以广泛应用于安全、城市管理、工程和零售等领域

除此之外还有由Brett Adcock在2022年创办的 Figure AI,这家在2024年完成了一轮6750万美元的融资,公司的估值达到了26亿美元。主要投资者包括NVIDIA、微软、亚马逊创始人杰夫·贝索斯的Explore Investments基金等。

其核心技术在于它端到端的神经网络框架,该框架能够处理多模态数据并生成语言响应和执行策略,以及视觉到行动的Transformer网络,它直接将视觉信息转换为动作指令。此外,Figure AI还专注于解决双足机器人的平衡与接触问题,这些技术的综合应用推动了人形机器人技术的发展,使其能够执行复杂动作,并在商业领域得到应用。

不光是国外,而国内也有不少涉足机器人行业的初创公司。

例如由前Robotics Learning研究员王潜与北大计算物理博士王昊于2023年12月联合创建的自变量机器人,已经完成Pre-A与Pre-A+轮融资,总金额达到亿元级。投资方包括德联资本、基石资本、啟赋资本、南山战新投,老股东九合创投持续加注。

其核心技术是“统一具身智能大模型”,它通过端到端的完全纵向统一和任务泛化性,使得机器人能够直接从原始输入处理到最终动作输出,无需中间步骤,并能够跨任务学习通用架构,从而实现更广泛的应用和更高的适应性。

还有由前珞石机器人联合创始人兼CTO韩峰涛与清华大学交叉信息学院助理教授高阳于2024年2月联合创建的千寻智能(Spirit AI),在成立后的短短几个月内完成了近2亿元人民币的种子轮和天使轮融资,主要由弘晖基金领投,其他投资者包括达晨创投、千乘资本、顺为资本和绿洲资本等。

千寻智能的技术核心在于其全栈的具身智能数据利用能力,使其能够高效地从多种数据源中学习并应用到机器人技术中。团队还开发了EfficientImitate高性能模仿学习算法,大幅提升了模仿学习的效率和泛化能力。

此外,千寻智能的EfficientZero算法在强化学习领域也展现出高样本效率。在硬件方面,千寻智能拥有强大的机器人运动控制系统和硬件开发能力,特别是在模型预测控制、仿生柔顺控制、动态环境操作等方面积累了深厚的经验。


]]>
机器人 //m.drvow.com/category/robot/1xyyOgARBHtsg0Bv.html#comments Wed, 06 Nov 2024 11:01:00 +0800
从灵巧操作巅峰挑战到具身智能产业前沿:这场科技盛会在珠海成功举办 //m.drvow.com/category/robot/6kxXULeOxBXB7apb.html 11月4日-5日,首届珠海国际灵巧操作挑战赛暨具身智能产业大会在珠海国际会展中心顺利举办。本次活动由珠海市人民政府主办、珠海市香洲区人民政府承办,以“灵巧新生力,智汇创未来”为主题,集赛、展、会于一体,吸引了近300位来自学术界、产业界及投资界的顶尖学者、行业专家及企业家参与,深入探讨具身智能技术的前沿动态与发展趋势,助力粤港澳大湾区具身智能产业集聚发展。珠海市委书记、省委横琴工委书记陈勇,珠海市委副书记、市长黄志豪,中国工程院院士谭建荣,浙江大学党委副书记、机器人研究院院长朱世强,原科技部火炬中心主任贾敬敦,中国人工智能学会副理事长、清华大学教授孙富春等出席。

巅峰赛事精彩启幕,诚邀各路精英齐聚珠海

11月4日下午,来自德国汉堡大学、美国Home Robot团队、香港大学、清华大学、中国科学技术大学及珠海本土企业的十余支海内外精英团队,围绕“机器人零件装配任务”、“在杂乱物体中拾取物品”以及“机器人杂乱线缆整理插拔任务”三大极具挑战性的场景赛道展开精彩角逐。

 这三个赛道都是目前机器人落地到现实产业中常见的三个场景。其中,工业机械臂进行零件装配的技术迭代尤为长久,一种是车床上面一切都是定义好的规则,螺丝或者钉子在固定的位置,这种装配相对标准简单;另一种则是在不规定的环境下,如像人一样,在工业环境下拆螺丝、装螺丝,则难得多。

这次比赛的环境设置是在前一种,但在工业场景中的难度也不低。工业场景对机械臂的精度要求要高于家庭机器人等,例如 ALOHA 的精度能达到部分家庭场景,但在工业场景中就不适用。加工零件的误差正常情况下不可能低于加工工具的误差。UMI采集数据的轨迹误差也是几十mm。

因此,对于亚毫米级别的定位要求,目前机械臂末端的精度能达到的水平还有很大的提升空间。

最终,来自清华大学的团队Ai&Robot获得“机器人零件装配任务”赛道一等奖,团队代表清华大学研究生罗弘赛后表示,“在比赛中深刻感受到了具身智能技术的蓬勃发展态势,以及同行们对技术突破和应用的无限热情。”

会上重磅宣布,明年珠海将继续举办第二届珠海国际灵巧操作挑战赛暨具身智能产业大会,一等奖奖金将高达100万美元,欢迎各路精英齐聚珠海。

行业大咖云集,共谋产业发展新机遇

近年来,具身智能成为了国内外产业界、学术界和投资界重点关注并大力投入的硬科技赛道之一,有望成为继PC、智能手机、新能源汽车之后的下一个典型智能终端,带来颠覆性的产业升级机会。具身智能技术如何持续发展与突破?又如何在改变大众生活的同时,赋能千行百业?11月5日上午,具身智能产业大会盛大开幕,各界嘉宾齐聚一堂,通过专业解读、案例分享、经验交流等形式,精彩呈现了具身智能领域理论研究新进展与产业应用新成果,推动学术界、产业界与投资界之间深度对话。

中国工程院院士谭建荣在致辞中表示,“珠海是改革开放的前沿,也是许多高新技术的发源地。”他强调,要把握机遇,注重高水平人才培养和引进,打造具有国际竞争力的创新团队,推动具身智能产业在珠海加快发展。

随后,原科技部火炬中心主任贾敬敦发表致辞。他表示,“相信在这个充满机遇的时代,珠海一定能够在人工智能产业领域塑造自己的特色,加快培育现代化产业体系,形成新质生产力。”期望以本次大会为契机,吸引更多的年轻人投身于具身智能领域的研究与实践。

大会主旨分享环节,多位重量级嘉宾带来了各自领域的最新学术成果和思考见解。浙江大学党委副书记、机器人研究院院长朱世强对AI背景下机器人技术的发展路径与瓶颈挑战进行了深度分析,并展望了机器人未来发展蓝图。香港大学教授席宁分享了机器人技术在工业自动化、生物医学、社会服务等领域的应用成果,以及未来发展面临的挑战与机遇。德国卡尔斯鲁厄理工学院教授Ole Doering从中西双重视角出发,深刻剖析了AI技术与伦理问题。中国人工智能学会副理事长、清华大学计算机科学与技术系教授孙富春结合最新研究成果讨论了具身智能在产业应用中的挑战,并提出了传感器技术、算力硬件支持以及具身智能体构建等领域的未来发展趋势。分会场则以“具身智能赋能生产生活”为主题,聚焦解决企业生产和群众生活领域的实际问题,进行了广泛而深入的探讨与交流,为推动具身智能技术的落地应用与企业发展赋能。

创新成果惊喜亮相,零距离感受科技魅力

大会现场设置了具身智能产品展示与互动区域,吸引了大量观众驻足体验。“脊柱内镜手术机器人”“人形仿生机器人”“机器人咖啡机”等30余件前沿具身智能产品,在此通过线上线下结合的方式进行全方位展示。借助“静态展览+互动体验”,观众们可以现场与人形机器人互动、观看智能灵巧手弹奏钢琴,甚至还能品尝到由机器人亲手制作的香浓咖啡,不仅让观众近距离感受到了具身智能技术的非凡魅力,更让他们深切体会到了这项技术为日常生活带来的变革与便利。

值得一提的是,本次灵巧操作挑战赛面向全球进行实时直播,吸引了众多国际人才、创新项目及广大科技爱好者的关注。同时,珠海本地中小学校组织学生在线观看科普教育直播,通过深入浅出的讲解,为学生们搭建起了通往科技世界的桥梁,更在他们心中种下了科技创新的种子。

抢抓产业发展机遇,打造经济增长新引擎

在大会现场,重磅消息接连发布。润星泰电器、逸科兴制造、智新自动化等珠海优质创新企业发布了在具身智能产业链的重大科研攻关项目,包括“合金材料压铸领域的智能制造方案”“电子元器件生产领域的机械灵巧手装配方案”等11项技术攻关项目,现场张榜金额超亿元。聚焦具身智能产业链攻关项目,围绕企业研发创新需求,大会现场还隆重揭晓了《珠海市香洲区首批具身智能创新链智库名单》,该名单汇聚了浙江大学教授朱世强、清华大学教授孙富春、香港大学教授席宁等十余位行业内的顶尖专家与学者,他们将以其深厚的专业知识和前瞻性的战略眼光,为珠海具身智能产业的蓬勃发展提供不可或缺的智力支撑与战略引领。通过搭建产学研用紧密结合的创新平台及企业服务平台,将进一步加速产业链创新链人才链的深度融合,推动更多科技创新成果高质高效转移转化、落地开花。

此外,本次大会特别增设了签约环节。香洲区与清瑞博源智能、有怡科技、跨维智能等6家具身智能领域的创新企业现场签订了投资协议。这一系列项目的成功落地,将进一步夯实香洲区在具身智能产业领域的坚实基础,为人工智能产业的高质量发展注入强劲动力。

“珠海正在努力从“精而专”向“大而强”“大而优”转变。希望本次大会能成为技术交流、产业合作的重要纽带,也诚邀人才把握机遇,来到珠海共谋产业发展。”珠海市副市长李翀在致辞中表示,珠海将以此次活动为契机,进一步加大对具身智能等新质生产力的支持力度,推动更多创新成果在珠海落地转化。

首届珠海国际灵巧操作挑战赛暨具身智能产业大会的成功举办,不仅展示了具身智能产业的最新科研成果与技术突破,更如一股强劲的东风,吹拂并激发了行业内前所未有的创新活力。

未来,珠海将秉持开放合作、创新驱动的发展理念,持续推进“人工智能+”行动,重点围绕‘算力、算法、数据’夯实通用人工智能产业底座,强化人工智能产业创新引领、应用示范、制度供给和人才集聚,加快发展人工智能等新质生产力,推动人工智能产业向高端化、集群化、国际化迈进,为经济高质量发展注入新动能。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/6kxXULeOxBXB7apb.html#comments Wed, 06 Nov 2024 10:47:00 +0800
腾讯 Robotics X 无战事 //m.drvow.com/category/robot/8vTtEiKDSJ4Fppgx.html 作者 | 吴华秀  陈彩娴

编辑 | 陈彩娴


2020 年 11 月,深圳刚步入南方的秋天,在一个寻常的工作周,腾讯机器人实验室(Robotics X)的几乎全体研发人员都聚集到位于腾讯滨海大厦旁边的假日酒店,在酒店里连开了三天头脑风暴会。

会议每天讨论的主题都不同:第一天是移动,第二天是操作,第三天是智能决策。与会者大多聚精会神,围绕会前实验室研究员根据不同主题制定的方案进行严肃讨论,中间还不时夹杂着大胆的质疑与驳斥,力求找到最完美的解决方案。

这个会议的规模大约 40 人,会上没有任何领导参加,秘书也不对任何会议发言进行记录,每个人都可以畅所欲言。他们每天从早开到晚,经过三天的车轮战与不记名投票,最终得到一致结论:未来机器人的重点研究方向应该聚焦在移动、操作与智能决策三块能力上。

第三天会议结束后,他们与张正友一起吃饭,将讨论结果反馈给他。张正友欣然同意,所有人都很高兴,对接下来的研究摩拳擦掌。

事实上,这次头脑风暴会是腾讯机器人发展史上的一次里程碑事件:

Robotics X 在 2018 年成立,此前一直处于技术摸索的混沌期。尽管张正友提出「A2G」的指导方针,但涉及七大方向,每个人都提出了五花八门的想法,执行中难以形成统一步伐。

当时聚集在 Robotics X 的一群人都是海内外机器人研究方向的杰出人才,对提高国产机器人的技术研究水平都有着高度的热情与时代使命感。因此,两年过去,当成果还没达到大家的期许时,所有人都有些焦急。

这次会议后,实验室进行了一次架构调整,将 40 人划分为了四条线:系统中心、控制中心、感知中心与智能决策中心,其中系统中心又分为本体组与嵌入式组、软件组;同时在 2021 年收敛到了三大技术方向,并成立了一个专门的技术委员会。

经过调整,很快,腾讯的机器人成果开始陆续面世,包括空翻两轮机器人 Ollie、四足机器狗 Max、IDC 运维机器人等,并领先其他中国企业在模仿学习、灵巧手等方向做了许多前沿研究。

但 2022 年之后,腾讯 Robotics X 开始出现人才频繁出走的趋势。据雷峰网了解,部分人选择离开腾讯 Robotics X 的原因主要有两方面:一是腾讯的机器人研究不追求商业化、不做量产;二是特斯拉发布擎天柱后,人形机器人逐渐成为主流,但人形不是 Robotics X 的研究重点。

在当下技术与商业 KPI 过度捆绑的时代,腾讯 Robotics X 一直坚持机器人的前沿研究,其技术理想主义精神尤为可贵。但在如今硝烟四起的具身智能叙事中,并非所有人都甘于确定性。

总有一些人渴望参与「战斗」。

跨界研究机器人

2018 年 Robotics X 的成立,对于腾讯与国内许多早期机器人研究者来说都曾是一次划时代事件。

那时正值腾讯在中概股如日中天的爬升期。移动互联网浪潮到来,腾讯从 2016 年开始迅速发展。2018 年 3 月 21 日,腾讯发布 2017 年 Q4 和全年财报:

市值高达 4.39 万亿(约合 5595 亿美元),赶超 Facebook 成为「社交之王」,排名全球第五,仅次于苹果、谷歌、微软与亚马逊。

也是在 2018 年前后,腾讯决定进一步加码前沿科技和基础研究,派了几位高管去北美考察海外的科技创新,参观了波士顿动力等几家硬科技公司后,发现机器人的前景广阔,回国后便决定成立 Robotics X,在机器人方向投入资金进行研发。

与 2016 年成立的腾讯 AI Lab 一样,Robotics X 也挂靠在 TEG,与 AI Lab 一起作为腾讯 TEG 旗下的两大基础研发部门,共同为腾讯的 AI 产业发展提供前沿的基础技术支撑。

腾讯 AI Lab 与 Robotics X 的创始主任都是姚星(现元象 Xverse 创始人)。姚星将台子搭好后,从世界各地挖掘顶尖科技人才,先后挖来了张潼、俞栋、张正友等 AI 大牛,其中张正友便是后来 Robotics X 的主任。

张正友是计算机视觉与机器人背景出身,也是国际最早将计算机视觉与机器人相结合起来研究的知名科学家之一,1998 年加入微软,彼时已在微软工作近二十年。

为了挖来张正友,姚星特地飞去西雅图(微软总部所在地)与之长谈,希望他去 Robotics X 担任一号位。张正友一直对机器人很感兴趣,于是在 2018 年 3 月回国,加入了腾讯,从 0 到 1 组建 Robotics X。

张正友加入腾讯没多久,就提出了机器人研究的 A2G 指导方针,这在当时的国内乃至海外都十分超前——

所谓「A2G」(ABCDEFG),即机器人研究的几大技术要素的首字母缩写,分别是人工智能(AI)、机器人本体(Body)、精准控制(Control)、发育学习(Developmental learning)、情感理解(EQ)、灵巧操控(Flexible manipulation)、守护天使(Guardian Angel)。

除了 A2G,张正友还提出许多前沿想法,包括强调科技向善、让机器人走进千家万户的愿景,许多人慕名而来。

Robotics X 刚成立时,团队办公室位于朗科,规模不大,第一年只有十几个人。经过 2019 年入职高峰期,2020 年 Robotics X 的规模扩大到了 40 人左右,其中大多数人都是海内外高校机器人相关专业的优秀硕博生。

黎雄、郑宇、梁聪慧、来杰、陈相羽、戴媛、熊坤、韩磊等等人,都是在 Robotics X 刚成立时加入。

据多位早期成员叙述,他们选择加入腾讯 Robotics X,一是因为张正友提出的许多关于机器人的研究思路都十分具有前瞻性与吸引力,二是当时国内机器人相关的工作机会并不多,腾讯是极少数果断布局机器人的大厂,并给 Robotics X 提供了非常丰富的研究条件。

因此,许多海内外机器人研究组的学生毕业后找工作或在校期间找实习,都是首先选择加入腾讯。

腾讯也不负众望,将 Robotics X 打造成了国内机器人人才的技术理想国:

在研究方向上,Robotics X 对基础研究十分重视。腾讯高层不干涉具体的研究内容,允许大家自由探索。在这期间,他们提出过许多五花八门的项目,包括包括变形自行车、遥操作、机器狗、轮滑机器人等等,还与腾讯云合作工业巡检机器人项目。

在研究资源上,实验室成员在机器人研究所需的硬件设备与算力采购不受限。腾讯在滨海大厦为他们提供了一个大的办公空间,用于机器人的实验调试、展厅与会议办公。来杰等人也在 2018 年给腾讯搭建了展厅的机器人部分,包括 3、4 个机器人,主要技术是协作臂加 AI 算法。

在职级待遇上,Robotics X 的研发职级也普遍高于其他业务线的研发人员。例如,梁聪慧作为技术专家刚入职腾讯时定的职级就是 12 级,控制算法技术专家郑宇一入职就是 13 级。

更难得的是,习惯互联网快节奏的腾讯,却愿意在机器人领域慢下来。

腾讯 Robotics X 不设商业化 KPI 与绩效考核,研究目标更多围绕前沿技术的突破展开。一般来说,腾讯的考核分为上半年与下半年,每个团队会有二星或一星的指标。Robotics X 的成员不参与常规考核,因此研究目光可以更加长远,聚焦在行业更难的问题上。

虽然环境宽松,但实验室的成员并不松懈。据 Robotics X 前员工王翼叙述,Robotics X 的研发人员几乎每天都会工作到晚上 10 点到 12 点之间。「那时候大家都觉得自己在做一件对社会十分有意义的事,所以每个人的自驱力都很强。」

比如,他们想将机器人落地到养老场景中,几个团队成员就真的跑去养老院做调研,了解养老机器人实验与现实之间的差距。

这种将前沿研究与实际场景紧密结合的探索方式,后来也成为 Robotics X 的研究传统。据悉,近日很火的腾讯小五机器人研究团队就是长期驻扎在养老院做实验。

他们想要挑战的问题,也都是机器人领域中最难的问题,比如灵巧手研究。王翼告诉雷峰网,他们从 2020 年开始就已经布局研究灵巧手,领先国内许多机器人团队大约 2 到 3 年。

一开始 Robotics X 没有分组,而是采取项目制。由于人数不多,所以实验室的几乎所有项目都是全员参与,团队成员之间的关系也十分融洽。

「那时候 Robotics X 有高校实验室与 Startup(创业公司)的自由,但又比它们资源都丰富,就像一个技术的理想国、乌托邦。有资金支持、有非常优秀的人才,而且敢于尝试,所以出成果也很快。」 Robotics X 的早期成员蒋升告诉雷峰网。

2019 年 12 月,Robotics X 发布自平衡自行车,首先打通了硬件与算法。

2020 年 11 月,他们又发布了能走梅花桩的四足机器狗 Jamoca,实现了感知、运动与控制规划两大技术模块的集成融合;以及像小摩托车的自平衡轮式机器人。

这两项研究工作都被当年的机器人顶会 IROS 接收为 Oral 论文。Jamoca 项目也获得腾讯内部的技术突破奖银奖。

Jamoca(图片源自新华网)

虽然腾讯是跨界研究机器人,但在当时国内的技术竞争中,其成果不仅领先了一批互联网公司,在互联网大厂中独树一帜,而且与大批纯机器人技术出道的创业公司也不分伯仲、甚至有所领先。

腾讯机器人也声名大噪,打破了外界对互联网公司的刻板印象,也在传统机器人领域掀起了新的浪花。腾讯的入局,某种程度上也提高了从业者对机器人前景的发展信心。

更聚焦、更清晰

刚成立的前两年,腾讯 Robotics X 对机器人的研究更多处于建立团队、自由探索的阶段。虽然有 A2G 的方向指导,但整体来说,研究范围还是过于宽泛。

王翼告诉雷峰网,由于 Robotics X 的氛围宽松开放,研究员积极踊跃申报项目,加上各种校企合作的项目,慢慢地 Robotics X 的研究方向众多,研究员的精力被分散到多个不同的项目上,难以全情投入。

「到 2020 年下半年,大家都有点焦急。聚集到 Robotics X 的这批人都是怀有理想的,对很多人来说,拿高薪在腾讯躺平其实没有意义,做出有影响力的成绩才是大家早期加入的初衷。」前腾讯 Robotics X 系统中心主任、现智可派机器人创始人梁聪慧向雷峰网评价。

虽然 Robotics X 在刚开始的两年就发布了一系列亮眼的机器人 demo,也收获了一定影响力,「但这还远远不够。」蒋升认为,当时「实验室做的东西,大多都是一些点,没有形成一个完整的产品。」

那段时间,Robotics X 的成员对自己不满意,也夹杂了许多对自身前途命运的思考——一次能将团队力量凝聚起来的事件迫在眉睫。所以,2020 年国庆后,他们便提出召开一次 Robotics X 的全体研究员讨论会,大家一起站在全局的角度上思考机器人的未来。

于是,文章开头那一幕就上演了:实验室大约 40 号人相聚于酒店会议室,大门紧闭,一连开了三天会。

在 Robotics X 刚成立的两年里,实验室的成员虽有职级划分,但彼此之间的交流合作相对平等,大家都处于一种开放探索的状态中,直到 2020 年下半年才正式划分组织架构。

2020 年 11 月的头脑风暴会议结束后,Robotics X 的研究方向逐渐收敛到三大技术要素:移动、操作与智能决策。这样收敛的原因是,他们认为最终要服务于人、走进千家万户的任何一类机器人都基本包含这三块能力,相当于将 A2G 的内容精简。

同时,Robotics X 将实验室的架构划分为了四个研究中心:系统中心、控制中心、感知中心与智能决策中心,负责人分别是梁聪慧、郑宇、魏磊与韩磊。每个中心大约 10 人。

这四个中心的一号位都是当时国内机器人领域的佼佼者:

梁聪慧是第一批国家留学基金委公派到意大利罗马读博的学生,2011 年回国后在中联重科工作了三年,后去新加坡南洋理工大学任教,研究智能工业机器人,2018 年 11 月入职 Robotics X,职级为 T12,是技术专家。

他是系统中心的 Tech Lead(技术负责人)。系统中心又分为本体组与嵌入式组,本体组的组长是黎雄,嵌入式组的组长是来杰(现星尘智能创始人)。

郑宇在机器人领域有 20 年的研究经验,尤其在控制领域屈指可数。博士毕业于美国北卡罗莱纳大学教堂山分校,与潘佳(逐际动力首席科学家)是同学,2018 年回到深圳。

业内人士向雷峰网这样形容郑宇:「整个机械硬件中最重要、也最难的就是手,购买的成本很高,自研的话技术又难,国内能研究手的人凤毛麟角,郑宇是其中一个。」

负责感知中心的魏磊博士毕业于南洋理工大学,加入腾讯前在 IISRI 实验室工作。IISRI 汇聚了澳大利亚规模最大的系统建模与仿真研究团队,魏磊在其中研究医疗机器人与 XR 技术的结合。

韩磊负责的智能体学习中心是最稳定的。韩磊的博士毕业于北京大学,2016 年曾获得过中国人工智能学会优秀博士生论文奖,2023 年还获得过 SIGGRAPH Asia 最佳论文提名,目前在 Robotics X 同时研究大模型与机器人。

明确四大中心、划分三大方向后,Robotics X 的研究更聚焦,成果也更加蓬发。

大约在 2021 年上半年,Robotics X 不仅做早期研究,同时开始设想不同的场景,比如城市救援、养老、医院乃至灾区救援、远程医疗等。

基于这三大方向(尤其是移动与操作),Robotics X 发布了许多超越时代、在行业认知之外的杰出成果,包括轮腿式机器人、四足狗、双臂调酒机器人等等。

2021 年之前,Robotics X 的机器人涵盖多个方向,从自行车到轮滑机器人到四足狗;2021 年之后,腾讯机器人开始重视操作,从手臂到灵巧手到调酒师。

Ollie

2021 年腾讯发布了能够「空翻」的两轮机器人 Ollie,这个项目是基于张正友在 ICRA 2020 上发表的一篇论文,初衷是做一个能跳跃、迈步上楼梯的高动态机器人。当时所有人都觉得这是一个不可能的任务,国内也没有先例,但最终腾讯将 Ollie 做了出来,甚至能跳上 0.6 米高的台阶。

同年,他们还发布了双臂调酒机器人,打开了人们对机器人应用场景的想象力。

此外,腾讯机器人研发的最大优势,是从一开始就考虑了 AI 算法与机器人的结合。

据了解,腾讯 Robotics X 也是最早在机器人研发上实现模仿学习的团队之一,四足机器狗与调酒师都是基于模仿学习。2021 年开始,他们在真狗上贴上动捕设备,让真狗在自然环境中跑动、收集数据,然后通过模仿学习让机器狗生成动作,无需任何编程就能跑动。

腾讯机器人实验室并非像传统机器人公司一样以产品化为目的,而是以这些机器人作为前沿技术探索实验平台,进行本体设计、系统集成到广泛感知以及控制规划算法等诸多领域的研究任务,完成全栈技术能力的积累。

Robotics X 的战略方向始终是机器人前沿技术探索,而不是探索量产与工业化。

控制中心、感知中心与智能体中心追求在机器人的前沿研究上更上一层楼,团队有一定的学术 KPI,而聚集了梁聪慧、来杰、熊坤、陈相羽等人的系统中心为整个实验室提供机器人的本体架构、软件架构等工程能力,是唯一不用背学术 KPI 的团队。

Robotics X 大体偏研究,而系统中心重工程,将各个团队的研究成果集合起来,设计系统、管理项目,为整个实验室提供机器人的本体架构、软件架构等工程能力。腾讯允许一个研究员带两个实习生,工程团队的规模一度扩大到 30 人左右。

2021 年到 2022 年,Robotics X 发布的技术成果不仅在国内产生影响力,在海外也引起广泛的关注与讨论。无论是灵巧手、Ollie 等研究成果的进展,还是机器人与 AI 算法结合的战略,Robotics X 都走在国际的前沿,能与海内外优秀的机器人团队「掰一掰手腕」。

但尽管 Robotics X 技术上很成功,却始终没有迈出商业化的那一步。

据部分前 Robotics X 成员叙述,他们起初出于个人兴趣,曾尝试过一些落地的产品与服务,比如跟腾讯云合作研究带操作能力的巡检机器人,但发现落地链条太长、难度太高后,落地范围收缩到了腾讯内部的业务,做了数据中心服务器的搬运机器人。

在 2022 年特斯拉发布擎天柱、机器人商业化的大潮来临后,Robotics X 也始终没有改变自己的定位。而这样的决定,必然会有一部分人与它分道扬镳

Robotics X 无战事

在这波以人形机器人为中心的具身智能浪潮中,从腾讯 Robotics X 出来的创业者也吸引了资本与市场的许多关注:

一支是陈相羽创立的艾欧智能,其在 2021 年年底离开腾讯去了鹏行,然后从鹏行出来创业;一支是 2022 年出来的梁聪慧、熊坤。梁聪慧先去了达闼,现在创办智可派机器人,而熊坤则先去了 IDEA 研究院,现在仍在机器人领域发展;还有一支是 2022 年年底出来的来杰,创立星尘智能时带了 5、6 个人,包括戴媛、安昭辉等。

从Robotics X 出来的机器人创业者大多是系统中心的,他们都在 2022 年之前离开。2022 年离开 Robotics X 的还是感知中心的一号位魏磊,他离开腾讯后回到了学术界。今年控制中心的一号位郑宇则去了优必选,担任研究院副院长。

总的来说,腾讯 Robotics X 的研究团队相对稳定,相当一部分早期成员仍留在实验室做机器人研究。但从 2022 年开始,也有一部分人选择离开 Robotics X。

据雷峰网与多位前 Robotics X 成员的访谈,他们选择离开腾讯这个大平台的一个共同原因,都是因为:Robotics X 坚决不追求商业化,而是聚焦在前沿研究上。

在前 Robotics X 成员蒋升看来,「在过去的几年,Robotics X 完成了一个机器人产品的前半部分所需——技术沉淀,但机器人还有后半部分的量产落地,而 Robotics X 没有继续下一步。」

Robotics X 的技术理想国氛围,对于许多研究员来说,前四年有着乌托邦一般的美好,他们可以在这样高瞻远瞩的环境中自由探索,且不用害怕失败。但随着外部环境的变化,机器人的赛场越发热闹,能够参与竞争、将产品量产落地的想法逐渐在一部分人的心中占据上风。

在一些人看来,商业化、量产是相对研究而言的「更进一步」。尽管他们也知道,机器人领域还有许多前沿的研究问题没有解决,但对他们而言,只做研究、不做商业化就是「不进则退」。因此,当具身智能的浪潮来临后,他们都选择了离开腾讯,或创业、或加入其他距离产业更近的机器人公司。

而腾讯 Robotics X 坚决不追求商业化、不做量产的选择,也有内外部因素的双重作用。

自 2018 年成立起,Robotics X 始终未将商业化作为目标。

Robotics X 和 AI Lab 平级,两者所归属的 TEG 事业部在腾讯内部承担着底层技术的重任,默默为公司提供全方位的运营解决方案和服务支持,反哺原有业务。

当时 TEG 事业部更倾向于让两个团队研究前沿技术,打造科技影响力,不设商业化要求。相比之下,腾讯云 CSIG 的优图实验室很早就开始商业化。

虽然 Robotics X 没有直接的商业化产出,但因为每年都在机器人领域展示出创新性成果,在海外产生了显著的学术影响,能得到腾讯高层的认可,所以几年过去,腾讯内部对 Robotics X 侧重研究的战略定位也没有发生过改变。

此外,在过去的几年,机器人行业的发展速度非常快,越来越多机器人公司进入公众视野。

2019 年麻省理工学院首次开源四足机器人,将四足机器狗的热度炒了起来,小米、鹏行、OPPO 等企业纷纷下场造「狗」,并从国内各个领先的机器人团队挖人,腾讯 Robotics X 的研究员也在各个猎头的射程范围内。在外界的高薪诱惑下,Robotics X 是被动方。

而仅三年,特斯拉发布擎天柱,机器人的发展又转向人形机器人与通用机器人的故事;2023 年年初谷歌发布 RT-1 后,具身智能的大浪又扑来。

在过去仅十年,机器人的技术研究与商业化都聚焦在机器人的下肢能力上,如扫地机器人、四足狗等;但近两年,上肢操作与灵巧手能力成为重点。值得一提的是,腾讯很早开始上肢操作与灵巧手等方向的研究,但在人形机器人的战略上却比这一波新成立的具身智能创业公司慢半拍。

此前腾讯在移动、操作与智能决策三块的研究布局,也是当前具身智能公司的研究重点。Robotics X 有方向前瞻优势,但由于推进节奏较慢,天下武功唯快不破,腾讯机器人在这波具身智能浪潮中的声量相较前几年并不突出,因此引起外界对其竞争力减弱的担忧。一部分人也选择离开。

据了解,Robotics X 的研究节奏慢,除了是其前沿研究的定位导致慢,也有腾讯内部降本增效的原因。

在 Robotics X 的成立早期,腾讯正处于移动互联网的攀登期,所以对实验室的资源投入也十分慷慨。但 2022 年之后,互联网行业遭遇寒冬,「增长放缓、裁员、业务收缩」成为互联网大厂的主旋律,腾讯也开始存粮过冬。

尽管腾讯没有减少对 Robotics X 的投入,但随着机器人行业的技术发展与更新迭代,Robotics X 原先的投入「相比一个创业公司所能融到的资金规模已是小巫见大巫」。

在人员上,实验室的人员规模始终维持在 40 人左右。腾讯 Robotics X 也从 2022 年开始设立项目 KPI,每个人同时至少要兼顾 2 个研究项目,研究人员的精力被分散,难以集中成势攻破,所以相比创业公司的一鼓作气,腾讯的机器人成果发布也较慢。

据雷峰网了解,Robotics X 里面的个别人也曾想过尝试商业化探索以创造营收。

2022 年前后,不少人期待 Robotics X 能够成立一个类似 AI Lab、跟 AI Lab 配套的 AI 平台部,也希望有一个机器人平台部,把他们在做的新型产品量产落地。但这一设想最终没有落地,原因大约有两方面:

一方面,腾讯缺乏像小米那样强大齐全的硬件供应链积累与经验;另一方面,硬件天然的长周期特性并不适合互联网快攻快打的节奏,再叠加此前腾讯数次硬件产品失利的前车之鉴,其中智能音箱便是一例证,腾讯对机器人硬件产品的期望有所下降。

而且,如果想打造好一个机器人产品,尤其是一个非常复杂的类人形机器人,团队规模至少要达到 100 号人以上。而 Robotics X 实验室只有 40 号人的规模,只够做原型机的阶段。对于彼时正推行降本增效的腾讯而言,人员规模难以扩大。

同时,相比腾讯的主营业务,机器人商业化能给腾讯带来的收益微乎其微。

对于优秀的人才来说,最大的折磨往往不是停滞不前的收入,而是一个伟大的时代或许就在眼前,他们却无法参与。

Robotics X 的理想主义气质在喧哗的具身智能时代有其可贵之处,但最终选择离开的人,都是希望能在商业场上厮杀的人。他们希望从开放的战斗中获得更大的成长。

从腾讯机器人实验室出来创业的团队,如今也仍与 Robotics X 有着深入的合作。

2022 年之后,Robotics X 调整了项目规划,将原来多个单点突破的技术点合并,变成综合型的大项目来进行,各个项目的融合变多。

但当外界火热讨论人形机器人的故事时,腾讯依然没有将重点放在人形上,人形只是作为 Robotics X 对机器人前沿研究整个大方向下的一个分支推进。

腾讯 Robotics X 在 2022 年到 2023 年间经历了组织和人事调整,有人选择离开。据了解,在机器人发展迅速的冲击下,现在 Robotics X 也有了新的 KPI,并进行了战略上的调整。

随着外部环境的急剧变化,腾讯也不得不开始重新审视机器人的研发战略,寻找自己在市场中的位置。

具身时代的 Robotics X

以往 Robotics X 每年的成果产出都能让人眼前一亮,但 2023 年之后,由于大厂与创业公司都发布了各种各样的机器人成果,大家对机器人已经司空见惯,Robotics X 的新成果没能再像从前一样引起太大的轰动,包括双足机器人。

此外,其展示的部分成果也逐渐被一些创业公司追赶上。

Robotics X 前员工张宁告诉雷峰网,比如星尘智能发布的机器人,他们之前在腾讯就探索过,但一直没有做出来,柔顺性也不够好。来杰等人出去成立星尘智能后所发布的产品效果视频,给还留在实验室的人带来了压力。

在这一波具身智能中,很多人认为腾讯确实落后半拍,主要跟其家大业大、在新的浪潮来临前转身不够快有关;但若说腾讯 Robotics X 的机器人不强或错过了具身智能,他们则认为有失偏颇。

尽管机器人没有直接为腾讯贡献营收,但机器人始终是腾讯技术的一大代表。

在过去的十年中,中国的互联网大厂成立过许多聚焦于前沿研究的基础技术实验室,但最终大多都没有坚持下来,要么妥协于整个公司的商业化增长目标,要么直接关门倒闭。Robotics X 是少数还存活的大厂前沿实验室,并仍在不断产出成果。

今年 7 月,腾讯 Robotics X 的机器人新研究登上了《Nature》子刊的封面。9 月,腾讯发布了医疗场景的双足机器人小五(The Five),是其在追求机器人与人居环境合二为一的道路上的一个里程碑成果。

成立六年,在机器人还没有获得大量关注时,Robotics X 就招募了一批硕博生与实习生,培养了大量人才。这批人如今也成为具身智能浪潮中的核心创业者或技术人才。

互联网的基因与大企业的特性,让腾讯在具身智能的浪潮里难以像短小精悍的机器人初创企业一样灵活适应。但在软件类的战场上,腾讯还是有自己的优势与影响力。

据了解,近日腾讯 Robotics X 也调整了方向,明确不做机器人本体,更聚焦在具身智能和云平台方面。人形机器人虽然是风口,但硬件本体链条很长,难以发挥大厂的平台优势。

这一趋势下,Robotics X 或将会有更多研究方向偏重硬件的人员出来创业。

在短短的六年间,Robotics X 确实已经完成了自己在机器人前沿研究探索上的使命,但在斗争激烈、快速变化的市场环境中,是否参与竞争或许不由腾讯自主选择。

如何适应新的行业要求,将决定 Robotics X 在中国机器人领域中的位置。

注:文中王翼、蒋升、邱松、张宁为化名。

关于具身智能领域更多经常的人和事,欢迎添加作者微信 whx23999Fiona190913 交流。

此外,雷峰网成立了机器人读者群,希望进群的读者请添加编辑微信 aitechreview、并备注姓名-单位-职位。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/8vTtEiKDSJ4Fppgx.html#comments Tue, 29 Oct 2024 17:57:00 +0800
智澄 AI CEO 胡鲁辉:下一个 GPT 是物理智能 //m.drvow.com/category/robot/UNPlG4LnX6DZbNQ5.html 2022年底,ChatGPT 一经推出,不多久便点燃了全球的科技热情,一众围绕大模型创业的公司纷纷涌现。一片喧闹中,彼时在西雅图 Meta的胡鲁辉,将目光越过了生成式人工智能大模型,望向注重感知与理解世界的物理智能模型。

所谓物理智能(Physical Intelligence),其核心在于使机器能够感知、理解物理世界,并与之交互。近几年,物理智能成了热门话题,不仅能在各路技术大牛的演讲中频频听到,斯坦福大学李飞飞老师更是直接创办公司 World Labs,进行物理智能领域的探索。

在胡鲁辉老师看来,物理智能会是继 GPT 等信息智能之后、更具想象力的下一站,而机器人将是其最佳载体。正值国内具身智能浪潮,胡鲁辉决定结束西雅图的安逸生活,回国创业,亲自下场将自己的想法付诸实践。

今年4月,胡鲁辉在杭州创办智澄AI,短短四个月后即推出了 TR1 和 TR2 两款人工智能机器人产品,并开启了商业化进程。在他的设想里,智澄 AI 会依据实际应用场景,进行“沿途下蛋”,推出适配的机器人产品。

胡鲁辉在机器人圈或许是个“生面孔”,但在人工智能领域,他却是一个地道的行业老炮。作为一名资深的人工智能专家,胡鲁辉的职业旅程遍布了全球科技行业的一些重要地标。从早年留学美国,历经微软、亚马逊、华为美国研究院,再到卸任的 Meta,胡鲁辉在人工智能领域积淀了十余年行业经验。

此次创业,似乎是一场跨界行动,但对胡鲁辉而言,是因为看到了其中蕴藏的机会。“目前机器人有许多难点、痛点,如成本高、泛化性差,要解决这些问题,仅靠硬件远远不够,还需要从软件和模型入手。”

“我们的核心技术是物理智能,但我们不是只做物理智能模型,而是要做软硬件兼具的机器人。”这也是他对智澄 AI 的愿景,做一个具有挑战性的智能机器人,最终推动机器人时代的到来。

围绕此次创业,AI 科技评论与胡鲁辉进行了一次深度对谈。在交谈中,他向我们展现了对物理智能领域的深刻见解,同时,我们也能感受到胡鲁辉对此次创业的热情与信心。过往丰富的行业经历,让他为团队拉来了一众志同道合的优秀人才;此外,多元的产业背景、此前成功的创业经历,让他对如何运营一家商业化科技公司有了自己的解法。

以下是 AI 科技评论与胡鲁辉的对话。

相信机器人是未来

AI科技评论:您什么时候有了创业想法?

胡鲁辉:我一直都有创业的热情。早在 2018年 AI 1.0 时代,我第一次回国创业将人工智能与千亿级零售业务智慧升级相结合,此外在Meta、华为、微软、亚马逊等科技巨头的经历我也深度参与了AI模型训练、AI+信息流、AI+云计算、AI+物流商流等一次次技术变革浪潮。这次 AI 2.0 时代来临,我觉得机会比之前的浪潮更大,而且论创业环境,我认为国内机会更多,所以就决定回来了。

AI科技评论:您此前从事的方向更偏向于算法软件这块,现在做机器人会不会又是另一个领域?

胡鲁辉:其实机器人并非新东西,已有十来年、甚至更久。机器人此前也火过,后来由于各种原因又归于平静了。此次我们创业的初衷和主要目的,是因为相信机器人是未来、是下一个时代——机器人时代。

目前机器人发展处于一个尴尬阶段,因为有两大痛点。第一个是机器人特别贵,随便一个人形机器人也需要好几万、几十万。相比之下,一辆不错的汽车也就 20 来万,但一个能表演的机器人也都要几十万,甚至功能不够完善,只能表演;第二个痛点,是泛化技术有难度,可靠性、稳定性、工程性根本不行。然而这两个问题相互关联,要解决不能单靠硬件,还得要从模型和软件入手,让机器人变得更好、更智能,能够完成泛化作业。我们想解决机器人根本性问题,也就是机器人的数据和智能的问题,大数据和人工智能正是我的强项。

AI科技评论:您曾发表许多关于 AI 大模型相关内容,如今跨界做机器人,您的创业方向具体是什么?

胡鲁辉:针对机器人领域的挑战,我们认为人工智能是有效的解决方案,尤其是大模型。目前,大模型在人工智能领域备受关注,如 ChatGPT 和国内月之暗面、智谱等,它们主要开发多模态大模型,用于构建交互式对话系统,即 Chatbot。

但是我们的产品将采用不同的技术路径。我们专注于开发机器人,核心技术不是生成式多模态大模型,而是物理智能,即对物理世界的感知和理解。今年4月,我在生成式人工智能大会上也介绍了我们的创业方向,强调了物理智能在机器人技术中的重要性。我们的目标是通过物理智能技术,提升机器人的自主性和智能化水平。

AI科技评论:所以你们做的不是单纯的文本模型,而是理解物理世界的模型?

胡鲁辉:我们正在自研物理世界模型,取名为“澄灵物理世界模型”,它专注于理解物理世界,与多模态大模型不同。我们区分这两种智能:多模态大模型属于信息智能,如 Chatbot 这类人工智能,主要处理信息和交互;而我们的产品则属于物理智能,专注于感知和理解现实世界的物理规律。

AI科技评论:怎么理解物理智能?

胡鲁辉:人工智能的终极目标也许是实现通用人工智能,而当前阶段我们正处于生成式人工智能的发展时期。这一观点并非我首次提出,我与张亚勤院士交流时,了解到他在五年前就已提出人工智能的发展路径,从信息智能到物理智能,最终达到通用人工智能,这是一个逐步实现的过程。Meta 多年来也一直在讨论世界模型的概念。今年6月,黄仁勋在台湾的演讲中也提到,下一个人工智能的发展方向是物理智能。

生成式人工智能处理的是一维或二维信息的输入,如文字、图片、音频或视频,并输出相同类型的信息。物理智能则在两个层面上有所不同:首先,在输入层面,我们处理的是感知和理解世界的数据,包括视觉和触觉等感官信息;其次,在输出层面,我们生成的是TSD数据,即时间(T)序列(S)数据,这种数据可以直接用于控制机器人。

此外,生成式大模型和物理智能的产品形态和应用场景也有所不同。生成式大模型不需要实时反馈,例如ChatGPT中有些信息可能只更新到去年9月。而我们的系统必须实时处理输入信息,以确保机器人能够及时响应。

AI科技评论:你们机器人的研发是基于人工智能模型,演绎物理世界模型?

胡鲁辉:对的。我们核心技术是物理世界模型,同时也做本体,打造一系列产品,目前已经推出了机器人产品 TR1,TR2。

AI科技评论:你们已经验证了这条链路了是吗?

胡鲁辉:是的,除了清晰的 Northstar,也能逐步验证和产品落地。

下一个 GPT 是物理智能

AI科技评论:物理智能是不是一定会和机器人结合?

胡鲁辉:物理智能不一定非要和机器人结合,只是我认为机器人领域或具身智能是最理想的应用场景。好比,生成式人工智能目前最好的应用是 Chatbot,但其实它也有很多其他场景可以用。

AI科技评论:一个能够感知和理解世界的机器人,它的技术栈会包含哪几块?

胡鲁辉:我认为主要是三个方面:第一,与物理世界的交互。与信息智能不同,物理智能需要与现实世界进行互动;第二,算法能力。物理智能需要具备和生成式人工智能一样的算法能力,因为它得要有泛化能力和推理使用能力;第三,实时性。物理智能需要从三维、甚至四维(包含时空)的角度理解信息,这与信息智能有本质的不同,因而要能够实时处理和响应信息。

AI科技评论:其实这也是具身智能追求的目标。

胡鲁辉:对,这就是个通用人工智能。

AI科技评论:您是什么时候有了要做物理智能的这一想法?

胡鲁辉:2022年年底,ChatGPT出来的时候。ChatGPT一经推出就在美国迅速走红,因为大家看到了它不错的泛化能力。国内对它的关注应该是在几个月后逐渐升温。当时我还在西雅图,我开始思考我们应该如何跟进这一趋势,也有不少创业公司开始围绕 ChatGPT 进行创业。

那时,我也在 Meta 了解到世界模型的概念,而 Meta 首席 AI 科学家杨立昆对大模型并不特别热衷。我也认为,继 ChatGPT 之后,下一个重要的发展将是物理智能,它将拥有更广泛的应用前景。

AI科技评论:您会认为大模型对于机器人的发展是一个机遇?

胡鲁辉:大模型是一种技术手段,类似于我们开发的世界模型,它也是一种大模型的表现形式,尽管具体的实现方式有所不同。这些模型都属于基础模型(foundation model),我们自主研发的世界模型同样具备这样的基础模型特性。

AI科技评论:您怎么看待通用人工智能与通用机器人间的关系?

胡鲁辉:通用人工智能是人工智能领域的终极目标,它指的是达到人类水平的智能,这主要是从技术层面来讲的。而通用机器人则是指具体的产品或应用。无论是通用人工智能还是通用机器人,它们的核心目标都是实现“通用性”,而实现这一目标的关键在于掌握通用人工智能的技术。

AI科技评论:基于物理世界模型开发机器人的路径,国内目前还没有相似公司?

胡鲁辉:应该是没有的。由于我司比较低调,我先提出这个想法时,并没有引起太多人的兴趣。但自从李飞飞老师和一些美国企业开始讨论这个概念后,它就迅速受到了广泛关注。

AI科技评论:在这波具身智能浪潮中,你们的优势是什么?

胡鲁辉:我觉得我们的优势还是蛮多的,主要是四个方面。第一,我们专注于物理智能领域,这是我们的核心技术和主要创新点;第二,我们的团队成员基本都是来自顶级企业的高管,不仅拥有丰富的行业经验,也有很多业务资源;第三,我们在敏捷交付方面展现出了强大的工程化实力,TR1 和 TR2 的出色表现证明了我们的执行力和交付能力;第四,我们与哈佛、清华等顶尖高校建立了合作关系,并得到了地方政府的支持,这为我们提供了强大的资源后盾。

让通用世界模型成为硬件平台

AI科技评论:你们团队今年才成立,但产品发布很快,你们是不是很早就布局了?

胡鲁辉:应该说是我们的团队非常优秀,并且我们采用了亚马逊的敏捷开发模式。亚马逊的开发模式使我们每两个月进行一次迭代,我们从今年5月份开始,大约两个月推出一款新产品的节奏。在四个月的时间里,我们成功推出了 TR1 和 TR2 两款产品原型。

AI科技评论:你们现在团队规模有多大?

胡鲁辉:现在有 20 来人,基本以研发人员为主,研发团队都是硕士以上,毕业于国内外名校。

AI科技评论:TR1 和 TR2 两款产品已经量产了吗?

胡鲁辉:目前我们已经开始与意向客户进行合作落地。

AI科技评论:这两款产品的功能定位是什么?

胡鲁辉:我们致力于开发通用人工智能和通用机器人,是因为想推动机器人时代的到来。与许多仅用于表演和研发的机器人不同,我们的目标是让机器人能够实际执行任务。要实现这一点,机器人的“手”是最关键的部分,因此我们的开发从手臂开始。我们的产品 TR1 是一款单臂机器人,而 TR2 则是一款双臂机器人。我们希望能够开发出更复杂、更具挑战性的机器人,这也是我们的愿景。

AI科技评论:那你们是做专用机器人,还是通用机器人?

胡鲁辉:我们并不局限于机器人本体,而是会依据业务场景来做不同的机器人。

移动互联网时代的一大标志是 iPhone 的到来,iPhone 带来的是硬件平台化,上面可以有不同app,而每一个app对应一个应用,说白了就是一个特定业务场景的解决方案。因此,我们希望将这一概念应用到物理世界智能领域,打造一个平台化的模型,支持不同的硬件和机器人,以适应配送、工厂作业、家庭服务等多种场景。

AI科技评论:听起来,你们是以人工智能算法为中心,再加不同本体,如人形、四足等,你们自己也做本体吗?

胡鲁辉:我们也会做本体。我们自己做设计,但我们不做生产。

AI科技评论:你们技术核心是不是在算法驱动这块?

胡鲁辉:应该说是物理智能层面,我们要打造物理智能,也就是理解物理世界的人工智能。

AI科技评论:你们接下来的产品计划是什么?

胡鲁辉:我们的 TR1 和 TR2 产品将会持续进行迭代升级,在这个过程中,我们会继续投入创新和研发工作。同时,我们会将产品与实际应用场景结合,逐步推动商业化进程,“沿途下蛋”。目前,我们已经收到了多家企业的合作意向。

AI科技评论:您觉得国内机器人领域的融资环境好吗?你们融资困难吗?

胡鲁辉:整体环境我觉得一般,应该说没有以前好,但现在人工智能、AI 2.0还是很火爆的。

AI科技评论:与国内厂商竞争,你们会遇到什么挑战?

胡鲁辉:我们的发展主要受两大因素影响。一是科技发展的内在趋势,二是商业环境的实际需求。作为一家商业化的科技公司,我们不仅要适应市场的变化,还要在技术上不断实现突破。当然,这种情况也是许多企业在发展过程中需要面对的挑战。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/UNPlG4LnX6DZbNQ5.html#comments Mon, 28 Oct 2024 10:25:00 +0800
清华、江淮中心联合孵化,「零次方科技」发布首款双足机器人产品Z1 //m.drvow.com/category/robot/KKnYxP1ZpjefIhXv.html 10月24日,零次方科技发布了其首款人形机器人,代号为Z1。该机器人可以在多种不规则路面、复杂地形中长时间稳定行走,且具备优秀的抗干扰性能,即使受到各方向的强冲击也能保持稳定站立。

视频中的Z1通过观察人类的行为动作,模仿学习攻击招式,以灵活的全身协同控制能力为基础,进行动态防御。攻击、躲避、平衡,两个人形机器人展示了一场别开生面的机器人格斗比赛。

作为零次方首款双足人形机器人,Z1配备最高150Nm关节电机,全身具备27个自由度,载重测试极限高达20kg,负载/自重比超70%。其搭载了自研的EtherCAT通讯模组,整体系统实现低延时高带宽;而Z1在设计之初与众不同的是,团队采用AI技术辅助进行机器人的结构参数设计,实现了更低的能耗(COT)与更高的动态运动性能。其结合自研的物理交互世界模型算法进行运动控制,能够实现出色的抗干扰能力以及各种复杂工况的适应和复杂地形的行走能力。

 

视频中还出现了和电影《钢甲铁拳》呼应的画面,机器人完美复刻了人类的双臂动作。

零次方团队表示,计划于今年年底,在无机器人操作设备的情况下进行激情澎湃的人形机器人拳击比赛,实现每个人的机甲梦。而这项技术正是零次方团队在今年9月中旬发布的双臂机器人F1展示过的,团队的算法核心之一:基于人类视频数据学习(learn from hunman video)

为什么要基于人类视频数据学习?

零次方团队认为,数据量是实现通用具身操作的必需因素,单位数据成本是产品落地的基础条件。

近年来,Scaling Law这一词语被多次提及。大语言模型以及特斯拉自动驾驶的Scaling Law也给具身操作领域带来了一定的启发。团队认为,实现具身智能的路径无论是基于多模态大模型,还是通过构建高维世界模型亦或是组合专有领域小模型,无法规避的一点核心就是海量的优质数据。

当前,机器人需要的数据分为三层:第一层是真实的遥操数据,第二种是高质量的仿真合成数据;第三种是人类行为数据,最大的来源是互联网视频。

 

这三层数据的质量由高到低,但不论是真实的遥操数据,还是仿真数据,都面临单位成本高的问题。人类数据的质量最低,但量也是最大的。所以零次方的技术路径主要解决的问题是:如何利用海量的人类视频数据。

如何向人类学习?

 

据了解,有别于当前主流的遥操作技术,零次方科技致力于通过三维人体运动姿态感知模型提取人类关键关节的运动数据,并重映射到机器人身上,而无需人类适应义肢一样使用遥操作设备的学习成本。并且,通过4D高斯溅射技术来重建机器人所需观测信息,最终采用完整的数据训练一个Transformer-Based Diffusion Policy,从而驱动机器人自主完成任务,使其具备直接向人类学习的能力。

基于向人类学习的方式(LFWH),机器人可以构建 base model。在此基础上,能够在仿真训练中进行强化学习,实现更加灵活泛化的操作,以弥补机器人与人之间的先天性结构差异,进而超越人类专家的工作效率,并实现快速部署。

快速部署之后,机器人可根据专项场景的数据以及互联网数据,训练想象生成模型(Imaginator)。通过Imaginator基于初始状态量生成指定任务的plan,再将生成数据和真实数据混合使用。

 

随着imaginator能力的提升,所需的真实数据逐渐减少,生成数据的比例越来越高,算法的泛化性也随之增强,部署效率因此提高,从而实现数据飞轮效应。最终,Imaginator的想象能力越来越逼近真实,内含无限逼近现实物理规律的世界模型,达到未卜先知,实现真正的通用人工智能。届时人形机器人将走出工厂,走进千家万户,提高人们生产生活的效率。

 瞄准制造业产业升级,为中小企业实现降本增效

当前,中国劳动力密集企业有34万家,占制造业比重32%,就业人口近5700万;伴随着人口出生率的下滑,叠加人口老龄化,每年差不多有50万工人的空缺,这个缺口还在进一步拉大。与之并行的是,成本攀升和劳动力人员流动过大,无法满足当前中小型企业资金少、非标制造和市场需求大带来的柔性制造等痛点。

传统的自动化解决方案存在几个问题:一是量太少,不足以支撑改造成本;二是产线比较固定,缺乏柔性,无法改变生产内容,即柔性生产。而协作机械臂的问题在于,部署很难,需要专业人士先进行一周甚至更长时间的调试,用手动编程的方式来实现对机械臂的部署。专业工程师成本高,数量少,中小企业布置一条产线的成本,甚至高于其业务利润。

针对中小企业工厂改造难,手动编程等问题,零次方的解决方案是,用机器人自主学习实现原位替代,即以完全仿人的设计,把对应的功能实现替换,不需要改变布局,也不需要编程,就能直接实现“机器学习人的操作,并进行快速部署”,且通过这种持续学习的能力,不断填入数据,以增强机器人在场景方面的泛化能力。

零次方团队表示,现阶段,F1将先被用于专业工厂的专项操作,逐步拓展场景,推动数据飞轮滚动,将模型变得更具泛化性,届时再过渡到更加柔性的家庭场景,最终实现对通用场景的覆盖。

清华&江淮孵化,00后极客团队创业

 「零次方」由清华大学和江淮前沿技术协同创新中心共同孵化,团队主创成员来自于清华大学AI&Robot智能机器人实验室,在机器人操作及运动控制领域成果突出,发表了数篇TRO、CoRL、ICRA、IROS机器人顶刊论文。团队中同样有来自字节跳动、百度等互联网大厂、节卡等协作机器人公司的业内专业人士,在解决最前沿的科研学术问题、将创新技术转化为商业落地产品方面经验丰富。

「零次方」团队成立于2024年5月,并在短短4个月的时间里完成了两款人型机器人产品,以业内遥遥领先的速度持续创新,立志在三年内实现“人能走的路机器人基本都能走,人能干的活机器人基本都能干”。

闵宇恒表示,任何非0实数的0次幂都等于1,而0的零次方却无法定义。「零次方」旨在做最本质的创新,拥抱无限可能,实现从零到一。

雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/KKnYxP1ZpjefIhXv.html#comments Thu, 24 Oct 2024 11:53:00 +0800
离开优必选的日子 //m.drvow.com/category/robot/Bu4OvX0sydL5IpVn.html

他们,使优必选成为“中国人形机器人的黄埔军校”。

离开优必选后,他们的经历也是中国人形机器人行业的崛起缩影。

Walker 天团从聚到散

2015年,一位年轻人为了追逐人形机器人的梦想,从北京来到深圳,加入位于深圳南山区的优必选。几年后,优必选第一台人形机器人 Walker 缓缓走出实验室的大门。

这位年轻人名叫谢铮,是 Walker 系列的产品负责人,也是优必选人形机器人团队的前五号员工。

谢铮本科就读于华中科技大学机械科学与工程专业,毕业后被保送至航天三院攻读硕士。彼时 2009 年波士顿动力刚发布用于军事用途的人形机器人 Petman(Atlas前身),航天三院通过竞标也拿到一个人形研发项目,谢铮幸运参与其中,研究了两年液压人形机器人,并由此开启了与人形机器人的不解之缘。

谢铮

2014 年硕士毕业后,谢铮留所工作了一年。但由于不适应体制内生活,谢铮决定出去闯荡一番。思来想去,他还是想研究人形机器人,但当时举目四望,国内有布局人形机器人的企业寥寥无几,优必选是其中之一。

彼时优必选还是一个规模只有一百人左右的创业公司。此前它曾推出小型桌面级人形机器人 Alpha 1S,虽然引起了小范围的市场注意,但人们并没有将一个会动的小机器人视作高科技的代名词,Alpha 1S 也只是被外界视为“智能玩具”的一类。

但优必选的创始人与 CEO 周剑认为,人形机器人可以有更大的想象力。所以谢铮在面试优必选、提出想研究大人形的时候,周剑与熊友军也同意了,尽管当时优必选在大人形方面的积累几乎为零。

不过要做大人形并不容易。桌面级人形与大型人形机器人虽然都是人形体态,但却是两个截然不同的产品。前者形态小巧,技术壁垒低,但后者由于要拟人体态,对构型、材质与技术等方面都提出挑战。优必选在 2015 年布局大人形,连关节设计、控制系统等都得从头开始。

为此,优必选特设了研究院,旨在补齐技术短板。2015年,优必选深圳研究院成立。

谢铮担任产品负责人,在深圳从零开始搭建团队,并招来了一大批机器人技术人才:负责关节与结构的李友朋、丁宏钰;负责控制的刘益彰、陈春玉与葛利刚,等等。

那时招人并不容易——“做硬件的都是从工业领域招,做算法的都是从高校里的四足研究团队招。”人形机器人在当时还非常前沿,能吸引到的只有胆大敢想的理想主义者,Walker 团队早期成员也普遍年轻,大多都是刚毕业的学生。

此外,2016 年 10 月优必选还在北京设立了机器人研究所(下称“北研所”),由清华大学自动化系教授赵明国担任所长,招来了谢岩、董浩、郭宜劼、徐喆等等人才。

赵明国

早在 2015 年,赵明国就与优必选开展了合作。在当年 RoboCup 合肥的一场比赛上,熊友军找到赵明国寻求合作。彼时优必选刚完成 A 轮 2000 万元融资。双方谈妥后,优必选立刻推动人形机器人的项目立项,周剑将其命名为“Walker”。

至此,整个优必选人形机器人研发团队分为两部分:深圳团队主攻 Walker工程化落地,而北研所则更多攻克算法控制和探索前沿方向。

2016 年,优必选率先将 540 台小型人形机器人 Alpha 1S 送上春晚舞台,为歌手孙楠伴舞,成功被载入吉尼斯世界纪录——这也是优必选进军人形机器人的首次正式亮相。

优必选也得以一炮而红,投资人踏破了门槛。2016年中旬,优必选拿下了来自金石投资、科大讯飞、中信证券等的 1 亿美元 B 轮投资,市场估值也由一年前的 3 亿美元一路攀升至 10 亿美元。

财大气粗后,优必选持续将重金投注在人形机器人研发上。据了解,整个 Walker 从产品立项、完成 demo,到一代 Walker 下线,前前后后研发投入砸了一亿多。

声势浩荡下,优必选成了众多机器人爱好者的向往之地,源源不断有优秀人才涌入优必选。“当时人形机器人领域表现优异的人才,尤其是海外回来的,都往独角兽优必选这里跑。”知情人士周利椿向雷峰网回忆。

这些人共同撑起了 Walker 从 0 到 1 的奇迹之旅。

从 2015 年 Walker 立项到 2018年 CES 上推出双足机器人 Walker,再到 2021 年 WAIC 上推出全新升级的大型仿人双足机器人Walker X,短短几年间优必选人形机器人迭代了 4 个版本,从用于验证算法与结构的原型机,逐步发展为初步掌握基础技能的人形机器人,一时风光无两。

优必选是国内最早探索人形机器人的企业,Walker 天团也是国内第一批人形研究者,团队战斗力在全球也是首屈一指。但这一明星阵容,在 2021 年春晚后引起外部多个企业的觊觎。

2021 年春节,优必选提供了 4 个大型四足机器狗在春晚舞台上给刘德华伴舞,再一次赢得普罗大众的一众好评。

彼时,尽管特斯拉还未发布擎天柱,但小米、傅利叶、小鹏等等公司也开始大力投入机器人,包括四足机器狗与双足人形。而当时优必选是国内人形与四足的佼佼者,因此外部企业开始从优必选挖人。

2021 年 3 月,徐喆与谢岩率先被小米挖走。

2021 年 9 月,北研所负责人赵明国因身体原因离开。不久,11 月、12 月,外面多个公司给出极高薪水与优厚条件挖人,北研所的核心骨干也纷纷忍不住诱惑跳槽。

与此同时,2021 年优必选计划上市。当时国内外的市场上没有人形机器人的故事,特斯拉在 2022 年才发布擎天柱。优必选在深圳升级了健康事业部,人形机器人的一些研究资源被挪到了养老业务上。

2022 年前后,深圳研究院包括谢铮、刘益彰在内的核心骨干也接二连三离开。

这批人才离开优必选后,先后历经多个平台,尔后也成为具身智能时代的机器人研究先锋。他们的经历,也是中国人形机器人行业的崛起缩影。

北研所:流向傅利叶、小米

优必选北研所的人形骨干出走后,主要去了小米、傅利叶。

任晓雨在 2021 年下旬加入傅利叶,是傅利叶北京部门第一个研究人形的算法工程师。不久,郭宜劼也离开优必选,在 2022 年上半年加入。

郭宜劼担任傅利叶算法负责人,任晓雨是算法核心。北研所出走的一行人组成了傅利叶人形算法团队,对傅利叶人形机器人的研究起了重要作用。

傅利叶成立于2015年,此前专注于康复机器人,直至 2019 年正式进军人形机器人。知情人士罗平告诉雷峰网,创始人顾捷为此特地花了 1 亿左右来撺人形团队,拉了以关节见长的前沿驱动团队来做硬件部分。

任晓雨正是为傅利叶的关节吸引而来。任晓雨系清华出身,本科就读于精密仪器系,后来因清华院系架构调整,硕士转向机械工程专业。在优必选时,他主要参与手臂算法的研发。

与优必选研究院两地分置相似,傅利叶在北京与上海也各设了部门。但傅利叶的这一架构设计,并没有使两地的团队很好地协调起来。不多久,驻扎在北京的硬件团队心生不满,上演了一夜搬空办公室的闹剧后集体出走,顾捷随之要求北京团队全部迁至上海总部。

动乱之下算法团队难免受到影响,不少人随之离开,只有任晓雨留了下来,成了算法负责人。据了解,当时傅利叶所有的运控算法框架,任晓雨均有参与。2024年,任晓雨踏上创业之路,成立了动易科技,旨在开发全新行为运动AI智能体和新一代人形机器人本体。

北研所的人除了出走至傅利叶,还有一脉流至小米。不同于深耕机器人领域多年的傅利叶,晚来者小米缺乏机器人基因,因而格外求贤若渴。

小米曾大费周章挖来了优必选北研所谢岩,负责小米人形机器人的运动控制。谢岩本科就读于北京交通大学,后保送至北京航空航天大学。博士毕业后,谢岩来到北研所,受到赵明国的指导和培养。

业内人士王译章向雷峰网解释,具身智能热潮之所以要主推强化学习,是因为模型控制训练太难了。“而谢岩的厉害之处就在于,在小米时用传统方法将运动控制硬做了出来。”

而小米作为一家手机厂商,之所以也掺了一脚进机器人领域,是因为当时四足机器人热潮迭起,成了镁光灯追随的焦点:

海外动作频频。波士顿动力推出了一系列运动能力绝佳的四足狗,学界享有盛誉的 MIT 也首次开源了四足狗方案;国内也不甘落后,宇树、云深处、鹏行、哈崎和蔚蓝也在紧锣密鼓推出四足机器人产品。

其中最显眼的,莫过于 2021 年春晚舞台上风光大展的宇树和优必选的四足机器人。优必选四台首款自研的大型四足机器人化身“拓荒牛”在前,后面联同宇树 24 台 A1 小牛“犇犇”,与刘德华同台演出。

优必选大型四足机器人的算法部分是徐喆完成的。徐喆本科毕业于北理工机械工程专业,师从高峻峣,曾前往美国卡内基梅隆大学联培,主要研究双足机器人步态规划,在优必选时担任步态算法专家。

徐喆

徐喆早先回国时就对四足很感兴趣,但彼时缺乏相应关节。2018年,赵明国出面向瑞士苏黎世联邦理工学院 ETH Zurich 研究团队购买了关节。此前 ETH Zurich 研究团队一向只售卖四足机器人整机,不单卖关节,但给了赵明国一个人情。

由于关节价格昂贵,且不易购买,优必选人形团队便自研了一个仿 ETH 的关节来做四足验证,最终成功将大型四足机器人送上了春晚舞台。后来关节主要负责人被挖去了小鹏、也有部分去了傅利叶。

这是四足机器人首次动态走位集群舞蹈表演,展现了四足机器人灵活的运动控制能力,也为四足机器人热度再添一把猛火。得益于央视的 PR,优必选与宇树知名度一同扶摇直上,但一次错位的战略选择,让两者走向了截然相反的发展方向。

春晚后,赵明国与熊友军提议做大型四足机器人,但是周剑并不同意,他认为商业应用场景有限。因此,优必选只是短暂地将人形机器人技术挪用到四足机器人上,表演结束后就一直专注于人形机器人,四足狗只是昙花一现。

反观宇树,开始发力做大型四足机器人。业内人士周齐告诉雷峰网,“宇树今天之所以能盈利,主要得益于其大型四足机器人打开了巡检这一市场。”

周齐表示,“如果优必选当年决定去做大四足,优必选现在每年应该会有 1 亿的收入。”

春晚结束后,2021年,小米也正式成立了小米机器人实验室,紧锣密鼓推进四足机器人项目。

徐喆此前在优必选四足机器人上的出色表现,让小米机器人实验室伸出了橄榄枝,最终成功将徐喆收至麾下,担任高级算法工程师。

虽然小米也大张旗鼓做四足机器人,但最终也没敢研发大型四足机器人,而是推出了一只中等体型的仿生四足机器人 CyberDog  “铁蛋一代”。

坊间传言小米机器人团队比宇树科技更早做出“后空翻”等成果,但并没有发布。说法有二,一说是称担心技术太先进、被美国制裁;二说是小米高管去庙里求了签,发现不能发布。——最终,小米成果没有宣发,对士气影响很大,导致不少人员出走。(关于更多小米机器人的内容,欢迎添加微信 nanjieyu 交流)

小米早期从优必选处挖了不少人,但现在这群人多数已离职,尤其是人形机器人团队,基本已全部出走。有些人去了北京具身智能机器人创新中心、松延动力、星动纪元。此外,小米机器人实验室也有一支原生团队下场创业,如邵元欣、王勃(小米关节负责人)成立“灵足时代”。

具身智能时代:北京人形、加速进化

2023年11月,具身智能浪潮下,优必选牵头,与京城机电、小米机器人、亦庄机器人等数家厂商一同在北京成立北京人形机器人创新中心。2024年10月10日,正式升级为“国家地方共建具身智能机器人创新中心”(下文简称“国地共建创新中心”)。

国地共建创新中心的代表成果是“天工”机器人,其背后三大部门的一号位都是从优必选人形团队出来的技术大牛:

刘益彰担任本体平台组负责人,负责人形机器人本体设计;郭宜劼担任运动控制负责人,主做机器人步态规划;鞠笑竹担任具身智能负责人,偏向强化学习、大模型等方面。

这一阵容并不简单。

优必选北京与深圳两地研究院,各有台柱子。知情人士王翼向雷峰网表示,“刘益彰与谢铮在深圳那边挑头,北京这边则是董浩、郭宜劼。”

如前文所述,郭宜劼在傅利叶动乱时离开了,如今在国地共建创新中心与以往优必选的故友们相汇合。

刘益彰

而刘益彰,此前在优必选深圳团队担任规划与控制部负责人。刘益彰毕业于中国人民解放军国防科技大学,曾参与国家“863”项目,主做高性能四足机器人控制算法研发。

当时,刘益彰团队下属里还有两个算法大牛:陈春玉与葛利刚。陈春玉原先是研究院的研发总监,现在去了开普勒担任软件研发总监,上海与深圳两地跑;葛利刚是优必选运动控制资深算法工程师,还在优必选。

优必选仍是深圳人形研发的主要平台。同样曾试过上海与深圳两地跑的还有优必选四足关节负责人范文华。范文华曾短暂离开优必选、加入上海的宁德时代。结果“双城记”才半年,范文华受不了频繁的差旅奔波,又回到了优必选。

刘益彰团队还有一号人物叫安昭辉。安昭辉主要负责人形机器人的上胳膊,从优必选出来后去腾讯机器人实验室呆了一段时间,与来杰等人相识,后来一起出去创业。现在安昭辉是星尘智能的控制负责人。

刘益彰在加入国地共建创新中心前,与谢铮曾短暂去过达闼。

那时正是达闼最辉煌的时刻。达闼成立于 2015 年,致力于打造云端机器人。虽然在 2019 年折戟于赴美上市之路,但未曾想,这一年反倒声名鹊起,产品在海外曝光度节节高,项目订单源源不断涌入。

2021、2022年期间,达闼项目数量一度达到巅峰,最多时拥有十多个项目,一边开足产线,在上海马桥人工智能创新试验区内建了一座占地 243 亩的达闼智能机器人产业基地,同时不断招兵买马,公司规模迅速扩充至 1000 多号人。

刘益彰与谢铮也正在是这一时间点,推开了达闼北京办公室的大门,加入达闼,为达闼组建团队、研究双足机器人。

达闼创始人黄晓庆对机器人软硬件的一些理念与想法也十分超前,看问题能看得很远,最初能吸引不少优秀人才。但后来的问题也是看得太远——“黄晓庆想的都是 5 年、10 年之后的东西,近 1、2 年能交付的产品看不上,团队交付的成果往往达不到黄晓庆的期望,导致大家很累。”

彼时,达闼主要是两块业务,一块是智慧城市,另一块是直接卖关节或机械臂。但达闼一直想做机器人的运营商(类似中国移动),提供云端大脑,接入所有机器人——“这种想法太超前,机器人都还没有量产,更不需要运营商。”

达闼的运营也是夫妻店模式:黄晓庆担任 CEO 与 CTO,其妻子担任 CFO。谢铮等人加入前,达闼曾允诺给予他们一定的配置团队规模和设定项目预算的自由,但最终由于各种原因没有兑现。

在达闼待了仅仅数月后,谢铮、刘益彰又相继离开。

离开达闼后,两人都扭头跑去创业了。刘益彰曾创业一段时间做机械臂,但最后还是被熊友军收至国地共建创新中心。

而谢铮则被其高中同学连文昭相邀去创业,共同创办了源络科技。连文昭本科毕业于上交大,获得美国杜克大学统计学硕士学位与电子与计算机工程博士学位,此前曾在机器人公司 Figure AI 任职。迎着国内具身智能热潮,连文昭决定回国创业。

此前曾提到过的优必选 Walker 班底台柱子四人组之一的董浩,是清华自动化系教授、原北研所所长赵明国的嫡系学生,现在则加入了加速进化,重回导师赵明国麾下。

董浩

董浩是清华自动化系本硕博,导师为赵明国。赵明国与优必选合作优必选北研所后,董浩也跟着加入。日常,董浩会协助负责北研所的日常项目运行,能算是半个管理者。

此外,董浩是工程组负责人,主要负责主控关节和感知。在专业上,董浩一直力推一套模块化的主控(即机器人的控制计算),相当于把机器人的通信总线、基础的运动学和动力学的库等建好,然后卖给高校。

董浩从北研所出来后,也想将这套技术推向汽车行业,尝试过做新能源汽车的车用控制器,但没有成功。汽车市场早已杀成了红海,一时半会挤不进去,董浩也就作罢。

因而,当导师赵明国和师兄弟程昊抛来橄榄枝时,董浩欣然答应。赵明国后来毕业的学生中,也有一部分成为了加速进化的创始团队。

2003年,赵明国加入清华大学自动化系,专注于仿人机器人步态控制和无人驾驶自行车的研究工作,带出了一批批优秀学子,其中还培养了一支捧下国际知名机器人赛事 RoboCup 冠军奖杯的清华火神队。董浩与程昊都曾先后担任过火神队队长。(关于《赵明国与他的火神队》一文后续将推出,欢迎添加微信 zzjj752254 交流)

程昊

程昊是清华大学自动化系 2006 级本科、2010 级硕士,毕业后曾创业、公司被字节收购,加入字节飞书担任副总裁,在字节工作了一段时间。

疫情期间赶上字节锁定期,程昊感觉当前的工作业务一眼能看到头,深感没啥意思,还是想捡回老本行机器人来做做,但他离开机器人行业太久了。于是,程昊频频登门拜访赵明国,让赵明国给出主意。

赵明国就一点一点给程昊梳理机器人行业情况,这一讲就是好几个月。最终,程昊也成了躬身入局具身智能热潮的一员。

2023年,程昊成立了加速进化。自然而然地,程昊拉来了导师兼指路人赵明国坐镇加速进化,担任作首席科学家。

深圳:从鹏行、OPPO到众擎

北研所的核心成员中有一人,大家提及他时都纷纷夸赞,为人口碑极好,技术能力卓越。谢铮、任晓雨分别创业时,都曾先后试图拉拢他,但都无奈遭到婉拒。

这人就是王岳嵩,毕业于美国犹他大学机器人专业。王岳嵩在优必选时主要负责运控算法,管理一支十来人的团队。在优必选出走潮涌起时,王岳嵩也随之离开去了 OPPO。彼时,与小米同为手机出身的 OPPO,也在大张旗鼓要做四足机器人。2022年,OPPO 在年度技术大会上推出了首款 QRIC 四足机器狗。

王岳嵩离开 OPPO 后也曾加入加速进化,但没有待很久。知情人士冯棋告诉雷峰网,王岳嵩现在去了一家大公司的研究院。

除了 OPPO,小鹏鹏行也从优必选挖了很多人,李友朋是其中一个,现在去了逐际动力。

OPPO 和小鹏鹏行挖人都有一大特点——有钱。小鹏一开始从优必选挖人,给双倍工资;OPPO 又去挖小鹏的人,再翻倍。优必选科技人形机器人创新中心负责人付春江手下有一个刚毕业两年的学生,年薪 30 万元左右,被小鹏以 60 万左右挖过去,后又被 OPPO 花 80 万挖去。

优必选人形团队的成员来回跳,造成了一个有趣的现象:离开优必选的人可能前脚刚从 A 公司走,后脚又在 B 公司撞见前同事。

李海雷是北研所出来的人,由赵明国指导,负责机械部分,但离开优必选后去了深圳的小鹏鹏行。

小鹏鹏行凭借高举高打的互联网典型模式,此前迅速将机器人团队扩张到300人,并在深圳、北京和美国等地设立了研究院。

然而,鹏行发现机器人是一个商业化周期长、技术落地难的项目,并不符合互联网节奏,于是又开始缩减规模,同时调整路线策略。这一趋势下,不少人选择了出走。

李海雷带了15个人离开,辗转到国地共建创新中心待了一段时间。国地共建创新中心总经理熊友军原本想收了李海雷一班人马,但内部流程审批时出了岔子,这一想法没能通过,熊友军只好放弃。

最后,是赵同阳在深圳成立众擎机器人、收了李海雷一行人。

赵同阳

李海雷与赵同阳相识于鹏行。鹏行是何小鹏与赵同阳一同成立,由何小鹏出资,赵同阳担任鹏行CEO。

赵同阳坚信人形机器人是未来,此前曾多次创业,都是做足式机器人。但由于鹏行内部路线出现变化,“为了更快落地,从四足逐渐改成轮式了。”接近鹏行的业内人士罗平向雷峰网表示,很多人都开始被项目牵着鼻子走。

但赵同阳始终坚持双足机器人路线。顶着压力,赵同阳从内部挑了 20 位精兵强将拉到广州,埋头专注研发双足机器人。鹏行此前大手笔搭建的 300 人团队、迭代数年的足式机器人研发经验并非虚有其表,在赵同阳的极力促使下,双足人形机器人很快就走了起来。2023年10月,鹏行推出了行走能力出色的 PX5 双足人形机器人,收获市场广泛认可。

在鹏行交出了一份满意的双足人形机器人答卷后,赵同阳意识到是时候再度出来创业了。

2024年,赵同阳成立了众擎机器人,接收李海雷团队,而李海雷是联合创始人。后来徐喆也加入了众擎机器人。

结语

如果说,“人类获得宇宙终极奥秘的起点,始于第一只猿猴对星空的仰望。”

那么优必选大型人形机器人 Walker 行走的起点,则始于一群人对机器人的信念与追求。2015年,他们带着热情与好奇,陆续聚集在优必选深北两地的研究院,在实验室里不断做技术推演、产品落地。

2018年,优必选推出具备双足行走、上下楼梯的第一代人形机器人。这还难以称之为一个完整的人形机器人,没有双臂,只有双腿,最多只是一个双足机器人,但这也足以令他们欢欣雀跃。一年后,一款加了双臂的全尺寸人形机器人 Walker 新一代走上了 CES 展会,其不仅能行走,还能与观众互动,展现了双臂操作能力,如倒水。

优必选 Walker 系列从早期产品定义到最终成品,人形机器人 Walker 向前迈出的每一步,都是他们每一个人在后头推了一把力:赵明国、谢铮、刘益彰、董浩、谢岩、郭宜劼、徐喆、李海雷、任晓雨、陈春玉、葛利刚……

2021 年之后,优必选研究院的一号位历经谭欢、付春江、焦继超,优必选人形机器人的发展也从起伏中吸取经验,在具身智能时代又重整旗鼓,投入资源研究人形。除了与小米、北京城投共同成立北京具身智能机器人创新中心,近日还从腾讯 Robotics X 挖了郑宇担任研究员副院长。

越过山丘,优必选 Walker 有了新的内涵。

国内产业界人形机器人的过去有他们,未来也是他们。

注:文中出现的周利椿、罗平、王译章、周齐、王翼、冯棋皆为化名。

关于具身智能领域更多精彩的人与事,欢迎添加作者微信 whx23999 交流。

此外,雷峰网成立了机器人读者群,希望进群的读者请添加编辑微信 Fiona190913、并备注姓名-单位-职位。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/Bu4OvX0sydL5IpVn.html#comments Fri, 18 Oct 2024 10:05:00 +0800
国家地方共建具身智能机器人创新中心正式揭牌 //m.drvow.com/category/robot/450VLXiIpfEnROrY.html 2024年10月10日,工业和信息化部与北京市人民政府在北京举行揭牌仪式,北京具身智能机器人创新中心正式升级为“国家地方共建具身智能机器人创新中心”。作为引领具身智能技术突破与产业协同的关键平台,创新中心未来将进一步推动科研院所、高校和产业链上下游创新企业深度合作,持续迭代推出全球领先的标志性创新产品,创建繁荣的具身智能产业生态体系。

 国家地方共建具身智能机器人创新中心授牌

国家地方共建具身智能机器人创新中心的正式授牌,标志着具身智能产业已成为构建和完善国家现代化产业体系的重要一环。升级后,创新中心将致力于解决各类创新主体共性问题,推动具身智能产业标准制定,提升创新链、产业链、供应链资源高效配置和融合水平,进一步降低企业研发、中试成本,加大应用场景拓展开发力度,加快创新产品在研制试用过程中熟化迭代,推动产品在全球范围内率先落地应用。

2023年,工信部发布《人形机器人创新发展指导意见》,将以人形机器人为代表的具身智能产业定位于科技竞争新高地、未来产业新赛道、经济发展新引擎。在《北京市机器人产业创新发展行动方案(2023—2025年)》中,明确制定了培育100种高技术高附加值机器人产品、100种具有全国推广价值的应用场景,形成创新要素集聚、创新创业活跃的发展生态的目标,并通过设立专项资金、提供税收优惠等方式,加大对具身智能机器人产业的支持。同年底,由优必选、京城机电、小米机器人、亦庄机器人等10家行业领军企事业单位出资联合组建,北京具身智能机器人创新中心正式成立。

2024年4月,创新中心发布通用机器人母平台“天工”,实现了全球首个全尺寸纯电驱人形机器人的拟人奔跑,全身协同控制泛化移动能力全球领先,可在斜坡、楼梯、草地、碎石、沙地等多种复杂泛化地形中实现平稳移动。2024年8月,“天工”在世界机器人大会点亮会徽,这是具身智能机器人首次在世界级大会的开幕式上现场展示长程任务能力。正式亮相后的118天内,“天工”完成了2次迭代,在具身感知、具身交互、具身行为等能力上实现突破,具备了流畅的手眼协调、手眼交互等功能。

 天工1.1 PRO

同时,世界机器人大会上正式发布的具身智能服务机器人“天轶”,搭载了创新中心与北京大学情感与认知智能机器人实验室王韬教授共研的具身智能情感大模型,可精确地识别人类情感与情绪,进行更深层次的智能交互,可广泛应用于接待、导览、咨询问答、场馆介绍、舞蹈表演等多种场景。

 具身智能服务机器人天轶

创新中心正加速开发高性能具身智能体“开物”,将基于超过100个元技能组合,实现超过50步的复杂长程任务拆解执行。具身智能数据生产、采集、标注和存储一体化的国家级数据采集训练场正同步建设中,力争建成百万量级高密度、高质量、高通用性数据集并向行业开源开放。

以加快建设新质生产力、推动具身智能产业落地为目标,创新中心将坚定聚焦具身智能机器人关键共性技术研发和生态建设。

作为行业资源组织者,创新中心牵头承担多项国家级揭榜挂帅任务,正与清华大学、北京大学和中科院软件所等高校、科研院所,以及遨博、因时、他山科技等产业链上下游企业围绕灵巧手、一体化关节、机器人操作系统和仿真开发工具链等关键共性技术开展联合攻关。

作为产业发展培育者,创新中心编制了国内首个《人形机器人评价体系研究报告》,提出人形机器人评价体系建设建议,参与编写3项国际标准,牵头编写4项国家标准、1项团体标准,并设立了涵盖系统模块、关节、机械臂、整机等全链条的测试体系,为具身智能机器人提供全面测试验证平台。

作为落地应用推动者,创新中心以百余家联盟成员为支撑,通过数据集建设加快构建创新中心的数据工厂,并联合京东、中兴、均普研究院、奥迪一汽、北汽产投、南方电网、北京化工集团、东港瑞宏、优必选等合作伙伴,在仓储物流、工厂分拣、汽车制造、特种工作及巡检、危险场景、政务服务、产学研交流等领域优先开展试点,打造具备应用价值的落地案例。

 “天工1.0 LITE”室外行走

未来,创新中心将打造具有全球影响力的具身智能创新策源地和应用示范高地,推动具身智能机器人科技引领与产业创新深度融合,促进各类先进生产要素集聚,共筑良好发展生态,通过百万量级的高密度、高质量、高通用性数据集,打造世界最大的具身智能机器人数据工厂,加快推动具身智能机器人赋能千行百业,让万物智联、人机共融的具身智能时代加速到来。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/450VLXiIpfEnROrY.html#comments Thu, 10 Oct 2024 18:41:00 +0800
科沃斯发布地宝X8 系列,滚筒构型会是扫地机的未来吗? //m.drvow.com/category/robot/ZPUgL1KzurjsNZ0S.html 2024年第三季度,扫地机器人行业迎来了繁忙时刻,各家纷纷上新,又一场紧张竞赛拉响。

正如奥林匹克运动会“更快、更高、更强”的精神,扫地机厂商们也在跋涉更远,力争提供更佳的产品体验,而扫地机功能和形态也在不断更迭:

为了更薄,采用顶部激光雷达升降或取消外置激光雷达;为了越障,长出轮足;为了清洁,增加吸力。

眼花缭乱的功能创新背后,是各家厂商对用户需求的洞察。

最近,老牌玩家科沃斯动作频频,将目光瞄向了“覆盖更全面的清扫”与“实现更深度的清洁”,推出了两款新品。

前者,是刚上线不久的轻薄款地宝T50系列,自今年8月25日启动预售以来,至今已预售超15000台;后者,是新近又一力作——地宝X8 PRO PLUS,在IFA参展时即拿下产品技术创新大奖。

如果说地宝T50系列是科沃斯过去三年微创新的总结,那么地宝X8 PRO PLUS则是一次颠覆性创新——全球首创恒压活水洗地机器人。地宝X8 PRO PLUS 一改以往产品结构,自带滚筒,从“扫拖”一键升级至“扫洗”。

 从双圆盘到滚筒,恒压活水洗地解决新痛点

过往也有厂商采用滚筒式结构,但设计会有些美中不足。例如,有的滚筒压力集中于两侧支架,受力不均导致清洁时会留下难看痕迹,影响清洁效果和效率。

相比之下,双圆盘得益于较大的接地面积和较高的清洁效率,成了市场上一直以来的主流选择。但在这两年,科沃斯在经过大量的用户反馈和数据回访时发现,用户普遍对双圆盘的清洁效果感到不满。

原因在于,双圆盘拖地时水渍分布不均,无法实时擦净地板,很容易“越拖越脏”。这样即使效率提升了,但对于用户来说,扫地机仍然没有解决把房间清扫干净这个痛点,自然也很难产生对品牌力的认可。

在洞察这个需求之后,科沃斯发布了地宝X8系列,基于其在子品牌添可洗地机上的技术和经验,利用恒压活水滚筒洗地来克服传统滚筒构型的缺陷,解决双圆盘结构在清洁上的不足,从而实现高效且深入的清洁效果。

“添可洗地机已经用市场来证明了这套清洁方案是比较受大家认可的。”

添可洗地机凭借独创恒压活水洗地技术,引领洗地机市场增长,连续四年占据销量榜首,年均销量破百万台。

科沃斯CEO钱程表示,科沃斯内部始终坚持技术共享,以促进产品创新和提升用户体验。“集团旗下的科沃斯与添可两大品牌实现了技术融合,未来会在科沃斯产品上看见更多添可技术的身影”。

具体到本次地宝X8 PRO PLUS自研的 OZMO ROLLER 恒压活水洗地技术,可以分为两个部分。

第一,“恒压”。

地宝X8 PRO PLUS的滚筒清洁模组配置了浮动式恒压刮条,可以使滚筒保持恒定下压状态,保持与地面一定的接触压力,在4000Pa压强下,滚筒每分钟200转的速度高速运行,实现顽渍“一滚即去”。

 第二,“活水”。

滚筒清洁模组可通过内置清水箱不断清洗滚筒拖布,确保实时活水,同时刮条会挤压滚筒带走污水,再由高压气泵实时回收污水,让滚筒始终用净水洗地。

之所以要采用活水洗地,是因为科沃斯内部通过大量实验室测试发现,若仅依靠滚筒材质实现去脏洗污,干抹布确实可以扫净灰尘等颗粒,但如果碰上酱油、番茄酱等或沾水的污渍,清洁效果会大打折扣。“要洗干净这类污渍,就必须要有活水的参与。”

在这一技术赋能下,地宝X8系列在有色污染的清洁力上相比过往双圆盘方案得到极大提升,成了一款“自主洗地”的扫拖机器人,或许称它为洗地机器人更为准确,这也是科沃斯全球首款恒压活水洗地机器人。不过,滚筒构型虽然效果显著,但由于架构方案与以往产品形态出入相差大,要实现相同产品表现,就意味着技术方案上要有所调整,这并非易事。

据了解,早在2021年,在添可推出产品后凭借出色拖地效果得到市场广泛好评时,科沃斯内部就曾积极尝试将洗地机的技术应用到扫地机上,并在滚筒构型上做了设计与规划。

由于当时技术所限,科沃斯在对比扫地机与洗地机后,决定暂时搁置滚筒构型计划。原因在于,洗地机为提升吸水性能,通常配备大功率负压电机和风机,这在技术和制造上提出了较高要求。若将此技术应用于扫地机,不仅会面临续航能力的挑战,而且由于运行噪音较大,影响用户体验。

直到2023年,科沃斯重拾这一计划,通过反复测试和调整,在技术上取得了突破,最终推出了地宝X8系列。

 “滚筒构型会是未来吗?”

为了在滚筒构型上达到相同的清洁效果,科沃斯对现有产品方案进行了大幅调整,围绕滚筒构型重整了机身设计,在实现深度清洁的基础上再度优化功能。

具体来看,地宝X8系列主要是在清洁和智能两方面做了升级与整合。

首先是清洁能力,科沃斯集成了过往技术经验,进一步升级扫地机器人。

全屋清扫上,地宝X8系列采用双恒贴边技术,边刷与滚筒双外扩,可紧贴清扫电线、拖鞋、U形椅等各种障碍,有效解决边角清洁难题。并且,扫地机机身高度会影响其进入家庭低矮家具的可能性,地宝X8系列灵活调整了滚筒设计,整机仅高9.8厘米,底部滚筒也可抬升,能进入家庭低矮空间进行清洁,也能应对更多不同材质地面清洁。

以往双圆盘外扩后,中间会出现一条漏扫的缝,需要二次清扫。但在滚筒模式下,直接以滚筒宽度来计算工作间距,整体提高工作效率。

众所周知,清洁一大难点在于毛发防缠绕,地宝X8系列沿用气旋梳齿防缠绕技术,45度梳齿 V 型流线腔体设计有利于可聚拢毛发后一次性清理掉。

其次是算法能力,这影响着扫地机器人的“聪明”程度。

地宝X8系列采用AINA 2.0人工智能导能算法和深感视觉模组,智能识别物体,全方位全环境动态导航。同时,借助AI与大模型,地宝X8系列升级了人机交互设计。科沃斯自研的YIKO-GPT大语言大模型,让扫地机器人不仅能够理解用户模糊指令,还能通过APP上GPT式交互界面直接与用户交流,增强互动体验。

“我们做滚筒不是为了自嗨,或是为了与市场不一样而做,是实打实的测试结果告诉我们,滚筒会是未来。”钱程表示,这并不意味着科沃斯会彻底全面取缔双抹盘方案。

未来,科沃斯会以用户体验为核心,兼顾成本和技术可行性,优化产品方案,逐步以滚筒构型替代双圆盘方案,但部分产品仍会继续使用。同时,鉴于海内外清洁习惯差异,海外市场会继续使用双圆盘设计或进行创新以满足当地需求。

解决痛点才能赢得竞争

“扫地机行业当前的重点,在于提升销量,扩大市场渗透率。”

钱程告诉雷峰网,目前行业主要有两大策略,一是价格持续下探,以价促量;其二是通过创新,优化清洁效果,解决更多长尾场景痛点,吸引更多用户。

在价格方面,从2023年下半年起,业内就开始采取“以价换量”的方式来抢占市场。许多上市首发定价普遍在4000元以上的产品,已经下沉至3000~4000元价格带。该价格带是各大品牌方竞争的重点。

不过,价虽降,但质未减,各家厂商依然还在绞尽脑汁提升产品性能。具体来看,主要是如何让扫地机器人清洁力更强,使用更便捷,操作更智能。

厂商们往往会选择其中一个方向进行重点攻克,以解决不同纬度上的难题。例如,自去年以来,业界普遍关注边角清洁难题,众多企业推出机械臂外扩方案以沿边清扫。科沃斯也推出采用灵隙恒贴边技术的地宝T30系列,与常规两断式机械臂相比,灵隙技术能够做到自适应伸出角度,贴近障碍物边缘清洁,确保边角清洁无遗漏。

“无论哪一个厂商,大家都是想做好用户体验,才会有各种各样花式解决方案。哪怕只是一个细微改进的新功能,也会先应用在产品上。谁能更好解决用户痛点,谁就能赢得竞争。”钱程表示。

以往“扫拖一体”的扫地机器人固然能满足用户的清洁需求,但难以实现更好的清洁效果,“以脏拖脏”导致清洁不到位,更多是维护日常卫生干净。而洗地机清洁效果虽然显著,却需要人力劳动,并且对于上班族而言,很难解决时间成本这个大问题。

 

地宝X8系列基于深刻用户洞察,整合了扫地机与洗地机各自的特点,扬长避短,真正实现“扫洗一体”。这既提升了清洁力,又能自主完成清洁,极大解放人力,或将引领行业再进一步。

结语:创新是场马拉松,用户是裁判

回顾整个2024年上半年,随着扫地机产品功能升级,各家新品发布节奏加快,颇有“你方唱罢我登场”的步调。

但企业竞争并非百米竞赛,一局定胜负。钱程表示,“竞争是一场马拉松,每一程都很重要,需要经受住身为裁判的用户考验。”

这个过程中,如何洞察用户需求成了获胜的关键。正如互联网行业著名信息架构专家彼得·梅尔所言,“用户体验如此重要,以至于它现在成为了创新的代名词。”

对于科沃斯而言,只有基于用户需求的产品创新与功能升级,才是真正的为用户考虑。

“一个能带回家的扫地机,让消费者感到物有所值、物超所值,既是一份追求,也是一份使命。”

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/ZPUgL1KzurjsNZ0S.html#comments Mon, 30 Sep 2024 09:57:00 +0800
科沃斯坚称“首创恒压活水洗地”,反诉 3i 碰瓷营销 //m.drvow.com/category/robot/kRowUpet1yv8Wzz4.html 9月25日,科沃斯召开线上媒体会,表示针对友商的商业诋毁行为已提起诉讼,并需求赔偿50万元。

此前,深圳杉川机器人有限公司称,科沃斯旗下新品地宝X8 Pro Plus“全球首款恒压活水洗地机器人”的说法涉嫌虚假宣传,并提起诉讼。科沃斯表示,该案件法院并未受理,此行为属于“碰瓷营销”。

据科沃斯回应,X8 Pro Plus的活水洗地方案是真活水洗地,并拥有恒压活水洗地相关专利,这一解决方案先在科沃斯旗下子品牌添可洗地机上获得验证。

具体来看,科沃斯X8 Pro Plus的方案是先通过喷头将清水补充到滚筒拖布上进行拖地,之后带着脏污通过有着浮动结构的刮条将污水刮干净后,再次补充清水进行拖地,以确保接触地面的水始终是干净的水,从而避免以脏拖脏,实现真正意义上的恒压活水洗地。

科沃斯解释,3i的活水洗地方案主要是先通过喷水口喷水淋湿滚筒,紧接着通过刮条将滚筒刮干后,用相对较干的滚筒拖地,带着地面脏污经过喷水口,以净水喷淋到脏的滚筒上后经过刮条刮干继续清洁,如此往复。这样的方案可能会造成干拖或是以脏拖脏。

此外,科沃斯表示,早在2022年初,科沃斯集团旗下添可品牌已获得活水技术专利CN114983290B、恒压专利CN217524978U。搭载相关技术专利的添可洗地机已连续四年销量第一,得到广泛认可。而根据杉川的声明,他们最早实现恒压活水拖地的产品最早则是2024年3月份发布的,并且还未在消费者中进行大规模的使用。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/kRowUpet1yv8Wzz4.html#comments Fri, 27 Sep 2024 11:34:00 +0800
他山科技创始人马扬:触觉传感芯片是机器人必经之路 //m.drvow.com/category/robot/pAzTwxZIe80r832D.html

“我们都没做过芯片,但我们觉得这事必须要做出来。”

2016年,第一波机器人浪潮翻涌而来,马扬发现,触觉传感器是一片被忽视的蓝海。

对机器人而言,触觉传感器能让机器人像人一样,通过触觉感知物体形态、材质、压力等信息。机器人一旦要执行具体任务,不可避免要与物体接触,触觉在此时起到重要作用。

既然触觉传感器如此重要,马扬与另外两位联合创人孙滕谌和杨五强一合计,三人一同躬身入局,剑指当时鲜有人涉猎的人工智能触觉传感芯片。

然而,自研芯片并不简单,更何况是一颗要放入机器人指尖的触觉传感芯片,这对芯片性能、体积都有严苛的要求。此外,马扬三人此前并没有做芯片的经验。

显然,这注定是条坎坷的道路。

自2017年末成立,到2022年初成功流片,他山科技整整用了四五年时间,历经万般险阻,终于做出首款人工智能触觉传感芯片。

他山AI触觉传感芯片

这一芯片搭载了他山团队基于R-SpiNNaker分布式类脑架构下的AI触觉传感技术,得以在微小平面上探测多维空间触感。此外,还能从采集到的混合信号中单独提取特定变量,可分析处理不同的物理信号,打破了传统触觉传感器的局限。

虽然产品研发上取得了突破,但过往五六年的艰辛也曾让马扬心灰意冷,甚至在第二波浪潮将临之际,他也一度不相信机器人能真的起来。

直到去年,马扬发现确实有了新变化,“整个机器人行业,无论是资本的涌入,还是研发的投入,都有了新高度。与此同时,国家对机器人的定位也不一样了。”

新变量的搅动,让马扬重燃热情与信心,又一次带领团队义无反顾投入进第二次机器人浪潮。

前不久,在世界机器人大会上,他山科技联同多家机器人厂商,展示了灵巧手、机械臂和视触融合等解决方案。

AI触觉传感产品矩阵

他山科技不仅在技术上持续创新突破,也在产业落地上频频布局,坚持技术与市场双轮驱动。

以机器人为终局的他山科技,重点部署触觉传感器、电子皮肤等领域。此外,秉持着两条腿走路的态度,马扬还将目光望向了汽车、家电、消费电子等多个场景,成功拿下了奔驰、宝马等多家主机厂供应商资质,并与比亚迪在多个项目上达成量产。

如今,他山科技已推出了多款触觉传感芯片,并步入正轨,有望在明年实现盈亏平衡。

一路披荆斩棘的他山科技,正在一步步越过山丘。上周,马扬向AI科技评论细数了他山科技的发展,并围绕触觉传感芯片解答了我们的困惑。

期间,马扬虽然较少谈及机器人信仰与情怀,更多讨论的是实实在在的技术和路线。但谈话中,我们能感受到马扬对机器人发展的乐观与向往。

以下是 AI 科技评论与马扬的访谈实录,作者进行了不改变原意的编辑整理:

“这事早晚都要做”

AI科技评论:为什么取名作他山科技,有什么含义吗?

马扬:刚成立时,我们与投资人谈,说的第一件事就是先把硬件做出来。做芯片相当于将二氧化硅变成一个更值钱的东西,于是想到了诗经里“他山之石可以攻玉。”

他山不同的芯片也是用不同石头名字来命名,最早的芯片就叫红宝石,叫Ruby;第二颗叫红水晶;第三颗用在消费级上,相对用量更大一些、便宜点,我们就叫雨花石。

AI科技评论:是什么契机让你们决定进入触觉传感领域?

马扬:2016、2017年正好是机器人行业前一波比较火的一个浪潮,我们看到波士顿动力做出了行走功能不错的机器人,国内优必选、达闼也是最早的一波头部公司。在我们看来,这些公司偏属移动派,更多强调移动能力,能通过屏幕与人进行语音互动。

我们当时觉得,未来机器人更重要的事情肯定是对目标任务的执行,基于这一角度,触觉能力就比较重要。实际上,在公司成立前10年左右的时间,我们在算法层面做了不少触觉任务端的训练,也取得了一些不错的成绩。

在那个时间点,我们发现如果要在机器人手端做执行,最大的壁垒是如何将芯片小型化,以便能放入指尖。当时市面上没有任何一颗芯片能做到,我们也是一时冲动,想着要不我们就先把这颗芯片做出来,于是成立了他山科技。

AI科技评论:第一波浪潮里认为机器人在任务执行这块会有发展潜力?

马扬:2016、2017年那波机器人公司,很多做的是非商业化项目,主要是进行语音和视觉交互的轮式机器人。当时我们觉得机器人在任务执行上非常欠缺,如果真正让机器人商业化落地,走进家庭,任务执行是必须要去做的事。

回头看这几年最好的两个方向,一个是智能驾驶,将人从户外空间 a 移动到 b,完成物理空间的执行;另一个是机器人,更多是帮助人类完成室内环境的移动任务。无论是洗碗炒菜,还是整理物品,这些都离不开触觉、指尖的执行能力,这是我们当时比较笃定的一个方向。

AI科技评论:加入这波浪潮时,当时的挑战是什么?

马扬:当时整个市场上,还没有人很深刻地去思考机器人的执行问题,而我们主要从机器人的广义层面来思考执行。广义上的机器人,包括工厂里的机械臂,都是自动闭环。所谓自动闭环,举个例子,工厂机械臂执行任务时,目标是针对固定物体进行移动,这一执行动作是明确的动作,因此大部分机械臂在实际操作时并不需要添加感知,只需设定好一个重复性的动作即可。当然,有一部分可能会加一些视觉,比如当物体位置有所变化时,一个基础的3D视觉能实现空间定位,然后机器人再执行下一步命令。

但这会存在一个实际问题,即执行的动作得是已经学习过的,或目标物体的各种特性很明确,甚至说目标物体必须是一个刚性物体,才能完成这样的执行。我们当时和其他厂商沟通,发现大家想做的其实是泛化抓取,也就是执行泛化任务。那时候要是能把桌上不同的几个物体抓起来,就很不错了。

我们那波最早进入机器人产业的人其实都有点过于乐观了,当时觉得真正走进家庭也就三五年,最多不超过 10 年,但现在也过去了七八年。回望那个时间点,其实还缺很多东西,尤其是用人工智能做学习时,机器人的一些硬件条件、基础要求还很难达到。

AI科技评论:您提到第一波浪潮中缺了不少东西,具体是少了哪些?现在都补上来了吗?

马扬:那时候我感觉机器人离人还很远,更多是做出一个像人形的机器人,能给人看就不错了。就像一个工业品,最终实现需要三步,第一步是想出来,第二步是做出来,第三步是用起来。我感觉第一波浪潮更多是介于第一和第二阶段的中间,很多东西都还是一个idea,在“想出来”和“做出来”中间还是差了很多东西。在当下这一时间点上,大部分是第二步过渡向第三步,大家已经在做小批量商用,这也是为何这波参与进来的人更多。

AI科技评论:所以当时是直接将目标瞄准向泛化执行?

马扬:这是比较具体的一个目标,我们更大的目标就是为机器人提供可在边缘段执行作业任务的触觉能力。

AI科技评论:你们是只做芯片这一块吗?

马扬:并不是。我们最早要做的事情,其实是机器人整个触觉的解决方案。换言之,我们做的是整个皮肤端的解决能力,其中最主要的是指尖传感器。

当时有一家美国公司指尖传感器做的能力效果和技术指标还行,但国内售价高达2万至3万美金。所以我们当时定下了一个主要的任务目标——先把指尖传感器做好。

触觉既要强感知,也要重执行

AI科技评论:指尖传感器的技术要求高,主要门槛在哪里?

马扬:对指尖传感器而言,其核心需求是既要实现感知,又要实现抓取,这也是触觉与其他感知不同之处。

在整个感知领域,视觉与听觉这两部分已经做得比较成熟,不仅与人的能力不相上下,甚至能超越人的能力。为什么它们能比触觉做得更快?因为对这部分感知来说,只是对客观世界的一个图像化,或是脉冲化的一个反应。再基于过往十年多人工智能的深度学习,我们已经拥有了一套成熟的算法,基于此,视觉与听觉能达到并超越人的能力。

触觉相对比较难的一点是除了感知外还要做执行,甚至可以说,更重要的是做执行。机器人要想完成一个执行的目标,首先要通过视觉的引导,“物体在哪里?”;当接近物体时,此时感知转移到触觉上。触碰物体时,要感知物体的材质、形状、三维力,将物体整个拿起来作交接时,还需要感知物体内部重心的变化。整个过程中,触觉端要完成从感知到执行的全闭环。

我举个例子,比如拿起一杯水,如果杯子是柔性材质,那么在抓取和拿起的过程中,杯子的重心和形状会一直不断地发生变化。当人做这一件事时,不同指尖在抓取姿势和力度的控制上都相应会有所调整。这对于机器人也是如此,需要不断进行调整和闭环。

AI科技评论:目前触觉感知技术的发展情况如何?

马扬:对触觉而言,主要是两个问题。

第一个问题,在前端上要有更快的反应速度。例如,六十赫兹频率,对视觉而言已经算是高频,对于人眼已经足够。但对于触觉端,六十赫兹或一百赫兹还远远不够。要想达到人类的能力,基本上要达到毫秒级,即千赫兹。

此外,触觉传感器的数量更多。无论是触觉还是听觉,对机器人而言一个视觉或听觉传感器就够了。但触觉涉及到最后目标任务的执行,必然需要多个传感器一起做,比如抓取一杯水,得要有五个传感器在五个不同的指尖来协同完成。

每一个指尖传感器,也是由多个传感单元来协同完成。不同于视觉、听觉只需一个芯片就可解决所有的数据问题,由于触觉感知端可能是几十个甚至上百个传感器共同工作,其中所产生的数据仅靠一个芯片难以为继,所以我们采用分布式多芯片系统,以便在前端低延时、低功耗状态下能实现快速边缘处理。

这就好比,当我们摸了一个很烫的东西,手会本能地快速躲避。此时动作并不需过脑,完全是靠手部前端的解决能力和神经元,因此就需要在边缘端实现从感知到执行的自主全闭环。

第二个问题,触觉由于感知维度不同,涉及物体的材质、形状、表面干湿度、三维力、法向力、切向力的情况,且是分布式传感器,要解析多维的触觉数据,就需要在算法端上从基本的感知结构上去解决问题。

这也是为何对机器人来讲,视觉与听觉已经达到了一定的商业化程度,而触觉相对来说还比较慢的原因。

AI科技评论:指尖传感器会产生大量数据,一般如何处理数据?

马扬:数据的处理有两点。数据在单个传感器上完成时,我们会强调在单个芯片上快速从感知到执行全程数据处理的能力。第二,当我们执行抓取动作时,中间的快速反应需要在前端的硬件上完成,即边缘端要有分布式的数据处理能力。

2016、2017年以前,我们基本上也是基于深度学习或卷积的算法去做数据处理,采用的也是市面上主流的芯片。但是做下来后,我们发现整个体积和反应时间达不到应用端的需求,这也是我们自己要去做芯片的原因。

AI科技评论:相当于是在 SNN 结构这一块找到了突破口?

马扬:对,不过与其说是找到一个突破口,不如说是为 SNN 结构找到了一个比较好的应用方向。大家原来都会有一个疑惑,就是 SNN 结构很好,但要用在哪里呢?我想,我们找到了一些答案。

AI科技评论:触觉感知方案上为什么会选择电容感知这一方向?

马扬:联创孙滕谌与杨五强是77届清华自动化系同学。孙滕谌发明了平面电容与曲面电容技术,杨五强在曼彻斯特大学任教时一直在研究电容测量技术。可以说,我们在电容技术这块积累了非常强的know-how。

90年代末时,杨五强的一项技术 ECT 在工业端得到了广泛的应用。我们将搭载电容的传感单元装在石油管道外侧,可实时探测管道横截面上油与水的成分,还能直接做出内部物体材质的成像。这说明,电容技术能很好识别物体材质。

这样的应用放在10年前,在我们开始做抓取学习时非常有用。好比,抓一个塑料瓶还是抓一个玻璃瓶?用多大的力抓取?人抓取任何物体时的底层逻辑是,用尽可能小的压力不让物体在手中滑动。电容技术能在抓取过程中提供除视觉端外的触觉信息,以便帮助我们在抓取端获取信息。

我们后来又改进了传感端的结构,采用多对的电容传感器,再加以力的识别结构,可以很好地做三维力的学习。并且,我们在算法上可以把这两层做一个很好的分级,既能解决前面部分,又能解决后面部分,让两部分数据不产生耦合,这其实非常有难度。

四五年前,包括现在都有很多选择了电容这一路线的团队。通过单一传感器对多维触觉数据做解耦,在这一块我们可以说我们是做得最好的。

AI科技评论:目前市面上还有哪些路线方案?

马扬:触觉传感器目前路线方案较多,我们看现在不同的路线都是可行的,其他路线包括视触觉路线、电子霍尔路线,还有压电压感材料等。

在我们看来,机器人的不同部位对触觉的需求不太一样,采用的路线也会有所差异。比如,躯干更多强调的是可替代化,对单点要有足够的感知能力,整体成本要足够低。像压阻、压电材料成本已经很低了,就很适合大面积布置在机器人身体上。只不过对于机器人而言,电子皮肤得是点阵式,一个点坏了,能快速替换掉。

对于指尖传感器而言,电容感知是业内普遍认可的一个方案。虽然也有其他方案路线,但在我们看来都有些不足。比如,有的只是一个中间方案,实际感知维度是达不到的;还有的可能更适合做展示、做POC、做样件。从最终路线的实现来看,我们会认为电容是一个非常合适的解决方案。

AI科技评论:电容感知方案得到了行业认可,目前是主流方案吗?

马扬:从指尖传感器对厂家的出货量上看,我觉得已经是一个主流方案了。其次,近些年来,我们每年参加 IPRA 会议都会与业内人沟通交流,大家也会认为要实现人形,从目前几种路线来看是最可行的一个方案。

AI科技评论:触觉传感器再进一步发展,要突破的关键点有哪些?

马扬:第一个是在传感端,整个传感器的结构上大家并没有走在同一个路线上,a有a的路线,b说b的路线,这就造成传感器端在商业化上的速度相对来讲是比较慢的。

今年,指尖传感器我们已经可以做到1万颗及以上的批量了,在行业里我们应该算多了。但我也很难笃定地说我们的稳定性已经非常好了。如果没有一个几十万,甚至更多的批量,要说自己的稳定性非常好,可能都是一句比较空的话。

第二个问题是由第一个问题衍生出来的,大家现在在触觉端缺少一个可执行的标准。大家可以用不同思路做感知,但是感知完后关于力的一些基础数据,在解码端可以用同一种方式做解码和存储,这有利于大家快速地做下一代产品迭代。因为不管是谁的数据,如果我们大家可以用起来,不过在短期内也不太好解决。

再往长远看,后面还有一个小壁垒,我们现在还没讲触觉与视觉相融合。从抓取执行的动作来看,视觉先做完再交给触觉,触觉执行完再还给视觉,不断反复进行这一过程。人在这一过程中,是用模糊计算做视触融合,在不同时间里的视触占比会有所变化,对此人是有自己非常精妙的一套机制,但对机器人而言这怎么设定呢?这会是未来要思考的问题。

此外,我们比较强调先在手端做私有网络训练,然后再把手端数据给到脑端,由脑与手的数据相结合,再去做后面的训练,以具备更好的水平。但目前怎么做这种协调的训练,也是比较难解决的一个问题。

未来是机器人的世界

AI科技评论:今年WRC展会上也看到了不少触觉传感器相关厂商,现在触觉传感器市场情况如何?

马扬:这次展会上看到做手的厂商是最多的,不只是传统灵巧手厂商,还有一些头部机器人厂商也在做手,包括一些触觉传感器厂商也加入。

现在传感器走到了一个节点上,主要是两条路径。一个是传统行业里的传感器,有电容屏、触摸屏等应用,整个市场规模也比较大。另一个方向,就是从传统材料切进整个人形机器人做触觉感知,但大家对未来的瞄点不同,技术路径不同,而这个市场还在慢慢起来,朝着更大的商用方向。目前现在做得出色的还相对较少,未来一两年可能会有一次比较大的洗牌。

AI科技评论:您亲历了两次机器人浪潮,您觉得这两次浪潮的变化在哪里?

马扬:我觉得第一波其实相对要虚一点,而第二波明显在落地上会更清晰一些。

第一波没有很多商业化的东西。当时大家更多就是做出来一个样子,主要也是为了展示技术能力,以更好融资来进行下一步。从我们的感受来看,第一波我们还在找方向,也没有什么竞争对手。其实,如果没有竞争对手,就像走夜路一样,走两步就得检查走得对不对。

我希望从第二波开始,这会是真正的一个趋势,而不只是一个浪潮这样。尤其是去年年底开始谈论具身智能,具身智能也涵盖不同的感知,其中触觉得到了更多的重视。我们也看到了更多友商、合作伙伴的加入。这相当于是把我们要做的事情具象化了,商业化也变得更现实了。

AI科技评论:对于人形机器人的发展,您是乐观的吗?

马扬:我还是很乐观的。很多人在讨论,人形落地还要多少年?我觉得这个事情并不是从 0 到 1 的一蹴而就,而是中间会有很多过渡阶段。比如我们之前谈论无人驾驶,虽然到现在也没有实现纯粹无人驾驶,但是智能驾驶在汽车应用上起到了越来越重要的作用, 商业化方面已经做得非常好了。

那么机器人其实也是一样的。我们作为消费者,其实现在还不需要一个能和人同等聪明的机器人——既能帮我做事,又能给我提供情绪价值,这是一个很远的事情。

但是从发展路径上看,首先在一些专用场合,比如物流、清洁、养老等都是比较落地的方向,需求显著。而且,人对机器人的容忍度并不像我们想的那么难以接受。好比智能驾驶汽车一开始也会有一些弱智表现,但只要能给人提供便利,人还是能包容汽车的一些小失误。所以我们会觉得,机器人的市场实在是太大了,你只要能做出一些小小的进步,大家就能共同推动行业一步步发展。

看今年的情况,我觉得大家都很务实。现在大家都很少谈双足了,基本上都会认为可以先做一个轮式,先解决室内平地问题。我们也看到很多厂商已经可以把成本控制到一两万左右,在这基础上我们能够训练出一些执行能力的话,我想在未来两年里应该很快会有落地。

AI科技评论:您对通用机器人的想象是什么?

马扬:我希望未来的通用机器人能拥有与人相类似的能力,不仅是物理空间的移动操作能力,也包括情感能力。

我为什么会这么想呢?我们在研究触觉感知时,中间经常要观察和学习人是如何感知的。人特别有意思,人获取的信息是靠脉冲和神经元,这获取的信息非常模糊,而且都是冲击信号,没有具体信号。具体信号只集中在有限的感知上,如视觉和听觉,其他的都得要充分去调动大脑才能获取一些信息。

现在机器人的信息获取能力已经超过了人。在最终情感的实现上,人其实是通过不断积累的神经元训练所得,那么机器人也可以通过不断喂数据的方式获得与人相类似的情感沟通能力。

现在机器人数据量已经足够大,但它的维度还没有像人这么多,所以我们希望能够在触觉端解决更高维度的问题。我们下一步其实也在做多模态的前端训练,我们希望把听觉、视觉,甚至嗅觉的脉冲信号都加进去,在前端做更多的私有训练。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/pAzTwxZIe80r832D.html#comments Sat, 21 Sep 2024 16:57:00 +0800
专用、类人形、人形:普渡为通用具身服务机器人找到商业化最优解 //m.drvow.com/category/robot/Kf2XY5syao2nJrdP.html
9月19日,普渡机器人正式发布其初代类人形机器人PUDU D7,由普渡X实验室 Pudu X-Lab孵化研发。基于仿生双臂和全向移动底盘设计,PUDU D7能够在多个场景中执行复杂任务操作。该款机器人预计将在2025年实现全面商业化落地。

普渡类人形机器人集成了移动、操作、AI方面的先进能力,旨在打造可商业化的通用具身服务机器人,具体来看:

  • 移动能力:PUDU D7具备类人的构型,底部配备通用的移动能力,底盘支持360度全向移动,最大速度可达2米/秒,并能在最大10度的斜坡上稳定运行。D7集成了普渡机器人在定位、感知、规划、调度、控制等方面的领先技术优势,配备RGBD相机、激光雷达、全景相机等多种传感器,能够在大面积、高动态复杂场景下实现高精度定位导航。

  • 操作能力:PUDU D7上部具备通用操作能力和元学习交互能力,能够执行电梯操作、物品搬运与分拣等多场景下的复杂任务。其仿生单臂的负载能力达到10公斤,末端重复定位精度可高达0.1毫米,这使得D7能够执行各种精细操作,如抓取、搬运和组装,适用于多种复杂的工业和商业服务场景。

  • AI能力:类人形机器人融合多种数据驱动具身智能,并在大模型应用上采用“大脑大模型”与“小脑大模型”分离的策略,通过多层次模型联动,以实现D7的AI智能交互和具身智能学习能力。D7能够理解和响应不同服务场景的复杂指令,并通过持续的学习迭代,优化自身的操作策略,逐步适应并高效完成各种任务。

PUDU D7是类人形定义下的首款服务机器人,标志着普渡机器人技术生态+产品矩阵+多元形态的战略布局的全面落地。类人形机器人通过服务机械臂解决了任务泛化性的问题,提升了跨场景任务的通用性,为服务机器人的跨场景端到端任务解决能力带来突破性变革,也为通用具身服务机器人的商业化应用带来了行业最优解。

普渡类人形机器人PUDU D7技术能力

迈向通用:从技术生态到多元形态

二十多天前,2024WRC会场上,波士顿动力创始人Marc Raibert在其演讲的最后部分抛出了一个灵魂提问:

Are humanoid robots a good idea?

今年以来已经有多位行业人士指出,人形机器人虽具备一定的通用性,但并不是应用落地的唯一形态。且人形机器人的商业化还有很长的路要走,如果出于成本和实际性能的考虑,完全可以将机器人进行简化,让其“具备人形机器人的一些元素”即可。

今年5月,普渡在服务机器人行业内前瞻性的提出了“类人形机器人”这一概念。通过操作机械臂的加持,服务机器人将极大提高自身的产品力,实现更加通用的产品价值。专用机器人、类人形机器人和人形机器人三种形态将共同构成服务机器人的未来行业生态,三者之间相辅相成,无法相互替代。

与那些简单按照产品外观来划分机器人形态的方法不同,普渡机器人创始人兼CEO张涛提出了一个更为前瞻务实的概念,即根据单位工作面积内的自由度来对机器人三种形态进行分类。

所谓单位工作面积的自由度,指的是“以机器人的总自由度与其工作面积的比值”,用以衡量机器人在单位工作面积内处理任务的能力。

三种形态机器人单位工作面积内的自由度

以专用机器人为例,其自由度有3个,以其工作覆盖面积一千平方米作为一个单位工作面积计算,其单位工作面积内的自由度为3。而类人形机器人和人形机器人单位工作面积内的自由度分别是300和30000。

从单位工作面积自由度的角度出发,不难理解三种形态之间相辅相成的关系:专用机器人执行单一任务时效率更高;人形机器人的能力很强,但针对多数任务自由度会出现冗余,且移动能力不足;类人形能够很好地平衡二者之间的关系,也就成为了当前最佳的商业化方案。

一个更为具体的类比是,汽车行业正在从传统的燃油车发展到增程和纯电等多种动力方式。其中被寄予厚望的纯电在续航里程等多方面遭遇到了发展瓶颈,而增程由于很好的平衡并满足了客户需求,成为了目前汽车商业化的最优解,而类人形机器人正如增程式汽车是基于客户需求的最佳产物。

以汽车行业类比机器人的三种形态

时间回到今年年初,普渡在行业内首次提出了R2X(Robot-to-Everything)的生态架构,针对机器人行业长期以来的不开放、不协同、不通用的行业壁垒提出了可行的解决方案。R2X的核心之一就是机器人能够与场景内的各种设备之间实现万物互联,以实现全场景的智能生态,因此IoT技术成为了实现R2X的重要一环。然而在现实场景中,仅凭IoT技术实现R2X往往面临着很多局限性。

以酒店和写字楼场景为例,实现R2X意味着机器人需要与电梯、门禁等众多设备打通,通过IoT的方式则需要对原有的电梯和门禁等设备进行改造。然而目前在全球众多国家和地区,不允许对电梯做硬件梯控改造。

不仅如此,在某些设备众多的场景中,通过IoT改造还意味着大量的重复改造成本以及第三方设备厂商的溢价风险。对于一个高度全球化的行业来说,上述诸多因素都将成为制约服务机器人商业化落地乃至实现R2X的关键因素。不仅如此,长期以来服务机器人行业还面临着跨场景端到端任务难以解决的难题。例如,在餐饮场景下,服务机器人送餐后的上菜环节没有被打通,仍然需要人工介入;在酒店场景中,机器人可以完成迎宾和客房配送,但房间内的清洁与客房服务仍需依赖人工等等。导致无法完成服务闭环,影响了客户的使用体验。

R2X场景下类人形机器人执行电梯和门禁操作

类人形机器人的出现则为上述行业难题提出了新的解法,AI技术与多元形态融合能够更好地满足客户的多样化需求。利用配备的夹爪或灵巧手,类人形机器人能够自由灵活的按、拿、取、放,通过操作机械臂完成电梯按键操作、刷门禁卡、上菜等任务。对于终端用户来说,类人形机器人一方面免去了IoT的重复改造成本,另一方面也提升了跨场景任务的通用性,实现不同场景内真正的端到端智能化,大大提升了服务机器人产品的客户价值。

这背后是一家机器人公司的商业价值观:以客户为中心。客户需求的牵引下,普渡机器人将多元形态作为创新性的解决方案,让用户有了更丰富的选择,且从商业维度来看,则实现了用户和厂商之间的双赢。

服务机器人商业化的成功实践

8月27日,普渡机器人在江苏省盐城市建湖县的新工厂正式落成,这是一座年产能达到10万台的服务机器人超级工厂。截至目前,普渡机器人在全球的出货量已经累计超过8万台,是全球出货量最高的商用服务机器人企业。

普渡机器人超级工厂

一个值得注意的细节是,竣工仪式上普渡的机器人的第8万台机器人正式下线,而下线的机器人是普渡的清洁机器人产品CC1。这款普渡在2021年底推出的第一款清洁机器人当初承载了市场的诸多关切:餐饮配送起家的普渡,能不能做好清洁?

普渡用业绩给出了肯定的答案。截至目前,普渡清洁产品线的收入已经超过50%,其市场份额也在一路走高。在今年5月的新品发布会上,普渡机器人推出了智能立式洗地机SH1。一周前的9月10日,普渡推出了全球首款专门针对大面积场景的AI智能扫地机器人MT1。种种动作表明,普渡的清洁产品生态正在愈加完善。凭借服务配送、专业清洁、工业配送的完整产品矩阵,普渡机器人正在持续为客户提供商业价值,将服务机器人行业的商业化水平推向新高度。

普渡机器人清洁产品矩阵

事实证明,普渡是目前商业化最成功的机器人企业之一。根据弗若斯特沙利文发布的行业报告,以2023年收入计,普渡机器人以23%的市场份额位居全球第一,与后几名的厂商之间拉开了较大差距。一个更为显著的指标是,作为出海最早的一批机器人厂商,普渡占中国商用服务机器人厂商出海的市场份额接近半数。

这些数据和动作证明了一个重要事实:普渡对于业务的投入具备可持续性,并且具备持续将业务做好的能力。

领先的市占率背后是普渡成熟的商业化模式得到市场验证的结果,而类人形机器人的发布与多元形态的积极探索也正是基于此。

全球商用服务机器人市场份额(2023)

事实上,不论是专用机器人、类人形机器人,还是人形机器人,只有被客户认可、买单,产品才能实现商业化闭环,量产爬坡、客户验证、售后维保等环节是任何产品商业化落地的必答题。

而基于过去多年的积累和沉淀,普渡在业务布局、技术积累、商业化落地等多个方面拥有了长足的先发优势。

从行业来看,要做好机器人产品有四大要素,即技术、数据、产品和商业化,对于类人形机器人来说亦如是。

显而易见,普渡在专用机器人上积累了大量的Knowhow,庞大的出货量和渠道积累意味着普渡在机器人赛道拥有了足够多的客户积累。长期的巨量场景POC和对客户需求的重复了解让普渡在数据及技术的积累上拥有绝对的优势,而现有客户资源无疑可以很大程度上直接复用到类人形机器人产品成为现成的基本盘。

同时从技术上来看,类人形机器人具备轮式底盘,对移动能力的要求极高。而普渡机器人在定位、感知、规划、调度、控制等方面早已形成行业领先技术优势,可以直接实现技术复用。且从技术拓展维度来看,在拓展多元形态的同时持续提升自身的领先技术优势。技术+渠道的双重复用持续推动类人形的商业化,而商业化的成功又将反哺技术和产品,由此形成一个正向的增长飞轮。

但这背后的逻辑本质是,普渡是从客户的需求痛点出发,倒推产品定义;类人形机器人将成为普渡为客户提供更多价值的全新产品形态,而不是拿着锤子找钉子的产物。

对场景的认知、数据的积累、客户需求痛点的把控以及产品的稳定性、强大的全球商业网络和牢固的客群关系,这些基本盘本质上才是普渡能够做好类人形机器人的关键所在。

开放、协同、通用:长期主义引领服务机器人迎来大规模落地

机器人作为前沿科技行业,成功的商业化实践并非一蹴而就。在推出这次的类人形机器人之前,普渡已经做了长期的技术沉淀。

2017年,普渡推出了首款机器人欢乐送,这也是当时行业内首款多层餐架式机器人,第一次定义了送餐机器人的形态。然而鲜为人知的是,欢乐送的demo曾经配有机械臂,目的就是为了实现端到端配送。但由于彼时的技术并不成熟,因而最终放弃了这个方案。2018年第一代闪电匣的研发阶段,普渡又再次尝试了在楼宇配送机器人上用机械臂按电梯的技术方案。2022年上半年,普渡再次推出了四足机器人D1和带机械臂的送餐机器人A1。虽然上述机器人最终没有进行商业化,但是代表着普渡对于解决服务机器人实现跨场景端到端任务能力的早期探索和长期研发布局。而类人形正是普渡坚持长期主义和战略延续性的落地成果。

普渡具身智能技术架构

可以预见,服务机器人市场即将迎来爆发期,而“开放、协同、通用”的问题是无法回避的行业之问。

关于通用的问题,主流的观点认为,机器人想要实现更大程度的通用化,需要在大脑、小脑和本体上同时取得突破,而这在短时间内几乎是无法完成的。 

普渡从务实的商业化的角度出发,聚焦服务机器人的操作能力,在长期的研发探索中,通过服务机械臂解决了机器人任务泛化性的问题。在类人形机器人的产品逻辑驱动下,所有的专用机器人都值得重做一遍,这对于机器人行业的革新迭代的意义显而易见。

另一方面,普渡推出的类人形机器人D7拥有基于Scaling Law的具身智能学习进化能力,伴随着持续的学习迭代能够实现更多跨场景的通用复杂任务。未来,随着D7持续的Scaling up,其功能和应用前景将更加广阔。例如,在餐饮场景下,类人形机器人将实现从送餐、上菜到回盘、清洁的完整端到端服务。这种持续学习进化的能力为类人形在未来实现更大程度的通用化开辟了可能。

而关于开放的问题,则正是普渡最早提出R2X生态的行业背景:由于机器人行业尚没有统一清晰的行业标准,各家的产品在同一场景下很难相互调度、协作,现有技术方案对于客户来说往往意味着部署成本高。同时,客户也需要时间、管理成本,来学习、使用、维修机器人。这些弊端客观上限制了服务机器人的更大规模化落地。

普渡机器人产品矩阵

如今,开放、协同、通用这些机器人商业化的行业难题正在被普渡逐一化解。如果说以R2X为核心的开放技术生态为服务机器人的规模化应用打下基础,丰富完整的产品矩阵则解决了客户碎片化的使用体验,而多元的产品形态则正在引领服务机器人迈向更加通用。

市场上坚持长期主义的公司并不多,普渡的经验或许提供了一套机器人企业践行商业化的方法论——以客户为中心,从实际需求出发,将技术和产品转化为解决问题的工具,并持续深耕,做深做透做长远,最终形成商业闭环。

结语: 普渡为服务机器人商业化找到最优解

从开放的技术生态到完整的产品矩阵,再到通用的多元形态,普渡机器人的商业化路径愈加清晰。

很显然的是,高速成长的普渡机器人并不想成为“又一个人形公司”,而是审慎的选择了“类人形机器人”,成为搅动行业发展的先行者,这一切仿佛10年前的汽车行业,新的变革中将诞生新的行业引领者。

凭借以客户为中心的价值观,深刻洞察客户的需求和痛点,并将自身的产品、技术等优势转化为满足客户的解决方案,这是普渡的商业化路径,也是服务机器人商业化的最优解。

通用具身服务机器人的商业化近在咫尺,而普渡正在引领这场技术驱动的商业化变革。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/Kf2XY5syao2nJrdP.html#comments Fri, 20 Sep 2024 10:28:00 +0800
发布AI扫拖机器人RS20 Pro Ultra,萤石网络成为赛道“新黑马” //m.drvow.com/category/robot/PHYQvCG52fdvSZlO.html

9月12日,萤石网络举办了清洁机器人新品发布会,推出了全新一代旗舰产品——AI扫拖机器人RS20 Pro Ultra。与上一代RS20 PRO, Ultra版本搭载了更强配置、更高参数,以进一步提升智能体验。

具体看来, Ultra版本的全新升级体现在以下几个方面:防毛发缠绕、清洁力、托管、隐私保护等。

  • 防毛发缠绕

当前市场上,智能扫地机器人现有的毛发防缠绕设计,无论是胶毛刷、主动切毛滚刷、纯胶刷,或者是气旋导流滚刷,都普遍存在着着各式的问题:胶毛刷对长发不友好;边走边切割的切毛滚刷导致碎头发满地;纯胶刷两端不防缠绕,气旋导流滚刷,导致远离吸口的一侧防缠绕效果不佳等等。

很多扫地机在使用一段时间后,滚刷会被毛发缠绕,从而打断清洁任务,需要去手动清理滚刷上的头发。

为此,RS20 Pro Ultra全新升级到了Cut Free 2.0内切割滚刷,提升毛发切割效率。并且,在滚刷两端新增拦截毛发的设计,使毛发被阻隔在滚刷中间有梳齿的地方,确保先切断后吸走,避免进入滚刷两端。另外,两根胶条紧贴滚刷刷毛,通过特定角度的V形设计,配合吸力,顺利清除宠物毛发,实现了滚刷两端不缠毛,宠物毛发不粘附的效果。

  • 15000Pa飓风吸力,更强清洁力

相比上一代,RS20 Pro Ultra在风机上也进行了改进,采用相对均衡的15000Pa吸力的离心涡流风机,更好地平衡了吸力、续航、噪音这3个矛盾体,尽量让风机工作在能效最高的状态,无论是狗粮、猫砂还是硬币等小物件都能轻松扫净。

同时,RS20 Pro Ultra的风机,配合超长寿命的滚珠轴承,将风机扇叶的动平衡品质等级做到了车规级G2.5标准。这种设计确保了叶轮在高速运转时的稳定性和可靠性,极大地降低不平衡带来的振动和噪音,让清扫过程中更安静、声音更柔和。

此外,地毯清洁方面,RS20 Pro Ultra配备V型边刷设计,可结合自动抬升并向后锁定和收纳功能,清洁地毯不卷边,配合滚刷每分钟3000次拍打,大幅提升除尘效率,深度清洁地毯。

针对养宠和有小孩的家庭更看重的抑菌功能,RS20 Pro Ultra采用了全链路抑菌水路、风路抑菌技术,确保了从清洁到集尘的全链路抑菌效果,抑菌率达99.9%,全方位保障家人健康安全。

  • 智能托管,数据安全认证

RS20 Pro Ultra通过将高清摄像头和AI Vision 2.0图像增强技术相结合,实时动态获取高清图像,在行走过程中也能保证画面的清晰。其高算力芯片和EZVIZ ISP2.0信息处理技术,实现每秒亿万次图像信息处理,再结合萤石自研AI算法,达成无人驾驶级的决策逻辑,真正开启仿人眼AI智能2.0时代。

萤石网络自研导航避障算法与具身智能引擎,在软硬件的深度协同下,赋予RS20 Pro Ultra更智能、更灵活的全场景功能,支持超130种常见物品的精准识别和主动判断,并针对性做出相应的清洁或避障方案。

RS20 Pro Ultra还具备智能脏污识别和智能托管的能力,无需设置繁琐的清洁参数,一键即可开启全屋智能清洁。机器人能够智能识别房间类型、家具、地面材质等,并结合用户的清洁习惯和地面脏污程度,自动匹配合适的清洁方案。同时,通过自学习技术不断优化清扫策略,实现自我进化。

可以放心的是,在隐私安全方面,RS20 Pro Ultra已通过权威机构TUV南德安全隐私认证、中国的CQC认证以及ISO27001云端数据安全认证,确保从扫地机端侧到云端的体系化的数据安全。

据了解,萤石推出的AI扫拖机器人RS20 Pro经过一年的验证,得到了广泛的市场认可。截至2023年底,萤石已在全球130多个国家拥有1.57亿注册用户,其扫地机器人业务实现了270%的营收增长,成为赛道“新黑马”。

本次的新品RS20 Pro Ultra搭载了10项顶配科技,能够给用户带来6大方面的极致体验。萤石网络以“音视频技术+蓝海大模型”为技术底座,将不断给用户提供更智能、更全面、更便捷的产品体验和感受。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/PHYQvCG52fdvSZlO.html#comments Sat, 14 Sep 2024 19:44:00 +0800
海康机器人:10万台AMR走下产线,只是刚刚开始 //m.drvow.com/category/robot/CwdoKPKItFRCF4G9.html 海康的八大创新业务中,长出了第二朵金花。

第一朵是以智能家居安身立命的萤石,代表的是海康ToC的野望;第二朵是进军智能制造领域的海康机器人,挑起的是海康ToB的大梁。

2014年,海康成立机器视觉业务中心,开始自主研发机器视觉和移动机器人软硬件。2016年,这项业务独立为海康机器人公司。

从不甚起眼的机器视觉业务部,到独立子公司,再到八大创新业务中的黑马,如今海康机器人正积极筹备上市。

脚踩智能制造和机器人两大风口,海康机器人这些年的营收,呈现出旺盛的增长势头。2019年至2023年营收逐年增长,分别为8.51亿元,15.52亿元、27.40亿元、39.16亿元、49.4亿元。

工业物联网、智能制造和智慧物流领域正经历一轮快速发展,海康机器人的崛起速度,似乎比外界预想的还要快。

驶入各行各业深水区,意在智能制造

智能制造所涉极广,智慧物流显然是其中的重头戏。

2016年海康机器人宣布独立,也是在这一年,中国政府出台众多政策支持智慧物流产业。物流机器人作为智慧物流的重要组成部分,开始在多个行业实现应用,一批厂商纷纷借政策的东风发展壮大。

过去十余年,一场有关数智化的物流变革,早已在悄无声息中进行。巨大的承运量,年均稳定的增长速度,无不对外宣讲这个行业的传奇。

相比于人工操作,自动化物流转运优势明显。它能提供更精确的计费依据,实时生成分拣信息,优化车辆管理,长效保存历史数据,并且运行稳定高效,数据准确及时,为快件分拣、费用结算和物流追溯提供基础信息,这些都是人工操作无法比拟的。

物流机器人带来了效率的提升,更通过仓储自动化升级,推动了工业的智能化、数字化转型。

海康机器人的目标,也绝不仅仅是快递、电商物流所需的移动机器人,而是更为广泛的适合不同行业的全品类移动机器人(AMR)。

海康移动机器人软硬件升级的过程,伴随的是制造业客户转型升级的加速。根据CMR产业联盟数据,从2015年至2023年,中国市场移动机器人(AGV/AMR)产业年复合增长率达43.18%。

据一位业内人士观察,“过去,转型升级更多发生在新兴制造业,但这几年,传统制造业如铸造业、金属加工,衣食住行等也涌现出了很多应用场景。数智化转型肯定是任何一家企业未来几年的核心工作和核心竞争力。”

对于海康机器人这样的产品和解决方案提供商来说,也意味着通用化的场景越来越多,能赋能的行业也越来越广泛。

一个里程碑事件是,截止今年5月,海康机器人全品类移动机器人(AMR),已累计下线10万台。

回首过去8年,从0台到10万台AMR走下产线,根据技术突破、市场份额和销售规模情况,可以划分为明显的四个阶段:初创期、技术积累期、市场拓展期和规模化生产期。

2014年开始,海康机器人便进入自主研发软硬件产品的探索期,并做了初步的技术尝试,机器人最早的第一个场景,就是在海康自己的桐庐工厂,生产前端摄像机和后端存储设备。

经过两年的摸爬滚打,于2016年进入技术积累期,海康开始尝试分拣等各种应用场景,在多种产品线上都实现了生产流程的自动化,进一步积累技术实力和产品经验。

随着市场需求的多元化发展,在2018进入市场拓展期,移动机器人产品走向更广阔的市场,包括商业仓配、汽车、3C、光伏、锂电、医药等行业,期间不断打磨产品和方案,满足客户的多样化需求,驶入了各行各业的深水区。

2022年,正式进入规模化生产阶段,这个阶段的核心任务是,保证生产有序进行,同时持续进行产品迭代和更新。

目前,聚焦商业流通和工业制造两大领域,海康的移动机器人,已经形成潜伏机器人、料箱机器人、叉取机器人、移/重载机器人、复合机器人在内的五大品类,覆盖了从原料入库、产线物料配送、半成品转运到成品发货各大物流运输环节。

为了让机器视觉技术普及到每一个制造工艺中,帮助制造业更好地提升产品品质,也需要不断丰富产品选型,在技术层面,海康机器人聚焦AI和多维感知技术,重点突破AI 工业质检应用难点,建立行业大模型,研究多光谱成像和3D技术,让信息采集手段变得更加丰富;在产品层面,不断拓展更多品类的产品线,比如非视觉传感、工控类产品等;重点发力智能硬件, 机器视觉也已形成2D、3D、智能ID和工控产品四大品类,为市场提供了更加丰富的选择。

软硬件配合之下,海康机器人已在汽车、3C 电子、锂电、光伏、商业仓配各类垂直热门行业跑马圈地。

从单个行业的单个场景,到多个行业多个场景,到全面深入智能制造,于海康机器人,是进一步打开市场空间、开拓应用场景;于行业,也是数智化发展的必然趋势。

移动机器人的规模化应用,比的是决心和投入

海康威视早已通过安防市场证明,它具有应对碎片化市场,以及大规模出货的能力。

如今海康机器人再次面对同样的问题,并且难度不降反增。

从2023年开始,海康移动机器人加速走向市场,仅这一年的全年出库量就达到3万台。

一位与海康机器人关系密切的业内人士判断,根据目前新兴制造业、传统制造业旺盛的市场需求来看,“2024年海康移动机器人的出库量一定会大于3万台。”

如此大规模的出货,对于生产制造能力是极大的挑战。

即便海康已经在碎片化市场摸爬滚打了二十余载,但机器人的生产制造与安防产品的生产模式有很大不同。

机器人的生产制造则更加复杂和多样化,往往需要高度定制化的设计和制造流程,以及精密机械加工、传感器集成和复杂的软件编程。
海康机器人从独立的那一刻起,对于转向工业市场,即有准备。具体来说,在实际生产过程中,对产品设计、前端仿真、产品开发和解决方案开发,进行严格的质量管理和预防性工作。

工业制造业的容错性很低,这也规训着躬身其中的玩家必须谨慎行事,因为一个失误带来的损失往往是巨大的。

一旦工厂决定使用某家供应商的AMR,考虑到软件对接、替换的高昂成本,通常不会再购买其他品牌的产品。如果发生大规模的事故,影响生产线的正常运转,造成的损失将远远超过移动机器人本身的价值。

对于供应商而言,失去一个大客户,意味着可能失去整个细分行业。

因此,AMR产品在工厂的起量堪比一次大考,同时调度上百台,甚至上千台机器人协同工作,需要强大的软件支撑。

目前,海康机器人已经形成了机器人控制系统 RCS和智能仓储系统 iWMS 两大软件平台。

前者通过核心统筹算法的重构提效,使其在单场地中能够实时调度超过300种车型和2000多台机器人流畅运行,选车分配算法能够在1秒内完成对1000台机器人和2000个任务的最优匹配,提高了调度效率和准确度。

后者相当于仓库管理员,通过汇集物流信息,实现场景、管理者和移动机器人之间的实时连接。今年3月发布的数字孪生软件,实时模拟再现生产现场,实现可视化管理,拉近了管理距离,进一步提高了管理效率。

与海康全品类移动机器人(AMR)走下产线的步调交错前行,核心软件架构也经历了四轮大的迭代。

2015-2017年,基于仓储调度场景推出V1.0版本机器人控制系统,服务3C/电商行业的智能仓储管理;

2017-2019年,为更好适配车间配送等场景,引入任务模板概念,推出V2.0版本机器人控制系统;

2019-2021年,推出混合调度的V3.0版本机器人控制系统,可以支持多种类型的机器人;

2022年至今,正式步入V4.0版本,引入流程引擎技术,提供低代码的二次开发功能,让用户可以参与到业务逻辑和任务匹配的搭建过程中。

软件架构的升级,需基于场景和需求的变化。各行各业的差异性,决定着调度系统和任务管理系统必须具备行业的特征,才能让用户真正觉得能用、好用。

海康机器人最开始的V1.0版本,对客户来说只是一个产品,就像一只“黑盒”,里面有许多打不开的东西。而到了V4.0版本,海康机器人将其改进为流程引擎和任务编排的模式,由于具有了模块化搭建的能力,“黑盒”于是被照亮了,成为一个用户可以定制、参与搭建的工具。

从产品向工具转变的好处在于,将来产品升级、产品换型或者产线改动,客户都能够自己完成搭建。用户的自主性和灵活性更强了,同时还能降低系统维护与升级的成本。

这条路径,并非只有海康机器人摸索出来,事实上,这是所有真正参与过交付过程的团队,最终都会形成的共同认知。

一名从业者对雷峰网表示,“在真正交付过程当中会发现,不这样做肯定不行。”

只是,海康机器人的决心和投入更大,研发如此,营销亦然。

当下的大环境,不确定性成为常态,对于移动机器人公司来说,要把自己的组织变得更为敏捷,最好的做法就是将每一个决策单元都尽量前移。

这些年,海康机器人一直在打造自己的营销体系,遵循区域下沉、行业细分的逻辑。

截至目前,海康机器人在国内一共设立了12个分公司,30多个办事处,每个办事处都有销售人员、售前解决方案、技术支持和项目管理人员。

“海康机器人一直很注重区域服务能力的建设,区域里面基本上 60% 的人员都是技术服务人员,大量前端一线人员会快速与客户进行密集、近距离的接触。”

市场机遇总是稍纵即逝,在一个个具体的项目竞争上,唯有拉通研发和营销,迅速精炼出方案,并通过强大的营销体系快速复制、推广,企业才能在激烈的市场竞争中稳操胜券。这也是海康一贯的思维方式。

大规模交付里的柔性制造

千台交付,堪称移动机器人企业发展中的“龙门一跃”。

门外,是一片混战,挑战重重;门内,则步入规模化快车道,品牌影响力与市场份额一起快速成长。

海康机器人的第一次千台交付,发生在2021年底服务一汽丰田的新能源工厂。

新能源车厂从生产交付到整车下线,都有明确的时间节点要求,在一个多月的紧凑时间里,海康机器人一次性部署了近1000台移动机器人同时上线。

真正的交付现场,往往是理想与现实之间差距的放大镜,把客户要求转换为需求时带出的技术难题层出不穷。尽管过程充满曲折,但海康机器人还是顺利完成了交付。

而在此之前,即便是需求量较大的仓储零售场景,最多也不过面对一次性交付百台的任务。

丰田新能源项目之后数年时间里,海康机器人又陆陆续续进入不少类似的大规模交付项目,包括光伏、锂电、汽车等领域,研发团队和实际在现场交付的项目团队,也通过这样几次磨炼,获得了宝贵的大规模交付的经验和沉淀。

经验的累积与信任的堆叠,就像一块块铺路石,会将企业一步步引向更加广阔的场景。

但在保证敏捷制造和按时生产交付的过程中,企业会面临两个难题。

一是如何从千行百业“碎片化”的需求中,提炼出共性,给出解决大部分场景需求的通用解法。

行业与行业之间虽然存在差异,但也有不少共性应用。例如,3C行业中的货到人拣选,从来料存储、半成品检选到最终成品下线的整个流程,与汽车及汽配行业会有相似之处,通过适当调整和优化,这些共性应用可以在不同的行业之间进行迁移和复制。

因此,这一步的核心是,把复杂问题尽量简单化。当产品设计过于复杂时,会给前端交付带来很大压力,因为非标必然带来很多不可控的问题,只有通过标准化,产品的稳定性、可靠性才能够加强。

海康在移动机器人产品上,做了很多标准化、简单化的处理,比如早在2019年时,便在第三代移动机器人上,引入了开模底盘的设计。

二是如何进一步到具体场景中,满足客户的定制化需求。

例如,服装行业具有明显的季节性,款式和型号经常更新换代,导致SKU数量非常多,而每个SKU的库存量相对较少,加上线上销售的高退货率,需要特别考虑退货仓的管理。相比之下,图书行业采取寄售制,但图书退货通常不能二次销售,因此图书的退货仓管理,又是一个行业定制化的挑战。

正是这些不同行业的特性,导致了业务上的碎片化,要解决这些问题,唯有通过对业务深入理解。

然而,海康机器人不可能成为每一个细分行业的专家,那么为了实现将产品应用到千行百业的愿望,唯有做好产品,提供标准化的解决方案,并坚持“被集成“的市场定位。

随着制造业的转型升级,产线的迭代速度日新月异,尤以近两年的新能源汽车行业为代表,这意味着生产的模式也需随之变化。

面对从研发到生产,越来越快的产线更迭速度,海康机器人的做法是:让柔性制造无处不在。

不论硬件,还是软件,不论研发、产品设计、生产制造环节,还是给客户提供解决方案,都秉承柔性制造的底层逻辑。

随着前端智能设备数量增加,调度软件面临着越来越多的新挑战。海康机器人秉持柔性制造的理念进行机器人生产,秘诀在两个字,“拆”与“合”。

“拆”指的是由大到小。

硬件上,将零部件拆解到最小单元,不断在最小单元中进行多产品品类的模块化应用和定制;软件上,将底层算法、算子和任务模板模块化。

“合”指的是由小到大。

在碎片化的场景中,将已被模块化的软硬件,像搭积木一样,通过通用化的iBASE平台(针对移动机器人)和异构平台(针对机器视觉)进行n次排列组合,构建成适合于某一行业的产品和方案,实现快速部署。目前海康的V4.0版本软件架构,便具有这种模块化搭建的能力。

这种柔性可以传递给生产价值链中的每一个节点,形成单个设备的智能化以及复合设备的智能化,并逐步覆盖到单条产线、多条产线,再到车间以及整个智能工厂。对智能制造的发展,有重要意义。

反过来,未来随着制造业升级,柔性制造的可实现,产品的升级换代也会变得越来越快。

让竞争回归价值和理性

这两年,受投资以及下游需求的推动,3C、锂电池、新能源汽车、光伏、半导体等热门领域中,移动机器人的竞争十分激烈。

许多人担心“价格战”,是否会不断重演。

不同于相对标准化的商品,AMR并非“带轮子的货架”这样简单的标准化产品,而是智能化的软件+硬件的解决方案,是系统性的交付,涉及后市场服务,以及交付完成后对方案的持续优化。

对于移动机器人行业,良性发展,理性引导客户达成方案效果,是当下最重要的事。

行业的热潮减退后,移动机器人行业正从无序回归有序,传统制造业和新兴制造业客户,也变得越来越理性,“这些年确确实实在行业当中,由于低成本,或者原来方案的不成熟,从业者和客户,有吃过亏的,也有受过伤的,过往的经历会让大家变得成熟一些。”

一位海康机器人内部人士对雷峰网表示,“降本增效固然是长期努力的方向,性价比固然是拓展市场时的有力武器,但更重要的是提供价值,企业越来越专注于自己擅长的细分领域,越来越追求方案的低成本轻量化,以及在客户的场景中算得回来账。”

总的来说,移动机器人的应用场景,庞大且细分,在这条足够广、足够长的赛道上,各行各业都会有新兴公司涌现,最终呈现的一定是百家齐放的格局。

移动机器人行业虽然已经走过市场教育阶段,在许多行业变成刚需,但仍有很多传统制造业的场景尚待被挖掘。企业也需要理性客观的看待每一个产品的成长周期,不断寻找新的增长曲线。

]]>
机器人 //m.drvow.com/category/robot/CwdoKPKItFRCF4G9.html#comments Thu, 05 Sep 2024 10:31:00 +0800
招商局创投、上汽等产业方加码,逐际动力获A轮战略融资 //m.drvow.com/category/robot/0AT9IipxBBCbeVHG.html 7月15日,通用机器人初创公司逐际动力(LimX Dynamics)宣布完成A轮战略融资。本轮融资由招商局创投、上汽集团旗下私募股权投资平台尚颀资本领投,峰瑞资本、绿洲资本和明势资本等老股东持续加码。值得一提的是,由阿里巴巴、淘宝、天猫等共同持股的杭州灏月企业管理有限公司也参与了本轮投资,意味着阿里巴巴在机器人领域的又一布局。

据雷峰网了解,逐际动力重点关注LLM(大语言模型)、Spatial Intelligence(空间智能)、Motion Intelligence(运动智能)等三大技术在人形机器人上的有机融合,以释放其最大的潜能,已经发布了四轮足机器人W1、双足机器人P1等产品。

接下来,逐际动力将着重于推进人形机器人运动智能的基础模型(Foundation Model for Humanoid Motion Intelligence)的建立:

•    数据:通过互联网视频数据、人类动捕数据和仿真数据,高效采集多样化的人类运动控制的大数据;

•    预训练:对大数据进行预训练,提升算法的基础运动理解能力与生成能力,以及多场景泛化能力;

•    强化学习:利用Real2Sim2Real闭环,缩小仿真和现实之间的差距,提高强化学习训练的效率和质量,让人形机器人与真实环境的交互更准确和稳定。

逐际动力创始人张巍表示,逐际动力A轮融资从一开始就锁定产投方,“因为场景就是时间、就是资金、就是技术。”通用人形机器人的AI时代更需要科技公司懂场景。这次融资让逐际动力的通用机器人技术走进「智」、「造」、「服」、「物」等多个战略性产业,有助于深入场景、理解场景,为人形机器人基础大模型的构建提速,让技术迭代与真实需求更加匹配。

在此前雷峰网的专访《四足机器人「技术跃变」:如何成为「地面的大疆」?》中,张巍认为,通用足式机器人正处于技术爆发期,基础研究与商业化的交集已经出现,并不断扩大。逐际动力旨在通过自研方案,将感知能力与运动控制进行结合,利用在地形感知、强化学习、多刚体动力学、混杂动力学、模型预测控制等领域的学术和研发经验,建立领感知与控制融合的算法框架,实现更高稳定性、更强实时性的控制能力。

当技术进入场景落地阶段,逐际动力的目标是在通用人形机器人的AI时代,找到匹配的战略性产业资源和应用场景,在利用多模态大模型加速通用人形机器人技术突破的同时,推动相关技术在真实场景中进行验证和迭代,从前沿技术探索升级为商业化落地实践,为通用人形机器人多场景的商业化应用打下技术和产业基础。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/0AT9IipxBBCbeVHG.html#comments Mon, 15 Jul 2024 20:25:00 +0800
港科广马书根:算力累积并非智能,机理才是关键丨具身智能十人谈 //m.drvow.com/category/robot/dZ8CzQdI1sjCJiKT.html 作者丨饶舒玮

编辑丨岑峰

仿生学,一向被认为是一门“古老又年轻”的学科。古老在于人类从直立行走时期就已经学会从自然界获得灵感,年轻是因为不断在模仿的过程中创造出新的事物。创造力,是人类区别于别的生物的一种本领,也是人类战胜 AI 的一项天生能力。

在这个“AI 取代人类”言论喧嚣尘上的时代,机器人开始进入家庭场景,大模型的出色表现让人们不断惊叹,人们担心人类和机器之间的界限逐渐模糊,焦虑情绪不断蔓延。但在港科大(广州)教授马书根看来,“算力再高也算不出创造力”,对于人工智能威胁论他不担心,他担心的另有其事。

师从日本蛇形机器人之父,深耕机器人领域三十余年,马书根自认为是“保守派”。当这个领域的热钱不断涌向人形机器人和大模型时,马书根表示,社会资本应该往更需要的地方流动,而不是仅局限于智能方向。

具身智能的出现,让硬件的重要性重新被看见。拥有仿生学背景的马书根更加注重机器人在与外界环境互动时的身体表现。尽管仿生是从模仿开始,但是掌握机理,才是关键。在马书根看来,如果没有掌握机理,机器人就只能停留在按照指令完成动作,无法与外界环境实现互动,还远没有达到“具身智能”的程度。但要如何找到机理,如何验证机理的正确性,马书根仍在探索,这是一条尚待开拓的路。

对于机器人领域,马书根有自己坚持的哲学思考。他始终认为,这个产业的发展目标不应该是全球经济产值,而是对人类社会发展的影响,即利用机器解放人类劳动力,为人类摆脱繁重劳动的枷锁,改变多数人因工作重负而情感枯竭的社会现状,让人们的生活重心回归到个体之间的相处上。

在AI科技评论对马书根教授的专访中,我们可以了解到在传统机器人领域对于具身智能的看法,以及仿生学发展对于具身智能的影响和当前面临的行业挑战等。

以下即为AI科技评论与马书根就具身智能这一话题的访谈实录,限于篇幅,AI科技评论进行了不改原意的编辑:

具身智能是身体与外界的交互

AI科技评论:当年您为何选择赴日深造,又是如何确定的研究方向?

马书根:因为在上世界80年代初期,日本在机器人领域处于世界领先地位,所以当时的留学目标就是日本。1985年,我毕业一年后就前往日本东京工业大学进行深造,跟随梅谷阳二和广濑茂男两位教授学习,他们自70年代末便开始研究蛇形机器人。

之所以选择蛇形,主要还是我的兴趣驱使。从科研的角度来说,研究蛇形机器人有两点优势,第一是蛇结构简单,只有像一条绳索似的生物结构;第二是蛇的大脑较小,却能控制全身运动,这对于我们如何在资源有限的情况下实现功能最大化的研究很有启发。

当时的日本经济繁荣,产业界对技术创新的需求迫切,从那时我开始意识到,仅仅依靠兴趣驱动的研究难以在产业界获得广泛的认可和应用。我的导师也多次找我谈话,给我提供了航天机器人这一方向,主要解决零重力环境下机器人减震的问题。

但我还是更偏向研究工业机器人,在我博士期间就开始研究工业机器人的多关节和象鼻机器人。博士毕业后我去了小松制造所开始工作。在小松呆了一年,我认识到工业界不太合适自己,想继续赴美深造。于是我在1992年去了美国,1993年又回到日本成立了自己的实验室,正式开始科研方面的工作。

AI科技评论:作为深耕机器人领域三十多年的学者,您怎么理解具身智能?

马书根:我们可以从一个简单的例子出发理解其概念。比如,一条已经失去生命的鱼,借助一定流速的水流就可以让身体实现“游动”的状态。像这样的身体形态与外界环境产生交互,正是具身智能的一个重要表现。

在我看来,具身智能包含两种类型:一种是内在智能,它负责稳定身体内部的动态平衡;另一种则是从外界环境中获取信息,并根据这些信息调整内部状态以适应外界。

以人类为例,我们的日常技能并不只是通过教导完成,更多时候是身体为了适应环境进行主动学习。为了在不同的地形上稳定行走,我们的身体会自动调整姿势和动作。这种适应性和反应能力,正是具身智能的体现。

在过去,人工智能领域更多地关注计算和数据处理等虚拟层面的能力,现在人们开始思考如何把大脑的智能部分转移到身体上,从而在现实世界进行互动和操作,因此具身智能得以发展。

AI科技评论:仿生学这一学科背景对于您之后研究具身智能有何影响?

马书根:运用仿生学的知识,我们可以通过观测生物的运动方式,运用现有的控制方法来实现机器人与环境之间的交互。比如蛇在冰面上、在平地上、在崎岖的地面上,就会出现不一样的运动形态,这正是其内在智能的一种体现。生物体会根据其所处的不同环境演化出不同形状和运动方式。

1994年前后,具身智能这一概念还没出现,仿生学领域已经开始通过研究生物的动态行走来研发机器人,不仅仅是两条腿的生物,还有四条、六条甚至八条腿的都有,像仿昆虫的六条腿,仿蜘蛛的八条腿。像是现在的四足机器人就是动态模型,实际上和我们所研究的一脉相承。

但让机器人走起来还不够,还要实现稳定地行走,并具有承载重物的功能。要想实现稳定,最理想的状态就是和地面有三条腿以上的接触,保持稳定的三角结构。

从仿生学的角度来看,很多研究就是从观察开始的。我们当时为了研究稳定行走这一课题参考了鳖这一生物,关注这类生物的运动机制。虽然研究工作往往从观察开始,但我们不能仅停留在模仿现象的层面,而是应该理解其中的机理和内在的运行逻辑。

现在具身智能的研究也常提到大脑和小脑的类似功能,对此我持保留意见。有实验显示,有些生物即使切断了某些神经但仍然能运动,会跟随跑步机的速率变化改变自己的运动速度,这说明运动控制了并非全由大脑主导。

而人类的一些基本日常活动也并不需要用到小脑。类似漫步行走运动由脊髓等低级中枢所控制,它们驱动我们进行最基础的运动,使得我们能够自然地进行日常活动。但如骑行运动或跳水等复杂技能,就需要小脑协调训练。

“先学后破再创造”

AI科技评论:仿生如何避免单纯的模仿?您在研究仿生机器人时期,有遇到哪些印象深刻的技术挑战?

马书根:在仿生学研究中,每次都会遇到技术挑战。比如在研究蛇的行动时,让蛇按照预期爬上树棍就很难,因为蛇不听指挥。对于蛇的爬行动作,要研究各种爬的方法和样式。像是我们想象的蛇上树是转圈往上,但其实蛇是曲线爬行,其中有些平衡机制需要考虑。同时,要想实现机器人完全像蛇一样爬行还很困难,因为蛇关节短且柔软,而机器则很难做到。

所以仿生也不并是完全模仿,要先学后破再创造。最初人类模仿鸟类用手臂上下拍动尝试飞行但失败了,后来靠核心机和固定翼才发明了飞机,之后才有了空气动力学等研究出现。

就仿人机器人这一块来看,“破”这一方面还有待发现。现在的人形机器人以电机为主,关节肌肉等模拟技术还在发展,短期内想要完全代替人类不太可能。

其实,仔细研究人体就会发现,人在完成动作时力学系统配合得很流畅合理。比如我们会发现快走比小跑还累,这是因为两种运动的能量模式不一样。人在走动时单腿摆动,重心有上下变化,向前走时重心会下降再上升。而跑步时不只是重心上下变化,你也会感觉到跟腱被拉伸。人走动速度不固定,有快有慢。速度低时势能和动能有效传递,不需要太多肌肉能量;快速行走时,来源于重心上下变化的势能远远达不到动能的需求,依靠肌肉提供更多的能量。人跑步时,不只重心上下的势能还有跟腱的弹性势能用于和动能有效传递,这样比同速度走动需要较少的肌肉能量。所以感觉小跑比快走要轻松。

AI科技评论:不同于模拟环境,您认为面对复杂多变的现实环境,机器人可以如何应对?

马书根:机器人需要通过传感器获取数据,识别障碍物,再规划动作,这个过程就是一整套的闭环控制。如果在其中某一环节没能够及时反应,就会导致其余环节脱节,可能出现机器人在高速运动时发生碰撞的情况。所以,我们提出了一个理念,即不能完全依赖认知来完成动作,而要通过机构设计实现。

在机构设计上,我们合理利用了欠驱动系统。比如,当机器遇到障碍物时,传统思维是抬起或避开,但我们尝试通过来源于障碍物推力被动改变运动模式来继续前进。这种创新的设计思路让我们在解决问题时有了更多的选择。通过科研上的不断进步,让我们开始尝试通过机构本身的调整来解决问题,从而实现更可靠更高效的移动方式。

例如,现在我们在研发机器人抓手的时候,经常需要面临这么一种情况,即如何在高速运动的时候提高抓取的鲁棒性。按照一般的思路,一般会在机器人抓稳后再用驱动器吸取固定,但这样驱动器数增加并控制会复杂。运用调整机构设计的方式,当遇到电机功率满足“抓”这一动作后,可以让同一电机驱动吸取机构移动,实现安全可靠抓取。同时利用气压驱动也能够完成抓取和吸附动作,如此也能够可靠的完成目标任务。

AI科技评论:在您看来,目前仿生机器人发展到什么水平?未来的突破方向会是什么?

马书根:按满分100分来看的话,目前的仿生水平未达到40分,一些动作像走动、跑动、翻跟斗等,与人的动作还有差距。虽然像波士顿动力等公司的电机技术在近几年有很大的进步,但像往上跳、打跟头、背跃式跳高等高难度动作,要么是所需电机功率太大,要么是机体需要较大弹性,导致这些动作都很难实现。

尤其是在模拟人体肌肉的复杂性和协同性方面,目前的技术仍处于初级阶段。人体在行走、奔跑乃至跳跃时,不仅依赖于四肢的力量,还涉及到腰部、背部等多块肌肉的协同作用,这种全身性的动力链传递机制是现有机器人技术难以完全复制的。

剩下的60分,我认为突破的关键在于基本的驱动器,就如电梯平衡系数一样,运行时所需的能量与自身重量比值越高越好,但目前我认为这一方面并未达标。相反算法方面整体都有了很大的提高,也相对容易实现优化。但基于机理的算法相对不足,需要硬件方面更要努力跟上。

无法算出的创造力

AI科技评论:您认为机器人领域突破发展瓶颈的关键点会是什么?

马书根:我认为是机理,我一直觉得现在的机器人研究始终没有把握真正的机理。即使大模型出现后,这一部分也并没有得到发展。

因为虽然大模型能够帮助处理大量数据,并在感知到决策的过程中展现出了巨大的潜力,但因为其“黑箱”的特性也带来了可靠性的问题。这也在某种程度上限制了工业界对于大模型的使用,特别是高精度高可靠性要求的领域。这些领域的企业需要有很明确的排障方案,而大模型因为难以解释其决策依据往往找不出故障原因。

在算力还没那么强的上个世纪70年代,计算机领域尚可通过日积月累形成一定的机理基础。到了八九十年代,计算机的算力逐步提升,但机理方面还没有大的突破。如今,尽管这个领域有了很多突破,但其实很多都是因为算力的提升才得以解决,并不是因为对机理掌握程度的提高。

此外,尽管机器人技术日新月异,但机器人学科的基础科学知识尚显薄弱。在90年代中期,日本等国就开始探讨这一问题,任何学科都一定要有坚实的基础知识来支撑其发展。无论是机械、电子还是信息科学,都需要在各自领域内深化基础研究,才能推动机器人学科的成熟。

AI科技评论:机理可以通过什么方式探索?未来的机器人发展方向会是什么?

马书根:目前没有一个定论,也没有方法可以验证机理的正确性。所谓的机理都还是假设,需要有实际的东西来证明。

以人形机器人为例,尽管它目前非常热门,但我们并不认为人形是机器人发展的唯一方向。机器人的形态应该根据具体应用场景和需求来确定,而不是盲目追求人形。

在功能上,我们更强调机器人的辅助性,它们应该能够辅助人类完成一些危险、繁重或人类不愿意从事的工作。试想一下,当危险系数很高的工程全部可以由机器人自动化完成,人类得以解放享受生活,那才是机器人真正理想的应用场景。而不是像现在的一些宣传概念,机器人取代人类出现在日常的家庭场景中,尤其是在养老和育儿这两大类看护型场景中,这才是人类最需要存在的地方。这类需要人类进行情感关怀的角色绝不能由机器人来承担。

世界上的产值增加了多少,对于人类社会的发展来说并不是最关键的,如何利用自动化解放人类才是需要我们思考的东西。所以我认为目前的社会资本应该往更多需要的地方流动,而不是只局限在一个方向。

AI科技评论:您如何看待具身智能领域现在的发展现状?

马书根:具身智能这个领域现在学习算法方向的年轻人多了,但是这个领域还很需要机器人方向的人才。学习算法无可厚非,软件实力也已经大大提升了,需要有一些新的东西出现。

要想做机器人的研究,不能光靠软实力,必须两条腿走路。算法这方面现在相对来说比较容易解决,硬件背后的机理研究更需要受到重视。特别是在这个时代,人的创造力才是最重要的,这是无论怎样提高算力都没办法从人工智能那里得到的东西。创造力也没办法从书本里的知识里得出,很多时候反而是“玩出来”的。所以,我现在经常和学生说,别只是钻研书本,要多接触社会,要多看看外面的世界。

由市场决定科研价值

AI科技评论:在您看来,您怎么衡量一个研究的科研价值?

马书根:我现在衡量一个研究成果的科研价值时,主要考虑这个成果能不能经过市场经验,实践后能不能看到效果。总结此前与企业合作的经历,我们更希望研发成果不仅只局限在某几家企业应用,还能为更广泛的应用场景提供借鉴。

举例来说,当某钢厂希望我们能设计一套管道检测机器人时,我们更关注这一设备日后的应用和共性需求。比如,检测的内容是什么,这个尺寸是否适用于别的场景,如何确保检测的准确性和效率等。我们更希望这套设备具备通用性,而不是只用于这一个公司。所以在研发的时候,提炼出适用于类似场景的共性技术,为未来的研究和应用提供有价值的参考,如此研发投入才更有意义。

我现在认为,在开始一个研究前,就要从实用性层面来思考,在这个场景里到底需要什么样的形状,什么样的材质,要达到什么样技术水平等。在我看来,科研价值可以分为两种,一种是基础科学, 像是数学、物理等学科知识,在全行业适用;一种是技能的应用,可以发展出什么样的产业,真正可以投入使用,这样科研的价值才得以体现。

AI科技评论:您下一步想要攻克的科研方向是什么?

马书根:我希望研究出一种医疗机器人,可以直接进入人的身体,打通血管,解决血栓等问题,或是直接可以达到病灶,减少药物对人身体的副作用。最后处理完,就可以通过某种方式变成营养增强人体抵抗力。

AI科技评论:能介绍一下您现在的研究项目吗?

马书根:我最近在研究适用于近海领域的水下机器人。这类水下机器人通常使用螺旋桨作为推进器。如果是在深海,这可能没问题,但在近海就比较难实现,因为螺旋桨可能会卷死海洋植物,或者是在靠近海底面观测时卷起杂质影响观测等。

所以我们团队希望通过仿生学的方式,研究什么样的机器人可以在不对生物造成影响的情况下进行作业,这在近海养殖等蓝色经济领域有比较大的需求。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/dZ8CzQdI1sjCJiKT.html#comments Thu, 11 Jul 2024 17:33:00 +0800
上海交大王贺升加入 UniX AI 担任首席科学家 //m.drvow.com/category/robot/FudICzjczDgqoyzw.html 7月11日,上海具身智能公司 UniX AI 宣布上海交通大学特聘教授王贺升担任其公司首席科学家。

资料显示,王贺升是上海交通大学特聘教授,国家杰出青年基金获得者,机器人顶会IROS2025大会总主席。他也是IROS成立以来,唯一一位中国内地主席。

作为国内最早开始研究机器人的一批人,王贺升针对非结构化环境下机器人高精度复杂作业的挑战,率先提出“深度独立交互矩阵”创新概念,构建了一套适用性广的自适应视觉伺服方法体系,攻克了大范围动态场景下的机器人高精度控制难题,创新成果在工业、服务机器人领域发挥了重要作用。

对于加入UniX AI,王贺升表示:“UniX AI很低调,成长速度飞快,在短期内已经成为了一家业内领先的人工智能和通用人形机器人公司,我对其发展前景高度看好。”

同时,王贺升还对 UniX AI 创始人兼 CEO 杨丰瑜表示欣赏,“我对创始人 Fred 杨丰瑜充分信任,00后的他已经展现出相当成熟的商业操盘能力;此外,他本人又在机器人视触觉方面有着深厚积累,这对于一个高科技公司来说,至关重要。”

据悉, 杨丰瑜为耶鲁大学博士,其搭建了世界首个触觉大模型 UniTouch,适用于与视觉、语言和声音等多种模态相连的基于视觉的触觉传感器。从机器人抓取预测到高细粒度的材料分析,UniTouch 能够在零样本训练条件下,执行各种触觉感知和操作任务,是全球首个展示出这种能力的模型,为具身智能机器人的研发提供了重要支持,特别是在通用人形机器人领域。

作为一家人工智能与通用人形机器人公司,UniX AI 致力于在 TO C 场景中发挥作用。“家庭是人形机器人未来最重要的使用场景,也是对人口严重老龄化的社会,最大最切实的帮助,非常具有社会意义。”杨丰瑜表示。

据 UniX AI 方透露,在今年八月北京举行的世界机器人大会上,UniX AI 将推出轮式人形机器人 Wanda 和双足人形机器人 Martian,展示人形机器人在 TO C 场景,包括家庭场景中的落地应用,涵盖“厨房清洁场景”“餐前餐后场景”等。 

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/FudICzjczDgqoyzw.html#comments Thu, 11 Jul 2024 16:19:00 +0800
工业机器人的「范式变革」:从程序设定到「具身智能」 //m.drvow.com/category/robot/ZYejd0YA3l17utXI.html 大模型一声炮响,掀起了机器人的革命浪潮。

这一变革率先发生在人机交互上。以ChatGPT为代表的LLM模型第一次在人与机器间建立起高效的沟通方式,从根本上打破人机之间的语义隔离,进而赋予机器人快速向人类学习的能力,使其以更快地速度学习并执行相关任务。

传统的人机交互模式,机器人只能机械地执行人类设定好的程序。这一模式局限性非常大。比如,需要有专业的工程师将知识“翻译”给机器人,机器人才能执行具体任务,沟通效率低且人力成本极高,限制了机器人的落地应用。

在大模型强大的理解能力加持下,机器人能更智能地“听懂人话”。人机交互不再需要专业的知识门槛,可以用自然语言、肢体动作等类人行为进行交流,大幅降低人类使用机器人的门槛,进而使得机器人的广泛落地变成可能。

“机器人融入大模型是发展趋势。”全国机器人标准化技术委员会委员赵勇表示。

作为AI技术的进阶态,大模型强大的泛化能力,让机器人在“类人”的道路上更进一步。如果把机器人视为一个智能体,大模型则是这个智能体的技术底座,为机器人走向「具身智能」奠定了基础。

如今,大模型在机器人领域的应用正在不断拓展,各行各业正面临一次“重铸”。其中,工业机器人作为应用较为广泛的品类,也迎来了一次深刻技术与范式蝶变。微亿智造CTO赵何博士以具身智能理论作为指导,将成熟的工业机器人与新兴的人工智能技术融合,首次提出了“具身智能工业机器人”(Embodied Intelligent Industrial Robots, EIIR)这一概念。至此,EIIR正式走上了历史舞台。

 范式革命:从探索到利用

理解EIIR之前,首先要搞清楚,什么是具身智能,以及什么是具身智能机器人。

具身智能理论根源于“具身认知”,其主张智能体的认知能力由其自身结构决定,这种认知又直接反过来影响智能体的高级心理活动,诸如:推理,决策等。并且,智能体根据自身的躯体结构来构建自己的世界模型,从认知产生的机制到智能体决策依赖的世界模型,均受制于智能体具体的物质形态。

比如,婴儿早期的学习行为,例如爬、抓取、行走等,本质上是智能体在主动探索周边环境,来形成对外界的认知,并构建基础的世界模型,形成了一套普适的方法论。

智能体的认知过程遵循"探索﹣利用"( exploration - exploitation )的范式,通过自己的"躯体"与外界环境进行互动,从外界对智能体的动作产生反馈获取信息,建立起自身的认知模式。

在具体系统构成方面,智能体核心包括三部分:感知系统、运动系统和世界模型。与传统认知不同,感知和运动系统并不孤立,二者同样参与认知过程,世界模型则是智能体基于自身结构特点而构建,用于解释世界的认知框架。

如果将这一理论应用到机器人行业,理论与技术相结合,便产生了具身智能机器人(EIR)。可以预见,未来所有机器人都将面临一次「范式变革」。从第一性原理出发,具身智能机器人存在诸多共性,主要体现为五大能力,分别是——

1、多模态环境认知、交互能力;

2、智能的任务学习和理解能力;

3、高度自主的智能决策能力;

4、智能高效的单任务执行能力;

5、多任务切换能力。

这些能力构成了具身智能机器人的基础。在具身智能理论框架下,“智能体”和“环境”是矛盾的两个方面,它们之间的对立统产生了智能体的认知,孵化了智能。因此,从一开始设计机器人时,不能把机器人从任务环境中剥离出来。

当这一理论被应用于工业,具身智能工业机器人(EIIR)便呼之欲出了。作为EIR在工业场景下的外延,EIIR的生存环境,无容置疑就是工业生产环境。

EIIR进入工厂:但形态并非人形

过去几年,AI技术的应用,从某种程度上推动了工业机器人的智能化提升。

比如,图像识别技术在图像分类、目标检测和图像生成方面取得的长足进步,使得计算机对图像的识别理解能力已经超越了人类,对应的技术被应用到工业质检这一环节中,大幅提高了企业生产制造的质检效率和质量。

又比如,Slam算法被用于机器人导航,通过计算机视觉和机器视觉等技术,从而提高工业AGV/AMR的灵活度,最终提高运输效率,降低人力成本。

而今,在以大模型为代表的AI技术赋能下,具身智能工业机器人(EIIR)成为工业机器人的新方向。

“EIIR可以理解为EIR在工业场景的外延,但形态并非是人形。”微亿智造CTO赵何博士表示。

EIIR的生存环境就是工业生产环境。相对于自然环境,生产环境是一个闭合、简单的环境。从逻辑上讲,“人形”作为开放环境下的产物天然不会是闭合环境最佳的躯体形态。而且,人在很多工业场景存在天然的“缺陷”,在灵活度、精准度上,很难与机器相提并论。如果可以由机器自主完成而不需要人的参与,那么对应的生产环境可以设计成对机器更加友好,而完全不用考虑人类体形的局限,从而让生产过程更加高效可靠。

EIIR需要替代的是人在生产过程中被异化后的投影,不是人的本质,更不是人的外形。将人类从生产活动中解放出来,必然存在多种形态。因此,“EIIR和人形机器人并不能直接划等号”。

EIIR本质上,目的是“超越人”和“解放人”。相比精确的自动化控制,EIIR可以更好的实现真正的无人化生产。

原因主要有三点——

  • 一是生产场景的不确定性。整个工业环境,场景非常多样化,存在诸多不确定性,属于定量开放环境,需要有EIIR这类具备灵活智能能力的机器人来应对。

  •  二是生产环境闭合边界不一。不同生产任务都有与之对应确定的生产环境,它们之间闭合边界不具备一致性。这就要求足够高的智能水平或在少量人类帮助下,完成这种环境的切换和适应。

  • 三是标准产品具有标准智能。使得标准的EIIR产品具有一定水平的标准智能,不仅能减少 EIIR 从制造到应用的成本,并尽可能的适用于不同生产场景、适配具体任务,使其大规模应用成为可能。

一言以蔽之,EIIR的出现是市场环境与技术迭代共同作用的结果,又将反过来解决市场痛点。在这个相互作用的过程中,机器人能够实现“自我进化”,成为新的生产工具,进一步推动社会生产力的发展。

EIIR三大要素:感知系统、运动系统,与世界模型

作为具身智能的实体表现形式之一,EIIR必然遵循具身智能的一般规律,整个智能体由感知系统、运动系统和世界模型三部分组成。

  • 感知系统

EIIR 的感知系统是一个多模态泛传感器系统。该系统配备多种传感器,具备比人类感知器官更精准的信息收集能力。这些信息相互补充、交叉验证,为EIIR的决策提供输入信息。并且,感知系统除了对周边环境进行连续动态检测以外,还要对自身进行不间断地状态感知,为EIIR的决策、与环境的互动提供感知基础。

例如,在工业质检领域,传统的机器质检虽然能够大幅提高检测效率,但模型依赖于工程师的不断调优,柔性较差,部署成本也比较高。而EIIR则能够识别和分析对象的姿态和特征,自主生成检测序列,以高精度的图像传感器追踪形态不定、位置不定的缺陷,实现柔性的、超越人类的缺陷检测能力。

通过“感知系统”,对环境及自身持续采样,并基于联合认知进行决策

  • 运动系统

EIIR 的运动系统首先是一个闭环控制系统,其一般原理是通过反馈环路,比较被控状态量的实际值和设定值之间的误差,作为输入送到控制器进行计算,控制器的输出控制执行器动作,直到被控量的实际值达到设定值为止。EIIR 的运动系统会包含很多个这样的闭环控制系统,这些系统必须共同协作才能满足 EIIR 灵活、精准、快速的要求。

以“关节电机”为例,其“视觉伺服”系统由多个控制器、按层级嵌套组合而成,每一层都有自身需要优化的控制指标与对象。只有从整体到局部逐层细化,才能实现闭环控制。EIIR能够根据控制系统,实时地结合动力学、运动学算法,计算时间和状态最优的运动轨迹,并以毫秒级速度闭环运动控制、使用图像模型,完成闭环运动规划。

通过“视觉伺服”,实现感知系统与运动系统的闭环控制

  • 世界模型

世界模型是智能体根据自身结构特点构建起来、用于解释世界的认知框架,会随着智能体与环境的互动而动态变化。该模型由以大模型技术为主的“基础模型”叠加智能体在面临具体任务时的知识形成,二者通过“探索-利用”的范式构建起一个服务于具体任务的世界模型。

更具体一点,“基础模型”赋予了EIIR强大的理解能力,能够通过人类习惯的模式与人类进行信息交换。人类只需输入自然语言、图片、视频、动作示教等知识,就可与EIIR建立起“示教-学习-反馈”的互动模式,将知识进行传递。如此一来,EIIR在基础模型和具体任务知识的训练下,通过不断地自我学习和进化,便能实现独立运行。

通过“基础世界模型”,建立“示教-学习-反馈”的互动模式

结语:EIIR,未来已来

“具身智能工业机器人(EIIR)是现代制造业的杰出代表,它们通过高度的自动化和智能化,极大地提升了生产效率和质量。”中国信通院华东分院、人工智能与大数据事业部主任陈俊琰表示,“随着多模态大模型、人机自然交互等技术的进步,EIIR够适应更复杂的工作环境,进行自我学习和优化,是“人工智能+”的积极探索实践,也为工业生产带来革命性的变化。” 

  • EIIR 的发展将是一个循序渐进的过程,将主要分三个阶段——

  • 前期。EIIR 和人类共处在同一个生产环境下,人机协同是 EIIR 需要重点解决的问题。

  • 中期。在新技术的赋能下,EIIR的人机交互水平提高,人机协作更加高效智能。但在这个阶段,EIIR 本质上还是附属于人类的智能机器。

后期。EIIR 的智能化程度越来越高,能够独立完成任务,人类逐渐淡出生产环境,“无人工厂”将得以实现。

这也将会是一个漫长的过程,但技术已经点亮了胜利的火焰。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/ZYejd0YA3l17utXI.html#comments Tue, 25 Jun 2024 10:51:00 +0800
ICRA 2024 大会主席王志东谈具身智能:中国有超越世界的一天丨具身智能十人谈 //m.drvow.com/category/robot/4D6uwQPiq8sgakFy.html 随着人工智能技术的飞速发展,具身智能作为其重要的分支,正逐渐成为科技界关注的焦点。雷峰网特此推出"具身智能十人谈"系列文章,旨在深入探讨这一领域的前沿动态、技术挑战和未来趋势,为我们的读者提供深度的行业洞察和思考。


作为该系列的开篇之作,我们有幸邀请到了ICRA 2024大会主席、机器人学领域的杰出专家王志东教授,分享他对具身智能崛起之路的深刻见解。王教授不仅回顾了机器人学的发展历程,更特别强调了中国在这一领域的快速崛起,以及技术融合如何推动行业的创新和健康发展。


我们希望通过"具身智能十人谈"系列,搭建一个开放、多元的交流平台,汇聚来自学术界、产业界不同视角的声音,共同推动具身智能领域的进步。同时,我们也非常高兴地预告,"具身智能十人谈"系列的第二篇文章将带来联想集团CTO芮勇博士的精彩观点。芮博士作为人工智能领域的资深专家,将从企业实践的角度,为我们解读具身智能在产业应用中的机遇与挑战,敬请期待。

作者丨饶舒玮

编辑丨岑峰

ICRA 2024 的举办地点在日本横滨,距大会主席王志东所工作的千叶工业大学大约1小时车程。这短短的距离,凝聚了多年来他在机器人学领域的不懈追求和深厚积累。

面对规模超过七千人的盛会,王志东和他的团队前后花费了两年多的时间来准备。在大会期间,他与同样担任过 ICRA 或者其姊妹会议 IROS 大会主席的老朋友们——包括南方科技大学的孟庆虎教授、张宏教授、香港中文大学的刘云辉教授、香港科技大学(广州)的马书根教授、德国汉堡大学的张建伟教授等人得以相见。一起吃饭时,王志东所谈的第一个感受就是“累坏了”,而朋友们则是恭喜他,因为“你终于上岸了”。

也正因为在组织大会上花费了大量精力,王志东在采访中谦逊地表示自己没能及时关注到日新月异的行业变化。尽管如此,凭借着深耕领域数十年的经验,王志东往往能一眼看出一些热潮之下的本质,并对其始终保持“技术至上”的务实态度。“不要光顾着赶潮流,要真正把技术做扎实做好。”这是王志东对于整个行业向前健康发展的建议。

1989年,王志东来到日本东北大学开始他的硕士学习,1992年是他的博士生涯的开始。同一年,日本“第五代计算机”项目正式宣告失败,日本 AI 行业的辉煌时代正式落幕。从日本早稻田大学加藤一郎教授团队研发出世界上第一个人形机器人,到“五代机”这一持续数年、耗资巨大的项目流产,行业急转直下的境况与决策失误、方向选择不无关系。

而此后数年,日本国内对于深度学习等前沿技术不够开放的态度,更是让其 AI 行业再难有泉涌式的爆发热度。或许正因为是日本 AI 行业浮沉的旁观者,王志东对于方向有更深刻的理解。也许光有技术并不是全部,找准大方向,才是事半功倍的选择。

如今,随着全球人工智能的发展进入一个新的阶段,机器人领域也迎来了新一轮的井喷。

王志东将 ICRA 大会这些年人数增长归因于整个行业的蓬勃发展。机器人行业不断的增长,研究领域的不断扩大,还有人工智能的出现,这方面使得这一领域加入了很多新人。

其中,奋起直追的中国在这一领域已经成为不容忽视的存在。王志东很明显地感受到,近些年,中国在机器人领域和AI领域的影响力肉眼可见地提升了。相较于往年,王志东惊喜地发现在大会上、顶刊里、展会上都能看到越来越多中国面孔的出现。在今年的 ICRA ,中国团队的参会人数更是创了新高。作为同胞,王志东希望能将 ICRA 大会办成一个连接中国和世界的桥梁。

谈及我们所关注的具身智能,王志东教授对未来充满了期待。他认为,具身智能是机器人学未来发展的关键方向之一,它涉及到机器人本体设计、控制和系统集成等多个方面。尽管目前人形机器人尚未达到如人类般自由行动的水平,但他相信,随着技术的不断进步,具身智能将为机器人技术带来革命性的突破。

在这个春意盎然的季节,在 ICRA 2024 的大会现场,我们有幸与王志东教授进行了一次深入的对话,探求他对于具身智能、机器人领域和未来技术趋势的思考。


谈具身智能:在时代风口把握方向

AI科技评论:对于现在讨论度很高的具身智能,您怎么看待这股热潮?

王志东:具身智能现在热度很高,但我认为如果机器人本体做得不够好,那么这个瓶颈就在那儿了,即使有智能层面的加成,也还是没办法实现突破性的进展。

对于具身智能,结合这些年的研究趋势,我有两点思考:

第一个是,其实 AI 出来的时候,ChatGPT 也好还是别的也好,它是找到一个  application 作为落点,让大家比较容易知道,其实所谓的系统模型很早就开始做了,是已经做到一定程度了才有了重大进展。

然后这个行业跟风涌进来了几百个公司,但一年之后这些公司百分之八十、九十都不存在了,这个说明什么?说明怎么运用好这个技术才是关键,有哪些东西能真正延续下去,这个才是我们需要思考的大模型的真正意义。

从我参加各种各样的论坛经验来看,发展就是不断寻找道路的过程。现在大家都在思考如何将大语言模型和机器人融合,其中机器人的运动控制是个挑战。我在这次 ICRA 2024 会议里已经听到有一些新的想法在冒头了,估计两三年肯定又有一套新的东西出来了。

第二个就是机器人的控制问题。具身是 embodied,顾名思义,和身体相结合的东西。机器人的体型是高是矮,动作设计都不尽相同,这些都和整体的控制相关。

在方面,其实有很多东西可以做。就像波士顿动力所展示的产品视频一样,看起来可能没什么,但背后有很高的技术含量,至少以国内现有的水平要做到像他们那样,还有很多工作要做。

但就像我经常和日本学生说的那样,因为中国有人口优势,所以只要继续朝着这一方面努力钻研,会有超越世界的一天,对此我比较有信心。

当下需要注意的是,如何把一项东西研究透,这点很重要,然后就是把握好机器人领域的方向性。如果把目标定为“超过 Boston Dynamics ”,那这样的想法只会让你成为另外一个 Boston Dynamics。这个行业最终要往哪个方向走?怎么做得更好?这是需要思考的问题。

AI科技评论:相较于机器人本体,ICRA 2024 大会会更侧重于对机器人智能的研究吗?现在行业的目光都聚焦在哪些方向?

王志东:从会议收录的论文来看,机器人学习与智能这一方向确实是最多人关注的。其中可以提炼出三个 keywords——医疗、机器人的作业和导航。这些方向在如今大热的汽车自动驾驶或者是别的方面都能体现出来。

但是像人形机器人,大家对它的想象中还停留在和机器人对下象棋,可这不是一个目标,这只是一个基准。我的夫人有时候会和我说,你赶紧设计一个能和我爸聊天的机器人,这就是一个助老助残机器人的方向,但这个产业能不能形成,还有很多因素影响,比如系统控制的技术能不能达到设想的水平。

据我对 ICRA 大会的观察,现在大家都在关注,怎么把人工智能领域的新方法运用在机器人上,并对其进行改造发展,我觉得这是很大的尝试。有人说这不算创新,我不认为会是这样。所有的行业都是通过把别的领域的东西拿过来,通过改造发展才成为了自己的东西。

我觉得最大的方向不在于怎么提高智能,而是如何把现在人工智能的好模型、好的方向性拿到机器人这个领域里头,如何在实际场景中真正应用起来,把它能做到就像是一个新的方向性,新的产业出来,我个人感觉这是这个行业最大的挑战。这就是我们所讲的具身智能。因为我的研究的方向主要是机器人和人之间的协调。在我看来,在机器人和人之间的协调是很重要的东西。就像讲到蚂蚁,很简单的智能,但可以做很多事。现在人工智能这些系统不断的增加,对我们有很大的帮助。所以现在大家都很努力地想把这些东西拿出来,我觉得这是目前行业最大的一个方向性。

AI科技评论:您怎么看待具身智能跟 AGI 之间的关系,你们机器人领域会谈 AGI 这个事吗?

王志东:通用人工智能的话,我相信它也是分开来看的,并不是说将来全人类全部适用一个通用的大脑,对不对?特别是搞研究的人,也有存在不同的方向性或者不同的特点。我的一些研究人工智能的朋友,他们也不是除了人工智能之外的事都不关注,他们也在不断询问如何实现实际应用。

其次,从机器人厂商出展的情况来看也可以了解到,虽然他们没有必须线下参加的必要,但他们还是来了,为什么呢?因为这是机器人领域的顶会,他们可以借此机会了解到很多领域内的发展趋势。举个例子,小孩走路的老摔或者拿东西老倒,但人长大后现在不倒了。这学习的实质,这其中的逻辑,其实对人工智能是很大的一个方向。对于机器人厂商而言,他们也会不断和这方面接触,所以这方面的融合是肯定存在的。

所以,并不是说研究人工智能和研究机器人完全是分开的两拨人。更何况,机器人内里有很多互相嵌入的东西,没有办法完全独立开来,包括 planning 类的东西。

AI科技评论:learning 等于 intelligence 吗?

王志东:并不是。因为我是研究机器人抓取手这一方面的,我们在研究的时候就发现,对在确定位置上的物体,机器人是可以很好做到抓取的动作,但是如果位置不确定不精准,对于机器人就很难实现这个动作。可人能在物体还没到固定位置的时候,就预判其动线,在有不确定因素的情况下也能实现抓取动作,这是人类很强的一个智能表现,这个动作本身就蕴含了策略的智慧和控制的智慧。

所以智能并不是说一定要通过 AI 或者算出来的才是智能,这些东西也都是智能。从控制上来看,包括走路、拿东西的动作,人的惯用动作都是最省力稳定的,这里面有大学问,是有很多“智能”在里面的。

所以如果说 learning 是 intelligence,这是不对的,但是通过 learning 可以增加 intelligence,可以在 learning 的过程中提高 intelligence 的质量。


人形机器人:一个集成技术试验台

AI科技评论:单就机器人这个领域而言,对于现在人形机器人的研究浪潮,您是怎么看的?

王志东:我认为,要搞好人形机器人比起单纯地做好 vision 或者 ChatGPT 要难得多。因为一个人形机器人集合了很多领域的东西,包括 hardware、control 以及 system integration。怎么能把这些东西都做好,这不是个简单事儿。

我也有了解到一些人形机器人产品,比如国内的 Unitree 就做得很不错,但是要说它完全能够达到和人一样自由自在的动态行动,还有一些距离。就机器人公司来说,我个人观点认为,Boston Dynamics 相较于 Unitree,在控制上会做得更精细。

AI科技评论:像宇树他们把那个机器人成本降到九万九的价格,这个在中国的媒体上也引起了比较多的讨论,您怎么看待硬件成本下降这一情况?

王志东:对于机器人这个领域而言,硬件成本下降是非常重要的内容。我个人觉得,降成本会让更多人参与进这个领域,以后更多人使用,就可以做出更多的平台。人工智能为什么能发展?因为大家都把东西放在 GitHub 上去,谁都可以用了,所以大家都可以不断地把这项技术提升。但硬件你不可能免费共享,对吧?如果能把参与门槛降低,到大家都可以用的程度的话,这自然最好。

英伟达的发展也是如此,他们在过去把 GPU 研究出来,然后利用这个从各方面把 application 积累出来。硬件做得好,做得便宜,用的人多了,发展方向自然也就多了,将来肯定会有突破性进展。

我个人认为,宇树这种产品的出现是一个很好的现象。因为国内也有很多厂家在做人形机器人,不同的水平,就意味着不同的状况,每一款人形机器人之间都是有差异的,技术难度也会不一样,未来对于社会的影响也是不一样的。但是可以预测到的是,越多人做,就越有可能实现行业新的突破口,这是向好的趋势。同时,我也觉得在机器人方面,研究范围可以再扩宽一些,不一定要光盯着人形机器人。

AI科技评论:在 ICRA 2024 上,人形机器人的讨论度如何?

王志东:人形机器人是其中一个很重要的方向,但我个人觉得,这个大会讨论度更高的其实是 learning 和人工智能。如何将最新的人工智能技术、最新的 vision 技术和机器人技术进行融合,这个方向的发展是我觉得最关键的,也是大会最多讨论的。

人形机器人并不是能够创造出新产业的一个方向。但是有关人形机器人的研究会影响到整个机器人行业的 system integration 和 intelligent integration 水平。

比如要做一个人形机器人,这个机械臂要怎么设计?像工业机器人的技术怎么适配到这种体型上,同时还要考虑机器人集成控制的能力。

人形机器人相当于一个万能的集合,包括优化设计和多任务处理能力,就像是个试验台。你把人形机器人做好了,你要做好别的东西就游刃有余很多。

现在有些观点认为,做好了人形机器人,就可以创造出一个完全新的产业,甚至于可以代替汽车的程度。我个人觉得至少现在还看不出来。但如果是让人形机器人实现物流行业的“最后一公里”,实现精准定位的送货上门,这个场景我觉得有可能实现。可是会不会由此产生一个全新的产业,我保持怀疑态度。


寻找产业落地的出路

AI科技评论:我看这次展会波士顿只派代理商过来,但没有实际展出产品,所以有人在讨论是不是波士顿在走下坡路,您是怎么看待的?

王志东:我不这样认为。从开发者的视角来看,其实公司有新的产品,没有必要特意运过来参展,拍个视频在网上展示也是一样的效果。他们现在更大的任务是将技术推广到实际,因为如果没办法投产应用,那么就没办法盈利,结果可能又要面临出售公司的情况。这也是作为一个高科技企业的挑战。

从另一方面来看,这个情况也说明了现在除了参展之外,还有很多方式可以展现产品。所以这次中国很多企业愿意来参展,我非常惊喜。同时需要看见的是,在网上刷屏赚足眼球并不能证明什么,很多东西是要扎扎实实干的。就像 Elon Musk 所宣传的人形机器人目前还没看到真的动作展示,在网上声量却很大,却不一定是真的能做到宣传的效果,说明这个人形机器人其实还是有很多富有挑战性的东西需要解决。

AI科技评论:我还注意到在这次 ICRA 上有很多家庭机器人的研究,您之前也发表过关于深度交互,机器人进入家庭生活这么一个趋势,您感觉今年有一些比较大的 Leap 吗?

王志东:我相信很快就会有。我个人观点现在预估有两个方向能实现快速发展。

第一个是 logistics物流相关的,因为需求太多了。比如 Boston Dynamics 就有在搞这些卡车装载纸箱的自动卸货的系统开发。但是仓储电商的取货过程做得算是比较好了,而装盒这一环节却还没有大的进展。考虑到现在电商对于物流方面的需求,这些支脉的自动化需求量也会非常大。

这个其实是和市场相关的,有 Eco(生态经济)就能够产生价值。所以说为什么 Amazon 很早能够成功?他们在早期就收购了 kiva robot,一个能够载着台子到处跑的机器人,这是革命性的东西,给电商网购行业的发展提供了非常重要的支撑。但却没能带动革命了整个产业,现在还需要人工在环节中。所以现在大家都在强调方向性。因为我是搞辅助机器人的,所以我认为辅助机器人协调这一块如果能发展起来的话,会有很大的价值。

第二个就是刚刚讲到的家庭机器人。对于这个东西,大家关注度都很高。大家会开始想在家庭或者各种情况下怎么进行 planning,怎么进行 manipulation?怎么进行 task ?我听到有一个 workshop 大部分都讲这事,所以看得出大家对这些比较热心。但你说明年就会实现重大进展吗?我不敢打包票,但不远的将来肯定会有发展。

AI科技评论:我注意到日本它有一个 moonshot 登月计划,大会上也围绕着这个计划做很多相关的展览,现在日本的机器人行业是什么样的现状?对于中国机器人行业的发展有何建议?

王志东:这个 moonshot program 最大 project 的 leader 就是我们 ICRA 2024 的Advisory Committee Vice Chair——Toshio Fukuda先生。这个 project 集中了日本很多水平比较高的教授研究员的团队。日本的这个登月计划是给出了一个方向,就是要瞄准我们现在还完全不可能实现的目标,希望多年以后在一些领域有突破性的技术。

因为日本这些年在科技上的投资比较少,做出的成果也比较少,像 ASIMO 这样的机器人研发工作也停了,没有什么新的东西出现,所以 professor Toshio Fukuda比较有紧迫感,他希望在今后十年里头,通过集智聚力在几个技术层面的冲刺,能够把日本机器人领域的研究水平拉上去,提高到一定的水准。

据我观察,国内现在很多研究的方向性很好。人形机器人也是一个很好的方向,但我还没搞清楚它背后的技术难题。做好人形机器人这一块是有意义的,但是在什么时机研究这些比较合适,我还不太清楚。如果能通过这些东西,像日本的登月计划一样,把科技水准提升到一个新阶段,那么对今后发展会有很大的帮助。我的建议是,扩宽研究的着眼点,不一定要完全跟着别人做,不要光顾着赶潮流,要真正把技术做扎实做好。


大会上的中国面孔

AI科技评论:这是 ICRA 第二次在日本举办,这次大会的参与情况如何?作为大会的  general chair,希望举办个什么样的大会?

王志东:ICRA 每三年在亚洲、欧洲、美国轮番举办。ICRA2024是第三次在日本举办的ICRA。前几年的会议大概是 4000 人左右的规模。去年在伦敦的时候,注册参会者规模已经达到 5000 多人,而今年的注册线下参会人数比我们预想的还要多,估计有超过 6500 人,增加了百分之二十,加上在线参会人士,这个规模可能会达到7000。

这些年参会人数增长的原因,我猜测有两个,其一是机器人行业不断的增长,包括有从自动驾驶转行的,有传统做人形机器人、工业机器人的,还有人工智能的出现,使得这一领域加入了很多新人。其二是,我们中国包括参展商、参会师生都增加了很多。从数据来看,去年在伦敦办会的时候,中国参会者大概只有 300 人,今年的中国团队来了有 1100 人左右,人数同比涨了3到4倍。

我希望能将 ICRA 办成一座桥梁,起到连接各国和世界的作用,这是我作为大会主席能想象到的最满足的事了。

AI科技评论:此次大会上, 据您观察中国参赛者表现如何?

王志东:在这次 ICRA 2024 上,中国的论文投稿数排行第一,录取数是第二,稍逊于美国。但就凭我的观察来看,美国所投文章里,中国人作为 first author 的占了不小的数量。我很高兴看到中国的研究实力在国际上肉眼可见地提升了。至少在我个人看来,中国已经成为世界第二大的研究团体,排在美国之后、德国之前。不管是论文数量还是研究水平来说,我觉得国内这一领域的研究已经达到很高的水准,未来很有希望。

就展区来看,这次大会布置有一百四十多个位置,其中中国展商就有很多,可见这个产业发展是非常可期的。相比国内举办的世界机器人大会 WRC,虽然来这里参展的中国展商没有那么多,但至少说明还是有相当一部分的企业有进军国外市场的打算。而且他们所展出的产品做得非常好。

AI科技评论:这次您作为 chair 的身份组织会议,和以前作为嘉宾参会,感受有什么不同?

王志东:从我的感受上,第一,要组织这么大规模的会议太辛苦了,我和团队组织了两年多的时间。我不是第一个组织这个 ICRA 的中国人,这个会还有个姊妹会叫IROS,我有好多中国朋友,他们都以前做过 ICRA 或者 IROS 的 general chair。

比如我刚才讲到的孟庆虎老师,他 2021 年就在西安组织 ICRA,还有港大的席宁老师,港科大的李泽湘老师之前也都分别组办过ICRA。那之外还有香港中文大学的刘云辉老师,现在南科大的张宏老师、香港科技大广州的马书根老师,德国汉堡大学的张建伟,他们也都组织过 IROS,都是我的前辈。当时我和这些朋友一起吃饭,我说自己终于有机会组织这类会议,但已经累坏了,他们开玩笑说你终于上岸了。

第二个最大的感受是,我们所在的行业在不断增长,越来越活跃,中国的水平越来越高。以前我们的文章投进去过不了,现在不仅投进去过了,还过了不少。虽然采用率的数字上没有达到和美国比肩的程度,但中国文章的采用率确实在不断上涨。更值一提的是ICRA2024有12个最佳论文奖项,其中3个最佳论文奖的获奖论文是来自中国大陆的。这是以前没有过的。10个技术方向的最佳论文奖中,华中科大的研究团队获得最佳机构与设计论文,浙大的研究团队获得最佳Vision论文,两项技术最佳论文大奖。2个ICRA最佳会议论文奖中,中科院沈自所的研究团队获得最佳大会学生论文奖。希望这些成绩能激励到更多的老师同学们,在今后创造出更多更好的成果展示在世界舞台。


ICRA 2024 获奖信息详见:https://2024.ieee-icra.org/awards-and-finalists/

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/4D6uwQPiq8sgakFy.html#comments Thu, 30 May 2024 16:06:00 +0800
搭载「自升降全景激光雷达」,追觅X40 Pro Ultra解决低矮空间清洁痛点 //m.drvow.com/category/robot/QIROOSKsxcqueCFm.html 5月22日,追觅科技以“向上”为主题举办扫地机发布会,推出扫地机旗舰新品X40 Pro Ultra,搭载自升降全景激光雷达,为低矮空间清洁带来终极解决方案。

发布会现场,追觅科技扫地机产品经理从四大维度拆解了对于优质扫地机的定义。而此次旗舰新品——追觅X40 Pro Ultra以其“足够干净,足够省心,更高的健康标准,足够聪明”,全面满足了消费者对家居清洁的更高需求。

在清洁力方面,追觅X40 Pro Ultra凭借自升降全景激光雷达和仿生“双”机械臂技术,在边角及低矮空间的清洁上实现了双重突破。并且,追觅X40 Pro Ultra凭借13000Pa的超强吸力领先行业,家庭常见的各类猫砂、狗粮、瓜子均能一遍吸净。拖地方面,通过边刷、滚刷与拖布的三重升降设计,追觅X40 Pro Ultra实现了“干扫不沾水、湿拖无和泥”。

具体功能上,追觅X40 Pro Ultra实现了自动洗抹布、自动集尘、自动上下水、自动添加清洁液、自动热风烘干抹布等功能,创新推出的主动式基站自清洁2.0系统,配备了全球首创的“主动式双刮洗臂”,可使拖布转边的同时带动底盘刮洗臂转动,在洗拖布的同时刮洗基站底部清洗盘,盘内不会藏污纳垢。基站自清洁全程无需人力介入,进一步解放用户的双手。

针对健康除菌这一痛点,追觅X40 Pro Ultra通过引入业内领先的全链路除菌系统,确保清洁过程中的每一个环节都充分考虑用户的健康需求,从清水箱中的银离子清水到带有除菌清洁液的拖布,再到45℃热风烘干抹布和UV紫外线灯30分钟持续照射,保证清洁的每一步都在除菌范围内。追觅X40 Pro Ultra配备了银离子和活性炭除臭的尘袋,进一步防止细菌和异味的产生,最终实现99.99%全链路有效除菌,确保家庭环境和机身的整洁健康。

此外,智能化方面,追觅X40 Pro Ultra能够全局规划清洁路线,避免碰撞和重复清扫。同时,其内嵌了DreameGPT大语言模型,用户可以通过对话与扫地机交互。亦或通过手机APP的操作,用户还可以设置扫地机的工作模式。此外,其宠物关爱模式2.0可以智能识别并避开宠物,确保清扫过程顺畅,同时不打扰到家中爱宠。

全球首创自升降全景激光雷达,破解低矮死角清洁难题

根据追觅用户洞察部门的调研,占据家庭10%空间的床底、沙发底、茶几底部等低矮死角,依然是一大清洁难题。

为此,追觅科技自研自升降全景激光雷达,为低矮死角的清洁带来了终极解决方案。当扫地机器人在开阔区域清洁作业时,升起的激光雷达会通过LDS激光雷达导航感知,保证了扫地机器人感知外界环境的精度,不仅能全景无死角快速建图,还能对空间的大小以及家具的高度进行测量,从而智能判断是否进入家具底部。

扫地机器人识别到床底、沙发底、柜底等低矮空间后,激光雷达将自动下降,将机身降低至超薄的8.8cm;基于追觅首创的低矮区域Vslam导航技术,扫地机器人就能像“特种兵”般在黑暗的低矮环境下灵活穿行,将隐藏在死角的垃圾彻底清洁。

这一方案实现了家庭场景下,10%低矮空间+90%日常场景的全覆盖,大大提升了清洁场景的覆盖率,达到了开阔空间+低矮空间清洁率均为100%的效果。

从扫地机导航技术发展历程来看,先后经历了随机碰撞、陀螺仪导航、视觉VSLAM导航、LDS激光导航等阶段。此次追觅科技搭载全球首创自升降全景激光雷达的扫地机器人X40 Pro Ultra,破解了机身高度与导航避障精度二选一的行业级困境,将扫地机器人行业引导进入了导航5.0时代。

追觅Dreame Sage算法框架首次公开 打造扫地机器人极致智能体验

高速数字马达和智能算法是追觅科技的“心脏”和“大脑”技术,也是追觅科技领先行业的核心竞争力。在此次扫地机发布会上,追觅科技首次对于其算法技术框架进行公开阐释,从感知、决策、交互三大方面,介绍追觅扫地机器人为了达到极致的智能体验所做的一系列设计。

感知是扫地机器人智能化的核心基础。自2021年起,追觅科技便推出了RGB+结构光融合的感知避障系统,并在每年进行不断升级。此次发布的新品X40 Pro Ultra搭载了LDS + 双目双线结构光3D立体避障系统,位居行业前列。经过三年的数据积累,追觅科技已能够识别家庭中140多种常见障碍物。

此外,追觅科技引入了自动驾驶行业常用的BEV融合感知方法,让扫地机拥有了比肩自动驾驶的避障体验。追觅科技扫地机算法工程师表示,海量的数据、快速迭代的AI模型、高精度、高频率传感器配合领先的融合感知算法,让追觅扫地机器人在避障性能上领先于其他行业玩家。

针对不同的清洁场景,追觅科技研发了Dreame Sage Hybrid Brain决策控制网络。无论是避障、窄通道还是动态障碍物,扫地机都能自适应地调整行为。诸如容易撞击的地方,几次清扫后会自动减速,避免伤害家具;容易困住的地方会自动调整避障策略。针对用户家中的特殊环境,扫地机会自动推荐设置相应的地图元素,更好地完成清洁任务。

在交互方面,2022年9月,追觅科技发布了“你好追觅”自然语言交互系统,并持续优化。2024年,追觅科技将DreameGPT大模型融合进“你好追觅”交互系统,面对用户模糊或复杂的指令,也能智能化地理解和执行任务,真正成为家庭中的智能帮手。

据悉,2023年,追觅科技扫地机器人全球销量超过240万台,同比增长300%。在德国市场,追觅扫地机连续8个月市占第一,2024年1-4月整体市占37.9%,高端市场占比达50.4%;中国市场,追觅扫地机成功地引领了行业高端化趋势,并以32.9%的零售量份额,位列5000元以上高端清洁电器品牌第一。

追觅扫地机产品线负责人孟佳表示,追觅科技结合消费者对于清洁的各种诉求和期待,进行多方向的预研探索。追觅科技将持续革新扫地机的行业标准,不断以领先行业的技术和高品质的产品给消费者带来更好的清洁体验。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/QIROOSKsxcqueCFm.html#comments Thu, 23 May 2024 17:55:00 +0800
专访大象机器人CEO宋君毅:从机械臂到轮式人形机器人,差异化才能突围 //m.drvow.com/category/robot/MURSymytXxqXTFeL.html

作者|吴华秀

编辑|高秀松


“人的一生只有3万多天,我希望能在有限的时间里做出一些服务更多人的产品,而机器人是承载这一愿望的最佳载体。”大象机器人创始人宋君毅坦言。

2016年,协作机器人赛道热度正盛,为机器人市场带来新的增长机会。那时刚工作没多久的宋君毅,凭借着初生牛犊不怕虎的劲,瞄准资本风口和市场时机,毅然决定创业,于当年8月,与前同事伍祁林一同创办了大象机器人,正式进军协作机器人赛道。

此后,从早期工业机械臂,到轻量型机械臂、机器宠物,再到人形机器人,在这些能充分发挥对机器人想象力的领域,宋君毅始终在寻找着业务的发力点,谋求企业的生存之道。

功夫不负有心人,宋君毅在摸索中找到了能够立命的产品。

2020年,推出的桌面级六轴机械臂 myCobot,成功让大象机器人实现扭亏为盈。同一时期,主打家庭陪伴的仿生机器人Mars Cat、Meta Cat系列也因满足用户需求而取得了不错的市场反馈。随即,大象机器人开始步入正轨,实现可持续发展。

回望来时路,由最早的埋首技术自研,到对业务商业化路径的探索,期间宋君毅虽然也有过东奔西撞,但他是个懂得转舵的人。几个选择间,大象机器人也因而锚定了自己的去路。

从0到1,布局协作机械臂 

2015年,宋君毅毕业于墨尔本大学机械学院机电一体化专业,在澳洲担任一名算法工程师。出于对机器人的喜爱,宋君毅工作之余还会在知乎上解答机器人相关问题。

一次偶然的机会,深圳一家机器人公司在宋君毅的帖子下留言,并建立了联系。一来二去,该公司向宋君毅抛出了橄榄枝,不久后宋君毅便辞职回国,加入这家公司,任算法工程师。

当时,机器人产业中协作机械臂日渐红火。相比于传统工业机械臂,协作机械臂因其安全性能佳,灵活度高等特点,广泛应用于汽车、3C电子、医疗等领域,市场机遇广阔。此外,国家也先后出台系列扶持政策,为机器人产业提供帮助。2015年5月,国务院发布的《中国制造2025》中,明确将工业机器人列为制造升级方向的重中之重。

以往协作机械臂主要以外资厂商 Universal Robotics(优傲机器人)、Rethink为主,赛道上外资巨头林立。但很快,国内企业迅速铺开跟上。2014至2016年间,国产协作机器人节卡、遨博、珞石等创业公司纷纷成立,积极布局。

2016年,优必选在春晚上名声大噪,一时间风光无两。随后,优必选这辆马车拉动机器人赛道快速飞转,资本热钱源源不断涌入,热度扶摇直上。彼时,市场、政策、资本的三管齐下,机器人创业公司如雨后春笋般涌现。

嗅到了时机的成熟,不满足于现状的宋君毅决定索性放手一搏,成立大象机器人以专攻工业协作机械臂。

但理想很丰满,现实很骨感。自创业第一天起,大象机器人团队只有宋君毅与伍祁林两人。不过好在有硬件孵化机构HAX的种子轮融资,两人在华强北一间很小的房间里坚持了一年多。

出于对技术的追求和创客思维,宋君毅想尝试技术自研。早在读书阶段,宋君毅便热衷于自己动手,一度自行采购电机、组装机械臂,期间储备了不少实操经验。此外,还是研究生的他,就曾与博世一起研制颇有难度的自主导航AGV项目和平衡球项目。

2016至2019年,宋君毅与伍祁林开始尝试自研,从电机模组、减速机、刹车、编码器到驱动等核心零部件,一切从零开始。

技术自研谈何容易,难题很快就浮现了出来。一方面,全自研会导致整个生产链条拉得非常长,技术难度高且资金耗费巨大,这对一个小创业团队而言难以承受;

“当时接了有上千万元的项目,但真正只能做个三四百万元。”宋君毅坦言。

另一方面,是如今回想起来仍让宋君毅心有余悸、颇为担心的问题——技术自研容易让工程师无意识陷入自嗨中,工程师会理所当然地认为自己所做的产品会有人买单,从而忽略了用户的实际需求与真实痛点。

幸运的是,创业的前三年,营收虽然少,但靠着小作坊式日复一日的努力,大象机器人形势慢慢变好。只是,持续不断投入的大量资金与人力成本,迟迟未能转化为更高的收益产出,表现只是差强人意。

宋君毅知道大象机器人正在十字路口处,向前是客户,向后是供应商,向上是投资人,向下是员工,责任重重。更重要的是,得要做出成熟的产品,为团队带来更高的营收。

轻量级与陪伴类,以差异化突围

转折点发生在2020年1月。 

还有几天就要过春节了,但突如其来的疫情导致项目交付困难,货款短时间内无法收回,一下子将大象机器人推进了绝境。

彼时,公司账上仅剩的资金只能维持团队正常运转到3月份。为此,大象机器人开始瘦身过冬,团队只留下了数人,同时将办公室搬至了一个不足百平米的小地方。而作为公司的创始人,宋君毅和合伙人伍祁林也以个人名义向平台、股东等筹集资金。一番操作下,大象机器人挺过了这场寒冬。

困境之中,求变是必然。创客思维下,研发者容易陷入对产品极致的追求中,往往忽略了商业化问题。理想主义与科技主义,在当下对宋君毅来说是一味不合时宜的药,只有先活下来,才会有翻盘的机会。

宋君毅痛定思痛,开始将商业化摆在首位。对市场和竞品作了详细分析后,宋君毅认为只有差异化的路径才能让团队立于不败之地,于是对产品内容进行排列组合,试图寻找具有差异化的业务。

工业机械臂市场竞争激烈,巨头林立,粥少僧多,且 ROI 较低,对一个小规模的初创企业而言并不友好。于是,宋君毅果断放弃原先重注工业机械臂的路线,采用轻维护模式,不再直接给工厂供货,而是交由集成商运营。

此时,宋君毅面临着新的抉择——要么专攻价格昂贵的高端市场,要么主打性价比的大众区间。考虑到产品售价高固然盈利多,但也面临着销量少、回款慢的难题,综合考虑下,宋君毅相信主打性价比的机械臂会是一片蓝海。经过了8个月的开发,大象机器人把其以往的工业协作机械臂C系列做了大量的简配、缩小与重构,按照同一个外观进行了鲜有人尝试的桌面级设计,尝试让每个人都可以拥有一款机械臂。

2020年11月,大象机器人研制的全球首款轻量型桌面级六轴机械臂 myCobot 正式上线,售价四千元,也是全球第一款千元级协作机器人。 

不得不说,宋君毅的眼光确实毒辣,仅凭一款产品 myCobot,大象机器人当月就实现了净利润,挖到了真正意义上的第一桶金。随后的几年中,他们又扩展了从千元级到万元级的数十款轻量级机械臂产品,直到现在,这一价位也鲜有单一竞品能与之抗衡。

如今,大象机器人产品场景主要面向科研教育、商用和工业,其中工业占比相对较少。 

除了轻量型机械臂,宋君毅还推出了主打家庭陪伴的机器宠物系列。不同于市面上的机器宠物,大象机器人团队选取的是品种宠物,核心是以电机驱动,让机器宠物更具活力与互动性。  

宋君毅认为,狭义上的机器人一般分为 仿人机器人和仿生机器人。仿人机器人是机械臂、双臂、全人形的机器人。  仿生机器人则是不同的仿生动物、宠物。

机器宠物的产品更迭,一共经历了三次。

第一次,是2020年推出的 Mars Cat,一只能够灵活走动的机器猫咪。当市场反馈来到宋君毅这里时,他发现比起让猫咪四处走动,人们更需要的是一只能够完全围绕着自己的猫咪,满足人们的情感陪伴需求。

随后大象机器人推出了第二款产品——带有柔软毛发、但腿脚无法行走的米塔猫 Meta Cat。对此,宋君毅曾于2022年表示,“陪伴机器人的核心还在于陪伴本身,移动并非关键。”无法像一代那样走动的米塔猫,因乖巧模样赢得了消费者者喜爱,人们可以始终抱着柔顺舒适的米塔猫。

第三次,部分客户希望能与机器猫进行语音交互,感受猫咪心跳声,于是大象机器人又相应地推出了最新一款“会说话的猫咪”。

除了猫咪,团队近期还推出了机器狗和机器熊猫,极大丰富了机器宠物的品种。

由于时刻关注消费者的需求与感受,且及时调整机器宠物的样式与功能,机器宠物系列赢得不错的市场口碑。其中,产品以出口较多,海外老年人是重要群体。

“很多小孩和老人不方便养育真猫,一只可爱、能互动的机器猫咪能为他们带来温暖,驱赶孤独。”宋君毅解释道。

All in 人形,重在性价比 

随着国内越来越多玩家躬身入局协作机器人,国产替代趋势显著,崛起的国产巨头们占了市场份额大头。CGII数据显示,2022年中国协作机器人市场 TOP10 厂商中,国产厂商占据 8 个席位,从销量层面看国产品牌已占据主导地位。其中前三甲遨博智能、节卡机器人、艾利特机器人占据超过50%的市场份额。

宋君毅认为,工业协作机器人已经走到了最终局,功能几乎已经基本开发完毕,用户对产品功能没有更新的期待,此时价格成了主要的衡量因素。 

而人形机器人赛道的比拼,随着特斯拉推出的 Optimus 在2022年带来的第一道春雷,才刚拉开序幕。中国电子学会数据显示,到2030年,中国人形机器人市场规模有望达约8700亿元。

定位的正向变化带来的是业务场景的无限拓张,足够大的市场才能讲故事。

这一回,宋君毅决定要押注人形机器人。当下大象机器人的产品布局主要分为三部分,轻量级机械臂好比前菜,而甜品则是机器宠物系列。至于主菜,正是当下热议话题的主角——人形机器人。

从2016年成立至今,大象机器人的发展历程大致上可以划分为三个阶段:

  • 2016年至2019年,主要是技术方面做核心零部件的自研;

  • 2020年至2023年,主做轻量型机械臂,维护工业机械臂;研制机器宠物系列产品;

  • 2024年,开始 all in 人形机器人;

人形机器人能够通过配置双臂,解决原先单臂的痛点。其中最重要的是,双臂能支持装视觉,能有效解决单臂的瓶颈。以往的单臂缺乏视觉,需要系统经营商组装单臂产品,工序复杂。单臂无法独立完成哪怕是开水瓶盖的任务。现在人形机器人虽然相对更麻烦,但集成化更高,并非一个半成品,系统经营商工作量会少很多。

此外,协作机械臂单臂并不会应用于所有行业,配给工厂的系统集成商才是单臂的最佳客户。只有双臂才有可能涵盖更多场景,如在商场里运用起来。这一大原因在于编程的门槛,终端用户难以全都使用单臂,相比之下,双臂会更简单、易操作。

作为一个从工业机械臂小周期里存活下来的创业公司,此时再度转向下一个新赛道,大象机器人手里握着几个有利砝码。

首先,产品方面继续追求极致的性价比,先实现降价,再持续开发功能。宋君毅认为要想活到最终局,得把成本和价格打下来,让客户买得起。凭借着大象机器人在过去四五年里淬炼下来的技术自研、供应链管理及成本控制等综合能力,在单臂四五千售价的基础上,双臂价格也能控制在数万元区间。

其次,需求维度洞察用户痛点,能够有效“对症下药”。得益于过往与客户的沟通联系,始终走在调研一线的大象机器人能最大程度地获悉客户要求,并及时完善与改进。例如,养老院购买协作机械臂给老年人喂饭时,以往的单臂操作容易将饭菜撒到身上,后来改成双臂,一只手接盘子,另一只手喂饭,能够完美解决问题。

2022年8月,在人形机器人尚未火热之前,大象机器人就推出了千元级双臂半人形机器人myBuddy,此时比马斯克在特斯拉 AI 日推出的人形机器人早了2个月。 

2023年,大象机器人推出了万元级人形机器人 Mercury。Mercury系列有三款产品,其中 Mercury X1 采用的是轮式人形机器人,并非当下最火热的双足人形。

谈及双足人形的设计,宋君毅认为能率先实现批量交付的是轮式机器人。当前双足人形机器人续航能力较差,轮式人形机器人续航是人形的三倍。更重要的是,人形的价格较高,预计是轮式机器人终端售价的2.5倍,且稳定性暂时还达不到客户需求。

据此,宋君毅认为,配置双臂的轮式人形机器人或将更快实现商业化落地,“别人或许会觉得轮式的土,但土的不一定卖得不好,土的反而会卖得更好一些。”

在宋君毅看来,人形机器人的核心更在于手和眼的配合,而不在于腿。手和眼可以实现具体的应用,例如给老年人喂饭、清扫马桶、调制奶茶与咖啡、提供按摩。也恰恰是终端应用的特性,反过来也决定了大象机器人目前做的是小b生意。但宋君毅相信,三五年后,当大象的人形机器人产品走量后,会有大b客户愿意尝试。

宋君毅表示,大象机器人将会基于用户需求实现产品迭代,最终推动人形机器人走向更广阔的商业化落地,讲好机器人故事。

后记

宋君毅回忆起这一路走来的创业历程,如数家珍,“有些小发明或产品或许现在听起来有些幼稚,但我们真的觉得很有趣。”

虽然喜欢研究新玩意,但最让宋君毅担心的,莫过于发布的新品无人问津。为了让产品实现差异化与需求满足的平衡点,大象机器人每年都会推出数种新品,更迭速度快,经常给市场带来新体验。

谈及大象机器人实现扭亏转盈的时刻,宋君毅表示,“一家企业亏200万元和亏100万元,对于创始人来说差异并不大,因为他可能感知不到企业在亏损。”

但亏50万元与赚50万元,这两者差异就很明显了。因为一旦企业真正赚了第一桶金,就能触摸到企业的脉搏,知道企业应该怎么走才能活下来。

现在,带着大象机器人走过八年沉伏的宋君毅,已经能够触摸到企业跳动的脉搏了。

雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/MURSymytXxqXTFeL.html#comments Thu, 23 May 2024 15:42:00 +0800
ICRA 2024:「具身智能」热度飙升,「学习」成机器人行业共识 //m.drvow.com/category/robot/npIBv1229GedH30C.html 作者:赖文昕

编辑:陈彩娴

过去一周(5.13-5.17),国际顶级机器人学术会议 ICRA(IEEE International Conference on Robotics and Automation)在日本横滨举办吸引了全球机器人领域的研究者、企业及学生,共同探讨机器人领域最新的科学进展和产业成果。

今年 ICRA 大会的主题设定为「CONNECT+」。

大会最终截稿日期是 2023 年的 10 月 21 日,收到 3937 篇论文,与去年的 3125 篇相比,提交的论文数量涨了约 25.88%;经过一个月审核,最终接收 1765 篇论文,论文接收率为 45%,比去年略涨 2%,论文主题覆盖了如双足机器人、人体检测和跟踪、人机交互、机器人学习、安全和监控机器人系统、3D重建、无人机系统、人工智能、农业自动化、行为树和大数据分析等等领域。

除论文数量的显著增加外,本届 ICRA 还有 119 家企业参与展会,吸引了美国亚马逊、波士顿动力,德国库卡,日本本田研究所,以及中国宇树科技、非夕科技、逐际动力、艾欧智能、求之科技、方舟无限等等一众机器人团队的参会。

换言之,ICRA 2024 不仅展现了学术界的深度交流,更象征着全球工业领域机器人团队之间的一场巅峰对决。

在 ICRA 2024 的展会现场,参会者可以看到这样的奇观:

机器狗、轮式机器人、双足机器人等等一众「机器生命」在会场「自由走动」,参会者们聚集在它们身边,俨然一场赛博朋克版的迪士尼花车巡游。

展会中大部分企业都选择展示 live demo,且与往届相比,demo 质量越来越高。

比如,逐际动力这款双足机器人 P1,把在森林里怎么打都不倒的经典场景,在 ICRA 2024 现场再次重现。

「若干年前机器人会议上的机器人都只能打个招呼或者站着不动,这次出现的机器狗都能动、还能踹,说明鲁棒性非常高。」清华大学交叉信息学院助理教授、具身智能实验室主任及星海图的联创许华哲告诉 AI 科技评论。

此外,人形机器人也成为 ICRA 的亮点,如中国企业宇树科技在大会期间发布的 9.9 万人形机器人引起了国内外参会者的热烈讨论。不难看出,人形机器人成为机器人领域的一个新兴方向,尤其在大模型风潮下与具身智能一同崛起。

一个趋势正在发生:ICRA 上关于机器人的内容已经从以传统的控制为主,到关注机器人的学习、操作等。国内外的机器人研究领域都在关注同一个问题:如何让机器人更智能?

但与此同时,AI 科技评论也关注到,虽然大模型落地端侧(如手机、机器人)是过去一年 AGI 讨论中的重要主题之一,ICRA 2024 大会现场的「大模型踪影」却寥寥无几。一方面,这是因为机器人的行业特点,「有自己的节奏」;另一方面,ICRA 聚焦在学术探讨上,大模型在论文演讲中的比重远远超过展区成果展示。


中国机器人企业正在崛起

迈入2024年后,人形机器人领域频频传出重大进展:

特斯拉发布了更新版的擎天柱机器人行走视频,其行走的稳定性和自信心态均有显著提高,尤其在转弯时的表现也相当出色;

人形机器人初创公司 FigureAI 宣布获得了包括亚马逊创始人贝索斯、英伟达、微软以及 OpenAI 在内的投资,总额达6.75亿美元;

英伟达于3月19日举办的2024年度GTC大会上,展出25款人形和机械臂机器人。

在 ICRA 2024 的机器人方阵中,最炫酷吸睛的绝对是与人类最相似的人形机器人。

值得关注的是,这次参会的双足人形机器人企业主要是中国公司。

最受瞩目的产品之一是宇树科技的 G1 人形机器人。G1 以最低9.9万元的售价,在机器人业内扔下一枚超高性价比的炸弹。

与之相比,特斯拉的擎天柱机器人给出的目标价位为2.5万美元,折合人民币约18万元。

傅立叶智能带来的通用人形机器人 GR-1 高165厘米,重55公斤,最高行走速度为每小时5公里。使用电动执行器的 GR-1 本体拥有40个自由度,可承受近50公斤的重量。 

乐聚机器人推出的「夸父(KUAVO)」人形机器人则是一款全尺寸高动态双足仿人形机器人,最大行走速度可达5km/h,跳跃高度可达20cm。

「国内公司在硬件方面整体上优于国外,性价比较高,这是得益于国内的供应链优势。」方舟无限创始人张鑫亮向 AI 科技评论分析中国企业崛起的原因。另外,中国公司还展出了很多机器人零部件和整体解决方案。

那为什么人形机器人会成为 ICRA 2024 的一大焦点呢?

实际上,电机和机械结构设计已发展多年,硬件早已不是问题。但在没有大模型和 AI 的年代,机器人只能进行简单的动作但无法做出智能决策,要应用传统视觉技术,一个机械臂就足够了。

因此,过去人形机器人可能没有太大的意义,仅仅是硬件产品并没有实际应用。

随着 AI 技术的发展,机器人的能力上限不断被突破。科研和商业探索的深入,也加速了人形机器人时代的到来,使得开发这一形态的产品变得有意义。

「大模型让机器人可以不只是简单动一动,而是有希望做一些智能决策,(以人形)收拾桌面或参与工厂工作。」张鑫亮说。

不难发现,人形机器人是 ICRA 2024 当时无愧的焦点,但从实用性角度出发,其实际场景应用及商业落地,却一直备受争议。

「展会上的人形机器人硬件没问题,能动能走,但在智能化层面来讲,离真的智能化机器人很远。」地平线机器人事业部生态负责人胡春旭告诉 AI 科技评论。

特别是对于双足人形机器人而言,腿上每个关节都需要电机,机身需承受高负载,这使得整体成本变得十分昂贵。

另外,双足行走的控制算法开发难度大,需要大量时间进行迭代。即使上半身的控制算法已经完成,腿部的控制算法也无法简单地迁移过来。

「为了满足科研用户在双足运控算法上越来越强的需求,我们先对点式双足机器人 P1 进行了产品化,这个独特的形态,让大家不需要一上来就做全尺寸人形、几十个自由度的复杂算法研发,并配备丰富的二开接口和服务。」张力介绍到 P1 是逐际动力如何赋能人形机器人研发的定位。

出于以上种种考虑,本次参会的部分日本和欧洲公司也没有涉足这一领域。

清华系的星海图目前同样也没有开展腿部机器人项目的计划。

联创许华哲告诉 AI 科技评论,人形机器人在算法上很有趣,但需要投入大量的时间和精力。

「如果真正想将机器人技术应用到实际场景中,需要能快速产生效益和能力。」他分享道。

本次选择通过日本代理商参会的明星公司波士顿动力也曾困于找不到盈利模式的难题。

两周前,波士顿动力的 CEO Robert Playter 来清华交流,告诉许华哲一定要找到赚钱的方法,否则公司就会被不停买卖。

不过,双足人形机器人的产品市场契合度(PMF)其实并不低。

据参会者们分享,目前专注于足式人形机器人的公司主要面向科研市场,因为它们外形酷似人类,全球大量高校实验室对此非常感兴趣,清华大学就购买了许多人形机器人进行研究。

但若想让机器人技术落地到工厂、家庭或超市等场景,就需要考虑更广泛的商业化途径。兼顾大型市场还是只专注于其中一个领域,这取决于机器人公司的战略选择和目标市场的差异。


具身智能「刚刚」开始

去年,大模型的成功展示了深度学习具有规模效应,即只要有足够优秀的模型和海量数据,其潜力远超过以往,也促使学术界与产业界对实现真正的通用人工智能(AGI)燃起了希望。

在大模型热潮的影响下,一批机器人或者说是具身智能企业如雨后春笋般创立,希望能够开发出能与物理世界进行交互的智能机器人,完成这个极具挑战性的任务。

「大模型技术的爆发与硬件成本的降低表明了软硬件技术都已走向成熟。」许华哲告诉 AI 科技评论,「过去创业者们常说 move bits not boxes,意指改变数字世界比改变物理世界要容易得多。虽然现在的技术尚未完全成熟到可以解决所有问题,但已足以让人看到解决问题的希望,今年已到达一个成熟的转折点,因此吸引了众多公司投身于具身智能领域。」

在 ICRA 2024 的展会现场,「具身智能」成为了每位参会者热议的话题。

地平线机器人事业部生态负责人胡春旭向 AI 科技评论分享了自己的观察:「现在只要涉及机器人与环境交互,与 AI 结合,都要说具身智能,就跟前两年大家都在说人工智能是一样的。」

「无论是科学家、创业者还是学生,大家都在讨论具身智能。」联合创始人兼COO张力也感叹,具身智能的兴起是他本次参会所感受到最显著的趋势,「通用机器人是一个在技术和商业化落地都还没有共识的赛道,但是在这次全球学者和机器人企业聚首一堂的活动上,我能感受到大家逐步从没有共识,到开始进行收敛,这是一个非常好的现象。」

与传统机器人公司相比,「新生代」的具身智能企业最大的区别在于是否采用了人工智能技术。

传统机器人通常被设计来精确地完成特定任务,如工厂零件分拣机器人或家用扫地机器人,虽各有其功能,但其能力相对有限,内部预设的智能算法较为简单。

新一代机器人的目标则更加通用以及「类人」,比如在家中充当保姆,在工厂中扮演工人,灵活响应各种需求。

「比如优必选更强调自身运动,非夕科技强调力控,展会上展示了控制盘子上的球,这些更多体现了机器人本身的运动能力跟对外界的感知、控制能力。」胡春旭认为,「现在的公司讲具身智能,关注重心不是机器人自身的运动能力,更多的是如何跟外界互动,通过视觉识别外部环境后做抓取、放置等灵活的对外交互工作。」

艾欧智能便参与 ICRA 2024 最具有代表性的中国具身智能企业之一,将 AI 技术与机器人领域牢牢融合在一起。

创始成员都来自腾讯、小鹏团队,艾欧智能通过具身数据采集,构建不同应用场景下的基础数据集,为全球人工智能和机器人研发企业和研究机构提供基础场景数据和验证方案。

传统动作捕捉通常使用光笔或摄像头,限制了活动范围,而艾欧智能则采用惯性捕捉方式,不受地形限制,可自由采集数据,更适合日常生活数据采集,在采集数据的同时还不限制人的行动。

而且,除了动作数据外,艾欧智能还采集视觉、触觉和语言信息等多模态数据。

具体而言,艾欧智能使用安装在头盔上的多个相机来获取视觉信息;通过自研数据手套与数据鞋底获取触觉信息;用麦克风记录语言信息;最后混合所有信息进行机器人训练。

艾欧智能告诉 AI 科技评论,目前他们开源的数据集包含50万条剧本式采集数据以及数百个小时的自由采集数据,涉及几十种技能和数百种被操作对象,全部免费提供给社区供科研使用。

地平线机器人同样也是具身智能企业的代表。

去年年末,地平线分拆了 AIoT(物联网)团队,成立地瓜机器人并对外融资,其定位是提供消费级机器人计算解决方案。

目前,地平线机器人正在研发着支持大模型部署的高性能机器人芯片。

在地平线机器人的事业部生态负责人胡春旭看来,具身智能意味着机器人一定会结合多模态大模型去理解周边环境。

「过去机器人的智能化比较差,但这两年机器人的运动能力已经被解决的相对比较好,现在大家都在关注智能化。」胡春旭向 AI 科技评论解释,「提高机器人的智能化水平一定是基于多模态大模型的基座去做,目前虽然没有很明确的落地案例,但这一定是未来趋势,也是我们重点探索和布局的方向。」

胡春旭称,「大模型芯片在机器人厂商中是刚需,关注的企业很多,但现在关键点在于,一是怎么把大模型调教后放在芯片里跑,二是跑下来后,怎么能很好调试服务于场景,让原来的那些基本算法变得更好用。对于我们来讲,现在可能重点放在前面,让大模型在我们芯片跑得更好,说实话本身上限就是硬件芯片的实际能力、物理水平。」

方舟无限同样是一家新兴具身智能企业,是全球首家具身智能领域量产数据采集方案供应商。

「上一代机器人主要依靠视觉智能,语言智能尚未被整合进机器人系统中,人类大脑决策大部分是双手执行,在机器人中可能是视觉智能和语言智能的结合,所以说 GPT 模型可能是推动具身智能发展的一个关键因素。」创始人张鑫亮谈道,「我们之前理解的人形机器人、四足机器人等更多地偏向于控制上的优势,具身智能机器人追求的是让机器人的大脑更完善,这也是我们的目标。」

同为具身智能企业的逐际动力于2023年发布了其首款人形机器人CL-1,并于今年上半年接连公开该款机器人的遥操作及跑步等技术新进展。

「物理世界是围绕人类设计的,人形机器人以类人的形态,更具有通用性和泛化性,将会成为未来落地应用的最佳载体。」张力谈道。

在 ICRA 2024 上,参会者们聊得火热,也出现了如艾欧智能、地平线、逐际动力与方舟无限这类新兴具身智能企业,但具身智能作为一个新热点,距离商业落地仍有不短的距离,核心技术大多掌握在高校手中,因此许多学者也会参与创业。

「与再次成为热点的自动驾驶技术不同,具身智能尚未真正成熟并能实现量产,所以热点更多地集中在学术界而非工业界。」横跨学术与产业的许华哲解释道。


ICRA 洞察:LLM 罕见,电驱主导,学习与操纵成新范式

在端侧大模型中,尽管底层的 LLM 逻辑均为 MOE(混合专家模型),但在手机端和机器人端的落地路径却十分不同。

两者的应用场景与需求都不同,机器人需要自主移动,因此一定会结合多模态大模型去对周边环境做理解和交互(如怎么穿过椅子去抓取桌面上的物体),与不可能自己跟环境交互的手机端相比,机器人加大模型的组合更强调「具身」智能。

然而,与大模型人声鼎沸的现状不同,在 ICRA 2024中,LLM 在机器人领域的应用十分罕见。

张鑫亮发现,ICRA 2024 会议更侧重于机器人控制等硬件领域,软硬件结合的应用在展会上较为罕见。

「除了我们的产品外,我几乎找不到第二家在自主操作方面使用大模型的公司,除了少数做模仿学习和 Aloha 操作的公司。有的公司使用硬件机械臂进行工业抓取,但依然属于传统视觉,结合模型做抓取的公司在展会上并不多见,要么只专注于模型端,要么只专注于硬件端,与会者中似乎只有我们有同时结合软硬件的苗头。」

*Aloha 是2023年由斯坦福大学等机构推出的一个用于双机械手远程操作的低成本开源硬件系统,可以远程操作并完成组装链条、托举乒乓球等多种任务。

LLM 在机器人踪迹难寻的原因之一,便是当前负责软件与硬件研发的团队并未实现融合。

相反,两组人员分别在两个领域进行研发。大模型团队专注于模型开发,从软件层面着手,待软件完善后再着手硬件的开发。

而另一些人则先从硬件开始,再整合大模型。两个方向分别涵盖的决策领域太多,因此尚未有团队能够同时兼顾两者。

「不过现在专注于硬件并向大模型过渡的团队,以及仅专注于软件开发的团队,都在逐步推进融合的过程。在这一背景下,与大模型最紧密相关的机器人领域就是具身智能。」张鑫亮解释道。

机器人产业本身尚未形成一个稳定且盈利的商业模式,同样是 LLM 尚未在机器人领域广泛展开的原因之一。

胡春旭向 AI 科技评论讲道,「从商业层面来讲,大模型公司肯定会评估机器人企业的商业模式落地,但机器人行业距离大规模批量化的落地,还有很长的路要走。」

不过,在 ICRA 2024上,也有观点认为:机器人当前的研究重点更多集中在解决基础层面的功能性问题(low level issues),而非高层次的认知或决策问题(high level issues),后者在某种程度上已经通过大模型得到了解决。

例如,即使大模型能够规划出做饭的步骤,但如果机器人连冰箱门都无法打开,那么这些高级规划便无法实施。

许华哲告诉 AI 科技评论,「大模型并非当前机器人技术发展的瓶颈,其当务之急是解决物理交互和操作的基本问题,为未来更高级的集成和应用打下基础。随着这些基础问题的逐步解决,大模型在机器人领域的集成和应用将变得更加可行和有效。」

ICRA 2024 展现出机器人领域正在经历一场通向具身智能的范式转变,其核心正是学习(Learning)方法和操纵(manipulation)能力的提升。

ICRA 2024抓取与操纵比赛

众多研究人员和公司正在从传统的机器人方法转向具身智能以及基于学习的方法。同时,集中于机器人操纵能力的工作也越来越多。

与后空翻等酷炫动作不同,如开瓶、拾取、触摸等操纵能力可以直接满足人们生活实际需求,因此也越来越受机器人业内人士的重视。

例如,波士顿动力近期推出两款新型机器人,一款是码垛机器人 Stretch,带有吸盘能分拣物体;一款是人形机器人 Atlas。他们发现,传统的机器控制无法解决操纵问题,「学习」才是新的可行方向。

最后,随着电机的快速发展,本届 ICRA 上的电驱机器人以代替传统的液压机器人成为主力军,业内普遍认为,换上电机后,机器人的爆发力与驱动力会更强。


写在最后

不少参会者向 AI 科技评论表示,本届 ICRA 并没有带来太多超出预期的惊喜。

具体而言,尽管具身智能的热度飙升,但代表「智能」与「大脑」的大模型并未在行业中得到广泛应用。

通往 AGI 的路何时能从数字世界逐步扩展到物理世界?大模型的出现能否让机器人真的拥有「智能」? 

ICRA 2024 尚未见分晓,那便让我们拭目以待。


本文雷峰网作者 anna042023 将持续关注AI大模型领域的人事、企业、商业应用以及行业发展趋势,欢迎雷峰网作者添加交流,互通有无。

]]>
机器人 //m.drvow.com/category/robot/npIBv1229GedH30C.html#comments Sat, 18 May 2024 17:55:00 +0800
两大系列六款新品,追觅科技洗地机秀出黑科技 //m.drvow.com/category/robot/OC6axx3iJMMzaYYp.html 5月15日,追觅科技在苏州举办“满分之选”全球新品发布会,共发布了两大系列六款重磅新品,包括H20系列的H20 Pro旋锋版、H20 Ultra旋锋版、H20 Ultra Mix、H20 Ultra Station,以及H30系列的H30 Ultra旋锋版、H30 Ultra Mix。

此次发布的洗地机新品,搭载了包括“主动式0缠毛系统”“100°C沸水自清洁”“5分钟轻音恒温烘干”等行业首创技术,解决了多项困扰洗地机行业多年的技术问题。

业绩增速亮眼,全球市场持续扩张

发布会上,追觅科技洗地机BG负责人胡膑表示,2023年,追觅科技洗地机产品全球销量已超过140万台,同比增长超过100%。其中,在欧洲市场、东南亚市场、北美市场,销售额分别同比增长930%、420%、363%;而在泰国、马来西亚等市场,不仅销售额同比增长迅猛,至2024年Q1,市占率也已位列当地第一。

在国内市场,2023年双11期间,追觅洗地机全渠道销售额突破9亿元,销量超过35万台。据奥维云数据,2024年Q1,追觅洗地机国内线上市场份额达25.2%。同时,爆款产品H20 Ultra还成为中国洗地机新品线上市场份额TOP 1,零售额份额达19.6%。

首创行业多项创新技术,解决用户真实痛点

过去四年,追觅科技在全球洗地机方面的累计授权专利已达到474件,其中发明及新型授权专利达318件。并且,追觅科技相继推出了多项行业首创技术,如热风烘干技术(2022)、260℃正反转热水洗滚刷、180°恒动躺平不降吸技术(2023)等。

这些行业首创技术,助力追觅科技持续打造了多款行业爆款,包括多合一M13Beta、H12 Pro Plus、H20 Ultra等,每一款都为用户重新定义了洗地机清洁新体验。

胡膑认为,技术创新的原动力,是解决用户的需求痛点。从问题倒推解决方法,进而将技术产品化,形成“需求-技术-产品”的业务闭环。

基于此,此次发布会上,追觅科技先后推出了多项行业首创技术。

例如,针对困扰家庭用户的毛发缠绕问题,追觅科技推出了主动式0缠毛技术。该技术通过恒压梳齿,搭配追觅首创瑞士PPA割毛齿刃技术,在“一梳、二割、三吸、四洗”四重措施的加持下,真正实现清洁0缠绕,即使50cm长的头发也能轻松吸入,真正做到“免维护”。

滚刷防缠毛之外,追觅洗地机新品在洗地机滚刷自清洁方面,也取得突破性进展,并将滚刷自清洁的水温标准一举刷新至100°C。该功能可通过底部PTC对水进行加热至100℃,高温热水破坏、溶解滚刷上的污垢,将染色性、油性、粘性顽固污渍彻底清除。

本次亮相的旋锋版系列洗地机,H20 Ultra Mix、H30 Ultra Mix等产品,均已搭载100°C、75°C双模式热水洗滚刷功能,可同时实现沸水深层煮洗、热水除菌净洗。

经南德TÜV实验室权威检测,搭载100°C沸水自清洁技术的追觅洗地机,在自清洁时,对老抽等顽固污渍的一次性去污率高达100%,并且除菌率高达“6个9”——99.9999%,位列洗地机行业领先水平。

此外,追觅洗地机还推出了追觅首创5分钟轻音恒温烘干技术。该技术采用600W高效功率发热元件,搭配16000转/分钟高速轴流风机,风量可以达到54m³/h,通过75°C热流除菌,实现滚刷5分钟高效蓬松速干,预防霉菌滋生。

为了更好地除菌,追觅洗地机行业内率先使用清越科技独家ElectroPero®电化学专利技术。该技术由斯坦福大学化工博士团队联合全球多家科研机构共同研发。经过权威机构测试,该技术生产的过氧化氢溶液,无毒、无异味、无刺激、无残留,对养宠家庭和母婴家庭更友好、更安全。

两大系列六款产品,适合不同用户选择

发布会上,追觅科技洗地机BU产品经理以用户群为视角,先后发布了六款扫地机新品,旨在帮助每一位用户、每一个家庭找到适合的洗地机。

例如,针对洗地机初体验用户,追觅科技推出了追觅洗地机H20 Pro 旋锋版。这款产品搭载追觅首创的主动式0缠毛技术,以及行业最强的100℃沸水自清洁技术,不仅滚刷清洁得更干净,除菌率也达到了行业天花板99.9999%。

而对于有边角、低矮空间清洁需求的用户,追觅洗地机H20 Ultra旋锋版和H30 Ultra旋锋版,提供了追觅首创的180°恒动水气分离平躺,可以自由伸入床底、沙发底等低矮空间,轻松将床底的毛发、脏污清理干净。

追觅科技还推出了针对立体式全屋清洁需求的追觅洗地机H20 Ultra Mix和H30 Ultra Mix ,集洗地、吸尘、除螨等五大功能体于一身,一机多用,可以同时满足沙发、床铺、桌面等立体空间清洁。

此外,最近两年,洗地机产品不断进化,带上下水功能的集成基站款扫地机逐渐进入市场。基站款洗地机的出现,让大家洗地机完全免维护、完全自清洁的可能性,但现阶段市面上的基站款洗地机,依然存在排污堵塞下水道、污水箱清洗不干净的情况。

为此,追觅科技行业首创了行业最强的加压排污技术、污水箱爆破净洗技术,搭载两项行业领先技术的追觅全能超薄自动上下水基站洗地机——H20 Ultra Station也同步推出,带领洗地机行业真正进入解放手术时代。

追觅科技洗地机BU负责人周俊杰表示,追觅科技未来不仅会更好基于现有技术做持续升级,还会针对用户不同需求与痛点,推出革新性技术——如此次发布的H20、H30系列搭载的“主动式0缠毛系统”“100°C沸水自清洁”等创新性技术。

据了解,追觅科技将这一策略称之为“大胆创新+技术革新”技术战略,以此驱动团队研发推出”满分之选“洗地机,进而实现追觅洗地机在全球市场的用户覆盖。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/OC6axx3iJMMzaYYp.html#comments Fri, 17 May 2024 10:37:00 +0800
Agility Robotics商业化初探,人形机器人落地还有多远? //m.drvow.com/category/robot/fnA5yjezOGKOgTRU.html 一双方形大眼睛,细圆脑袋,瘦长身躯,两条向后弯曲的腿形似鸵鸟腿,双足人形机器人 Digit 正踏着小碎步从货架上取出周转箱,再转身踱步将箱子放置到传送带上。整个工作过程,Digit 虽然动作稍显缓慢,但步态稳定,身体灵活。

这是发生在亚马逊物流某仓储库里的一幕。在这座大型仓库里,有超过75万台机器人“加班加点”地干活。不过,Digit 稍显特别,因为它是首个双足人形机器人“员工”。

Digit来自“Agility Robotics”——一家成立于2015年,如今备受热捧的明星创业公司。创办至今,Agility Robotics 始终专注于机器人的双足行走能力,前后共研发了三款产品,Digit 是其商业化的重大尝试。

在劳动力愈发紧缺以及成本上涨的背景下,用机器人来替代人的部分劳动成为新趋势,而人形机器人无疑是最具想象力的方向。这条赛道上,除了 Agility Robotics,国外企业特斯拉、Figure AI,国内企业宇树、智元、乐聚等一众公司也正加紧布局人形机器人赛道,一派热火朝天之势。源源不断浮现的人形企业和持续迭代出新的人形机器人像是烧不尽的柴火,作为燃料将人形机器人的故事带到更高更远的地方。

如今,人形机器人已经走到了落地化的前夜,但谁会先看见那第一缕曙光?或许,正在仓库里担任搬运工的Digit能看见。

从双足到人形,机器人走向落地

“Agility Robotics 的 Digit 是现阶段最好的人形之一。”足式机器人创业者周东表示。

作为 Agility Robotics 推出的第三款产品,Digit 是率先采用鸵鸟腿的人形机器人,而其他人形机器人主要配置的是能耗更少的类人腿。

据了解,Digit 的形态可以追溯至 Agility Robotics 前两代产品——实验室阶段 ATRIAS、仿生鸵鸟腿 Cassie。在前者的基础上,Digit 最终演化出了鸵鸟腿式双足人形构造。

  • ATRIAS:比赛首秀,一战成名

ATRIAS 是俄勒冈州立大学的动态机器人与人工实验室(DRAIL)研制了七年的项目成果。该项目旨在运用动物动力学开发双足机器人,由该校机器人学教授赫斯特(Jonathan Hust )带队。

在观察动物运动过程中,一些鸟类的奔跑能力非常强,这让赫斯特产生了浓厚的兴趣。为此,赫斯特不仅和伦敦大学皇家兽医学院知名教授 Monica Daley 合作,还与同事一起在实验室里长时间地研究目标鸟类的行走与奔跑。

在一次实验中,一只珍珠鸡沿着跑道奔跑,无意间一条腿踩进了实验人员精心布置的坑洞。这坑有半腿之深,珍珠鸡并未出现预想中的踉跄和摔倒,反而轻松越过,仿佛无事发生。

研究人员发现,珍珠鸡的腿会自动伸展以适应坑深,无需大脑做出反应,腿部便可自行处理意外状况。

这次实验为双足机器人的设计带来重要启发:机器人的灵活性在很大程度上依靠自身固有的机械特性,即依靠硬件而非软件。

在这一灵感刺激下,ATRIAS 系列很快便优化了硬件设计,借助仿生实现行走,两条牵拉着弹簧的腿可以不停地交替前进,无需视觉和力传感器,有点类似于盲人走路。

图来自Joanthan Hust

当时,ATRIAS 是第一个复现了人类步行步态动力学的机器人。2015年,在加利福尼亚州波莫纳举行的 DARPA 机器人挑战赛总决赛上,ATRIAS 突出的运动表现一时惊艳了众人。

不过,虽然行走能力突出,但彼时除了科研展示外,ATRIAS 并没有用作其他用途。同年,赫斯特与同事谢尔顿共同创办了 Agility Robotics,并与俄勒冈州立大学作切割,开始寻求商业化。

  • Cassie:标志性鸵鸟腿

2016年,Agility Robotics 在 ATRIAS 的基础上,推出了新一代机器人“Cassie”。

图来自Agility Robotics

与 ATRIAS 不同的是,Cassie 拥有全新的腿部结构,具体看来:

  • 电机缩小,但效率更高;

  • 臀部增加3自由度,能够向前后左右的任意方向移动双腿;

  • 配备动力脚踝,可以稳定站立,无需不断移动脚;

  • 拥有足够电池电量运行部分强大机载计算机;

形态与运作上,Cassie 保留了 ATRIAS 的特色。Cassie 膝盖像鸵鸟一样向后弯曲,也被称为“反屈膝”。此外,Cassie 也没有配置摄像头或外部传感器,和 ATRIAS 一样是盲人。

一直以来,地面的复杂性一直是困扰足式机器人移动行走的头等难题。Agility Robotics 致力于打造能走能跑、既能在户外穿越森林、又能无碍上下楼梯的双足机器人,并且仅依靠电池便能运行数小时。

经过数年的技术攻关和研发,这一愿望最终得以在Cassie上实现。

2021年,Cassie 用了53分钟左右的时间跑完了5公里,是第一个使用机器学习来控制户外地形跑步形态的双足机器人;2022年,Cassie 以“百米24.73s,平均速度超过4m/s”的成绩刷新了双足机器人百米赛跑的吉尼斯世界记录。

这一惊人的表现,展示出了 Cassie 优秀的运动性能与科研的无限可能性。得益于此,Agility Robotics 获得了大量美国学术界足式机器人的订单,成了高校和科研团队的重要探索平台。

但面向教育科研的商业化,对 Agility Robotics 来说,还远远不够。

  • Digit:打造双足人形,走进工厂

2019年,Agility Robotics 第三代产品 Digit 出世。Digit 的腿基本与 Cassie 一脉相承,最大的变化是新增了一个装满传感器的上半身和一双用于平衡方向的手。

彼时,Digi 俨然一副双足人形体态,身高1.75米,重65公斤,能举起16公斤重物体。

Agility Robotics 创始人 赫斯特在2021年曾表示:“我们并没有打算建造一个人形机器人,着手解决的是移动性问题。不过,在解决这一问题的过程中,团队发现双足人形是最佳形态。”

图片来自Agility Robotics

赫斯特解释道,Cassie 的一大问题在于没有足够的惯性来平衡向前摆动的腿,而 Digit 直立躯干的设计正是为了能让机器人在航向上有更多的控制权。

当时,通过观察动物运动,赫斯特发现尾巴能起到校正方向和平衡身体的作用。在一启发下,赫斯特决定试着给 Digit 安上尾巴。团队摸索后发现,最好的效果是让 Digit 两边各设置一个尾巴,左右对称。最后,尾巴演变成了手,Digit 也就拥有了双臂双足的人形体态。

更重要的是,手不仅能实现平衡,还能拾取物品,发挥工具属性,让商业化有了抓手。Agility Robotics 就曾于 CES 2020 上宣布与汽车巨头福特合作,共同打造自动化物流。

按照规划,汽车作为机器人基站,可让 Digit 进行充电。自动驾驶汽车与机器人通过数据交换进行协同工作,汽车实现物品的远距离运输,Digit 则手持货物完成送货上门的最后一公里。

图片来源福特

故事很美,但这场“最后一公里交付计划”的愿景最终还是未能如愿化作现实。

主要原因在于,Agility Robotics 后来将目光转向了仓储物流领域。创始人兼时任 CEO 的谢尔顿曾表示,机器人在物流和仓储领域会有更大发展空间。一方面,物流行业存在大量繁琐重复的工作,如搬运物料和箱子;另一方面,劳动力短缺的窘境日渐显著。

物流和仓储场景,核心是解决物料的移动和放置问题。为了更好完成工作任务,2019年至2023年间,Digit 从由 V1 升级至 V4 。相较于前几代版本,V4 不仅增加了用于移动周转箱的末端执行器,还优化了头部与眼睛,支持人机互动。

在 Agility Robotics 公布的一则视频中,Digit 展现出了稳定可靠的工作能力,似乎离机器人走进工厂、走进现实的预言更进了一步。

不过,当下人类还无法和 Digit 亲密无间地一起工作。出于安全考虑,人类需与 Digit 保持6英尺距离,直到有足够多的数据与信息能进一步验证 Digit 安全性时,人类才有可能与其亲近。

值得注意的是,2023年10月,一名 CNN 记者通过语音要求一台 Digit 完成任务,但哪怕多次重复指令,Digit 依然无法遵从命令依次完成任务;此外,另一台 Digit 在搬运箱子时不慎摔倒,无法立即站起来。

可见,Digit 要想真正步入工厂,还有一段漫长的路要走。

融资、扩张与换帅,Agility商业化三部曲

如果说“让双足人形机器人运动起来”是一个从 0 到 1 的问题,那么“让双足人形机器人进行工作”就是一个从 1 到 100 的故事。

但是,要如何找准第一个安身立命的“1”——即亟待解决的场景需求?

Agility Robotic 的第一个场景,也是众多机器人企业常见的路径,即卖给高校。业内人士蒋源表示,“当技术不够成熟,且缺乏闭环场景时,更适合学校和研究所做技术探索”。

当技术还在爬坡时,Agility Robotics 创始人赫斯特和谢尔顿的学术背景与知识经验就发挥起了作用。

两人均毕业于卡内基梅隆大学机器人专业,该院校是机器人领域的顶尖学府。之后,赫斯特担任俄勒冈州立大学工程学院的机器人学教授,带领实验室研究双足机器人。

与赫斯特的学术能力互为补充的,是谢尔顿的产品能力。谢尔顿曾创办 Three Rivers 3D,主要生产面向医疗保健领域的激光扫描仪,成本低且容量大。

2015年,两人携手合作,成立并推动 Agility Robotics 走到了人形商业化落地的奇点时刻。此时,仓储物流领域成为 Agility Robotics 亟待打开的第二个场景,让 Digit 站稳这一山头成了当务之急。

蒋源认为,“现在创业公司应该把资金和精力放在商业化上,带来价值,实现闭环。”Agility Robotics 在这两年里乘势而起,大量融资,重组高层,积极扩张,大有要打通商业化链路之势头。

首先,在资金方面,Agility Robotics 一共进行了3轮融资,分别是2018年的种子轮(800万美元),2020年A轮(2025万美元),以及由 Playground Global、亚马逊产业创新基金等投资的1.5亿美元的B轮融资。

一方面,这反映出市场看好 Agility Robotics 的发展前景;另一方面,在资本加持下,Agility Robotics 一时资金充裕,能更好推动和落实商业化策略。

其次,是 Agility Robotics 随后就布下的两步棋:扩大生产与高层调动。

  • 自建工厂,年产万台Digit机器人

自成立以来,Agility Robotics 陆续交付了100台左右的 Digit。但现在,Agility Robotics 显然并不满意这样的生产能力,而是直接自建工厂,以实现规模化生产。

2023年9月,Agility Robotics 在俄勒冈州塞勒姆开设第一家机器人制造厂 RoboFab,预计第一年生产数百台Digit,随后扩展到每年生产1万台左右。

不过,Agility Robotics 强调打造年产万台机器人的能力,并未示意销量已高达万台。尽管如此,Agility Robotics 创始人谢尔顿依然认为工厂的开业标志着机器人历史上的一个关键时刻——“商业人形机器人大规模量产的开始。”

Agility Robotics 将于2024年向客户交付第一批 Digit,并于2025年全面上市,售价预计为25万美元。

  • 高层重组,为商业化落地排兵布阵

2023年5月,Agility Robotics 进行了首次掌舵者的变动:由 Fetch Robotics 的 CEO Melonee Wise担任新的 CTO,原 CTO 赫斯特担任首席机器人官。

Melonee Wise 曾创办 Unbounded Robotics,以及担任 Fetch Robotics 的 CEO。Fetch Robotics 主要为仓储内部物流环境提供云驱动的自主移动机器人(AMR)解决方案,M.W的工作经验和资源无疑会有助于将Digit集成到现有仓储物流系统中,并能匹配不同客户对象的物流系统。

2024年3月,Agility Robotics 创始人谢尔顿卸任 CEO,担任总裁;而新任 CEO 则是曾在高通、微软等知名企业负责战略交易、合作伙伴关系、销售、营销及相关业务的 Peggy Johnson。

Peggy Johnson 将要负责 Agility Robotics 下一阶段的增长,重点关注销售、战略合作伙伴关系、未来筹款以及机器人的大规模交付。简而言之,就是要快速推动机器人的商业化落地,赚钱并实现 ROI 回正。

从最高层的人事变动上,不难看出 Agility Robotics 为了打开仓储物流应用场景的谋篇布局。谢尔顿与赫斯特的学术经历,在产品研发阶段有着得天独厚的优势,但在商业化的推进过程里,难免会有捉襟见肘之时,而新人们所具备的资源和知识经验或将更有利于解决当前Digit商业化难题。

这一战略布局推动下,Agility Robotics 喜报频传。2024年4月,Agility Robotics 宣布与曼哈顿联合公司建立合作伙伴关系,这是继亚马逊、GXO Logitics 后,Agility Robotics 合作的第三个世界物流大客户。

目前 Digit 还在进行试点工作,至于最终能否通过企业考验,成功在仓储物流领域里开花结果,还需留待验证。

人形机器人竞赛白热化,哪一个会率先落地?

过去半个世纪里,人形机器人赛道一直不乏拓荒者,比如本田就曾于 2000 年推出人形机器人 ASIMO。但囿于技术瓶颈,商业化落地难等困境,该赛道一直是冷门的代名词。随着近些年来 GPT、Sora 等新技术的突飞猛进和资本热钱的涌入,人形机器人被推到了聚光灯下,乘着东风,一路猛进。

作为人形机器人第一梯队里的佼佼者,波士顿动力一直备受关注。能快速跑、后空翻、翻越障碍物的人形机器人 Atlas,虽然持续不断给人们带来视觉上的震撼,但支撑其出色技术和优异表现的,是背后造价高达200万美元的成本。重金投入下缺乏与之相匹配的变现能力,这也让波士顿动力三次易主。

对于其他大部分人形创业公司而言,“人形机器人要在哪落地”,是个不可忽视的的发展问题,商业化是摆在技术难题之后的第二关。“现在技术部分,各家人形的行走能力都相差不大了。”蒋源向雷峰网表示,目前商业化才是最大难题。

跑在商业化前头的 Agility Robotics,在这两年里刷足了存在感。Digit 正试图打开的物流仓储场景,虽然还未实现商业闭环,但已展现出了巨大的发展潜力,不失为一个较好落地的垂类细分场景。

此外,一些人形创业公司瞄准了工业制造场景。例如,Figure 筹集了6.75亿美元,正在与宝马合作;Apptronik 则与梅赛德斯奔驰合作;特斯拉正在推动 Optimus 走入汽车工厂。

创业者同阳告诉雷峰网,当下人形机器人在汽车厂里还是有不少发挥余地。目前虽然人形机器人还无法胜任汽车厂里的精细活,但是能够代替搬运等重复繁琐类工作。

除了面向工业场景,让人形机器人最终走进千家万户,成为 iPhone 般的存在,是众多人形机器人创业者的追求与向往,其中不乏创业公司直接将目标投向家庭场景。例如,以色列初创公司 Mentee Robotics 2024年4月推出了 MenteeBot,旨在完成系列家务,如整理桌椅、处理衣裳。

工业、家庭等场景之外,人形机器人在医疗、娱乐、服务等领域均有部署。

虽然市场对于人形机器人落地场景的争论始终不休。但整体而言,业界普遍认为人形机器人会率先出现在工业场景。工业制造领域里存在大量机械重复的工作,人形机器人可发展的空间和作用更大。

不过,无可争议的是,人形机器人要走进千家万户,还有很长一段距离。雷峰网雷峰网


]]>
机器人 //m.drvow.com/category/robot/fnA5yjezOGKOgTRU.html#comments Thu, 09 May 2024 17:25:00 +0800
专访优必选庞建新:在大模型时代推动机器人智能化|GAIR live //m.drvow.com/category/robot/EUDIJ6kEoL60eoiK.html “大模型怎么融进人形机器人里?”这是庞建新最近一直在琢磨的核心问题。

作为优必选副总裁、研究院副院长,庞建新正领导团队,将大模型技术应用于人形机器人的多模态感知和决策规划中,提升人形机器人智能化水平。

在从业的近三十年里,他的专业背景横跨语音处理、计算机视觉,再到人形机器人技术;从中科大的博士,到中国科学院深圳先进技术研究院的PI,再到优必选的技术高管,他的职业生涯,已然是中国智能科技崛起的一个缩影。

现如今,大模型的横空出世,除了让庞建新看到了一些可能性,更多是冷静。

他坦陈,“因为在技术快速发展时,整个技术路线和应用场景还存在不确定性,但同时也正是国内人形机器人企业快速发展的最佳时期。”

这是一种强烈的矛盾感。

在谈及大模型技术对人形机器人智能化进程的影响时,庞建新提出了自己的见解。

他认为,大模型技术的核心是其能够融合大量知识和数据,这对于人形机器人领域来说是一个巨大的机遇,但同时也带来了新的挑战。比如如何将大语言模型技术(可理解为“大脑”)与人形机器人的“小脑”(控制大模型)和“本体”结合,以及如何处理大语言模型可能产生的“幻觉”问题等等。

而要落到实际操作层面,庞建新表示,优必选的策略是双管齐下,既要一种分层结构的解决方案,同时也不能放弃端到端的解决方案。

前者是将大模型分为处理知识、常识推理的“大脑”层,指导动作规划的“小脑”层,以及直接与控制相结合的动作执行层。这种分层解耦的方法,使得每一层都可以专注于其特定的任务和数据需求,提高了技术的应用效率。

后者则是从感知直接到控制的全过程,这种方法导致数据获取更为复杂,却能够提供更为直接的解决方案。

针对大模型与机器人智能化现状,庞建新说了四个字:百花齐放。

“当下人工智能和人形机器人技术的结合正处于一个开放性问题的时期。”这正是当下人形机器人从业者的乐趣所在。而换句话说,这也意味着目前技术尚未开始收敛,仍需在一些小规模场景中进行实验和测试。

今年2月,优必选与新能源车厂的合作,正是他们在多模态感知决策技术应用实训方面的一次尝试。庞建新坚信,大模型技术将是推动未来技术进步和产业化的关键。

近期在与雷峰网-AI科技评论的对话中,庞建新分享他对于大模型技术推动人形机器人智能化进程的见解,以及国内企业如何在技术快速发展的背景下把握机遇。

以下为对话(经编辑):

4月8日(周一)20:00-22:00,雷峰网将举办主题为「大模型时代,机器人的技术革新与场景落地」的线上圆桌论坛,届时庞博士将分享更多前沿观察。

01 寻找最适合机器人的大模型

雷峰网:首先请问庞博,您的团队目前在AI+人形机器人领域有哪些探索,有哪些不错的技术成果可以分享?

庞建新:我们确实有一些颇具前瞻性的课题项目,在近期进展不错。

众所周知,当前人工智能已经迈入了一个崭新的时代,其中大模型、多模态技术以及具身智能等重要进展,对于机器人领域产生了深远影响。这些变革性的技术正在推动着许多传统观念的更新换代。

我们的团队也致力于类似的研究工作,特别是在如何运用大型模型和具身智能,来解决以往基于传统DNN、CNN方法所无法克服的问题。

我们的研究重点之一是多模态感知问题。

传统上,感知技术往往专注于单任务,并且只在决策层面进行信息融合。而现在,我们希望能够将多模态技术应用到人形机器人技术中,将视觉感知、语音感知、上下文信息以及相关知识等统一作为输入,以促进人形机器人的决策过程。

此外,我们还关注于人形机器人的决策和任务规划。

通过多模态感知信息的整合,我们期望引导人形机器人进行更为高效的决策。传统的决策过程往往较为复杂,依赖于状态转移和条件判断。而我们现在正尝试利用大型模型的技术,充分发挥大模型的逻辑和推理能力,以解决人形机器人在决策和推理方面的挑战。

具体到人形机器人的能力方面,因为人形机器人通常需要具备几大核心能力:人机交互、对话、移动和操作能力。这些能力在传统上对于人形机器人而言并不容易自主实现,往往需要凭借大量的外部输入和条件限制。而我们现在的研究,正是通过大型模型技术的应用,充分利用大模型内含的知识逻辑和推理能力,提升人形机器人的自主性和智能化水平,把机器人各种能力链接起来。

雷峰网:大模型这项技术将如何影响人形机器人的智能化进程?相应地,大模型对人形机器人来说是否也带来了新的挑战?

庞建新:将大模型技术融入人形机器人领域,确实存在一些挑战和问题,我们在做实际项目时就能感受到。

首先,大模型的核心是在于其能够集成大量知识,供人类使用。然而在人形机器人领域,许多场景与知识并无直接关联。

许多行为,如人类的本能反应或动作智能,并不完全依赖于显性的知识。比如说我们在抓取物体或在不平坦地面行走时,往往不需要经过深思熟虑,身体能够自动适应环境。

在人形机器人的设计中,我们可以将其分为“大脑”、“小脑”和“躯体”三部分。小脑部分与大模型中的知识学习并不直接相关。因此,在大模型技术落地时,我们需要解决如何将大脑与小脑结合,以及如何通过小脑驱动躯体的问题。

其次,大模型依赖数据,当任务与数据关系不大,或者数据难以采集和学习时,这构成了一个重大挑战。大模型训练和推理的高算力要求也是一个问题,特别是当应用场景对实时性有高要求时。

第三个挑战是大模型本身的特性,伴随着“涌现”的同时,这也可能导致“幻觉”问题。如何抑制这些幻觉,通过各种方式抑制或者控制大模型输出错误信息,是我们需要克服的难题。

此外,大模型的成功率或者有效率问题也至关重要。对于大多数用户,往往需要多次尝试输入才能得到有效答案,如何尽可能降低使用者的专业水平,比如通过自动生成相关提示语高效地获得正确结果,也是当前大模型需要解决的重要问题。

雷峰网:大模型与人形机器人的结合正在发展期,是否分化为几种不同流派?

庞建新:我个人认为,可能有两种流派。

一种流派采用分层结构,将大模型分为三个层次:

第一层与大脑相关,主要处理知识、常识推理等;

第二层与动作决策和任务规划相关,类似于小脑的功能,指导动作的规划;

第三层则直接与控制相结合,处理动作的规划与控制。

这种分层解耦的方法,使得每一层都可以专注于其特定的任务和数据需求。

在大脑层面,可以使用现有的大模型数据,如与场景相关的知识和数据。

而在动作规划层面,由于大语言模型中缺乏这方面的内容,我们需要在仿真环境或物理环境中采集新的数据,以丰富这一层次的数据集。

至于控制层面,可能需要通过强化学习等技术,在虚拟或物理环境中生成所需数据。

另一种流派则追求端到端的解决方案,即从感知直接到控制的全过程。

这种方法虽然数据更为复杂,但能够提供更为直接的解决方案。然而,这种端到端的数据同样难以获取。

在实践中,我们的选择并不局限于单一流派。我们同时探索了解耦的分层方法和端到端的技术,以技术储备和实际应用需求为导向。也就是说,由于人形机器人存在特殊的非刚体特性,我们目前更倾向于采用解耦的分层方法。同时,我们也在进行端到端技术的探索和研究,以适应未来可能的需求和发展。

雷峰网:最近我们对孙宇教授做了专访。孙教授的研究重点在于将大型语言模型应用于具体的机器人任务中,例如厨房烹饪场景。他的研究使得机器人能够创造出知识库中未包含的新菜单。此外,GPT-4通过精心设计的提示工程,能够生成多个不同的高级任务规划,并将其转化为可执行的低级PDDL计划。请问,优必选在这一领域的研究是否有相似之处,或者存在某些差异?

庞建新:孙教授的研究实际上涉及到了高层决策和任务规划。

当我们人类执行一个任务时,通常会将其分解为一系列子任务,这个过程可能是下意识的,不一定由大脑直接完成,也可能是小脑参与其中,因为人类的认知过程相当复杂。

例如,当我们想要拿一瓶水时,我们自然而然地知道水可能在冰箱里,于是我们会走向冰箱,打开门,通过视觉找到水,然后抓取并带回。这个过程就是一个任务流。

所以抽象来看,人类执行任务时,将其拆解为各个子任务本身就是一种知识。这种知识可以通过推理或场景驱动来实现。这表明,大模型在理解和生成任务规划方面具有巨大的潜力,尤其是在与具体场景和知识库相结合时。

当前的AI技术,正是通过大模型,包括GPT或其他模型,处理这种任务流,进行决策,并将任务分解为子任务,再由人形机器人执行。

我们的一些研究工作与孙教授的研究类似,也是在特定场景中进行。例如,我们在2023年世界机器人大会上展示的“人形机器人多模态具身智能系统”,就涉及到更高层次的决策和任务拆解。

雷峰网:我追问一个问题,大模型与人形机器人的结合,是否能够帮助机器人向人类智能迈出关键一步?

庞建新:首先,我们需要认识到,大模型的应用不仅仅是关于知识的问题,它还涉及到上下文和环境的问题。

当我们考虑将大模型应用于人形机器人时,目前还是会采用多个模型的集成应用,我们通常会将其分为几类:

基于语言的大模型、基于视觉的小模型、语音的小模型、多模态的大模型,以及通过强化学习等方式学习到的动作规划,以及控制策略的方面的大模型等等,它们在学习方式和应用上的差异是显著的。

一般看来,人们通常将大模型与基于生成式的语言大模型联系在一起。然而,在人形机器人的控制和规划领域,它们有自己独特的模型体系,这些模型与语言处理的并不是完全一样。

但无论是哪一种大模型,它们能与人形机器人结合的原因在于,人形机器人需要在复杂多变的环境中进行有效的交互和操作。那么,多模态大模型和基于知识的大模型,能够为机器人提供丰富的上下文信息和环境理解能力,从而提高其适应性和决策质量。此外,通过强化学习等技术学到的动作规划策略,可以增强人形机器人的动作协调性和任务执行能力,通过将这些模型进行融合,从而提升了人形机器人与物理世界的交互能力和智能化水平。

雷峰网:那么您的团队在融合大模型技术时,在分工上如何安排?

庞建新:优必选在这方面采取了一种灵活而协同的工作方式。

由于大模型技术涉及的领域广泛,公司在进行相关项目时通常会组织多个团队联合作业。这些团队可能包括视觉感知、控制和语言处理等领域的专家。这样的跨领域合作模式已经成为优必选的标准做法。

而且与传统的深度学习项目不同,大模型技术的应用已经超越了单一工种的界限,需要多个团队的紧密协作。

这种跨团队的合作模式并不是新的组织结构,而是大模型技术发展至今的必然结果。技术的多样性和复杂性要求不同领域的专家共同参与,来实现项目的成功。

雷峰网:当前优必选推动技术成果产业化方面,有哪些计划或正在进行的项目?

庞建新:今年2月底,我的团队与新能源车厂合作开展了一项实训工作。这项工作涉及到了我们多模感知决策技术的一部分应用。然而,我们也认识到,尽管这是一个很好的开始,但要实现AI大模型与人机协作的深度融合,我们仍需攻克一些核心技术难题。

人工智能技术,特别是大模型的应用,已经与我们的研究和实际项目紧密结合。

近期,优必选也跟百度达成了合作,将文心大模型接入人形机器人Walker S ,共同探索中国AI大模型+人形机器人的应用。

伴随着大模型技术的赋能,人形机器人的产业化进程将加快,未来“降本增效”的人形机器人将在工业制造、商用服务和家庭陪伴等多个场景实现落地应用,解决劳动力短缺,提高生产效率,让人类生活变得更加美好。我们坚信,这项技术将是未来长期发展的重要方向。我们将继续致力于这一领域的研究和开发,以推动技术的进步和产业化进程。

02 优必选技术高管的身份背后

雷峰网:能介绍下您的研究背景吗,是什么激发了您对AI与机器人技术结合的兴趣?

庞建新:我本科是在中科大,这段时期专注于语音信号处理,而科大讯飞正是在我所在的语音实验室孵化出来的。后来我又在中科大完成了计算机视觉方向的博士学习。

2011年,我加入中国科学院深圳先进技术研究院,一边做科研,一边做产业。因项目合作,参与到与腾讯公司的合作中,研发了名为“小Q”智能机器人的产品系列。也就是那时候我正式从AI研究转向机器人研发,将人工智能与机器人相结合。

当我2015年加入优必选时,我专注于将人工智能技术与机器人融合,推动机器人技术的研发和应用落地。

所以总结来说,我的经验涵盖了语音处理、视觉识别到机器人技术等多个领域,这些都是当前人工智能和机器人发展的关键领域。

雷峰网:为什么看中了优必选?加入已经近十年时间了,这种专注来源于什么?

庞建新:我加入优必选确实有一段奇妙的经历。

2014年,在前海深港青年梦工厂开业典礼上的一次展览,我和团队代表中国科学院深圳先进技术研究院,展示了我们的产品,而优必选的展位就在隔壁。

后来我了解到,优必选在做国内自主研发的人形机器人,也了解到了公司创始人周剑对于人形机器人的愿景和梦想,发现这个与自己的梦想高度契合,所以选择加入了优必选。

那时候,我住在宝安西乡,每天往返近100公里,到龙岗上班。因为我加入公司比较早,参与了公司早期和中期的多个项目,将这些技术转化为公司的众多产品。这就是热情所在。

实际上我从未真正离开过工业界。在我加入中科院之前,曾在一家外资企业从事计算机视觉算法的研发工作,后来这家企业在国内科创板上市。我在中科院的工作中,一半的精力用于技术转化,孵化了几个有影响力的产品,另一半则致力于前沿科研。这些年来,我的工作始终围绕着如何将最新技术转化为实际产品。

雷峰网:自2015年加入优必选以来,你眼中的公司经历了哪几个发展阶段?

庞建新:优必选从未局限于单一的技术研发或产品开发。公司始终坚持技术和产品同步发展的战略,这也是优必选吸引我的地方。我认为,只专注于技术可能会导致与实际应用脱节,而只关注产品则可能失去技术优势和市场竞争力。

在2015年加入优必选后,在 CTO 熊友军博士的带领下,我们共同推动了研究院的成立,目的是将技术研发和产品开发紧密结合。

我们公司内部要求,研究院除了支持产品进行技术研发,还要投入资源跟进最新技术,根据技术发展趋势和未来场景中可能遇到的关键技术进行研发。

从2016年开始,优必选着手研发大型人形机器人,并以此平台为基础,将技术成果转化为各业务线的产品支持。公司始终坚持两条腿走路的策略,不偏重任何一方。

优必选在技术投入上非常聚焦,始终思考机器人技术的未来发展趋势和应用场景。基于这些长期趋势和应用场景的考量,公司有针对性地寻找和研发适合的技术。因此,优必选很少会受到外部研究热点的影响,而是坚持沿着既定的技术发展路径和应用场景进行研发。

雷峰网:研究成果转化为实际产品,您有哪些心得?

庞建新:科研人员往往专注于技术创新和独特性,以解决科学问题为导向,追求学术上的突破和理论上的完备解或最优解。

而在工业产品开发中,我们更多的是寻找和解决已经存在的关键问题。目标是找到与工业场景、成本、软硬件匹配度以及研发周期最相匹配的解决方案。这意味着在工业界,我们需要更多地考虑产品的实际应用和市场的需求。

此外,在面向产品或特定场景的工作中,还需要建立一套标准化的思路。这涉及到如何将场景中的各种元素数字化、标准化或规范化,确保技术的长期积累和持续改进。

尽管科研和工业界的目标和思路有所不同,但解决挑战的方法和路径在本质上是类似的。

雷峰网:以大模型这个热点技术举例,业界对其的广泛关注始于2022年底,当时ChatGPT的发布引发了众多讨论。在优必选是什么时候讨论大模型?

庞建新:我们对大模型技术的重视可以追溯到更早的时期。优必选在2022年,甚至在2021年上半年,就已经注意到了大模型技术的潜力。

最初,大模型技术主要应用于视觉领域,许多国内外的科研机构和大型企业都在探索,如何利用视觉大模型进行识别和检测。

随着时间的推移,当语言大模型开始出现时,优必选内部已经开展了类似的项目,并在内部开展了小规模的研究项目来深入探索这些技术。

到了2023年和2024年,优必选迅速将这些技术应用到了机器人领域。通过自身的研究,优必选在技能上也进行了一些创新应用,将大模型技术融入到产品开发中,提升产品的性能和智能化水平。

这次,优必选Walker S与百度文心大模型进行深度融合,进行任务调度应用开发,快速构建了任务规划与执行能力,并完成柔软物体操作和物体干扰分拣等任务,也是这种技术应用的一次体现。

03 机器人如何进化?

雷峰网:您认为当前市场对机器人的需求主要集中在哪?是否有特定的场景,为您的技术和产品研发提供了启发?

庞建新:在大模型技术出现之后,整个行业对大模型及其在各种场景中的应用提出了明确的需求。因为大模型技术正在重塑我们的生产方式,改变了生产力的构成。

人们可能会思考,是否可以通过人形机器人结合大模型技术,来解决工业制造中的问题?打造教育领域的潜在应用?

传统上,计算机教育可能侧重于采用编程的教学方法,但随着大模型技术的发展,我们现在可以探索低代码甚至零代码的方式来解决问题。这可能为教育带来新的范式,使得更多人能够通过使用这项技术来满足他们的生产力需求。

除了工业制造和人工智能教育,优必选也在探索大模型技术在人机对话、康养以及其他应用场景中的潜力。

雷峰网:国内外对于机器人的较量到了什么阶段?对于AI前沿技术的把控会最终是如何影响大机器人开发上?

庞建新:国内外在机器人的研究思路上存在一些区别。中国企业的研究思路更加面向实际应用场景,而海外企业,如OpenAI等,在得到大量资金的支持下,能够进行更多开放式的科学研究。

中国学术界和产业界曾经经历过一段跟随阶段,尤其是在大模型等技术领域跟随欧美的研究趋势。

但中国的跟随步伐相对紧凑,尤其在面向产品应用开发方面。尽管在某些领域,如芯片和GPU等与大模型密切相关的技术,中国可能会面临一些挑战,但我认为这种跟随是必须的。

因为在技术快速发展时,整个技术路线和应用场景还存在不确定性,当前正是国内机器人企业快速发展的最佳时期。

雷峰网:国内有哪些企业在机器人和大模型结合方面做得比较好?

庞建新:从全球范围来看,大模型与具体行业的结合还处于非常早期阶段。尽管大模型技术取得了很多进步,但它在商业应用方面的转化还处于早期。

当技术进入平台期,真正的应用才会开始。也就是说,目前技术尚未开始收敛,当技术开始收敛时,才意味着它真正准备好进行大规模应用。目前可能还处于小规模场景或特定场景的实验和测试阶段。

此外,大模型技术发展迅速,但应用仍面临一些挑战,如算力和数据的高要求,以及效率、成本和幻觉等问题。

雷峰网:在AI+机器人领域,未来几年可能会出现哪些颠覆性的技术变革?除了大模型技术之外,还有哪些值得关注的发展趋势?

庞建新:仿真技术可能是未来人形机器人领域一个潜在的颠覆性变化。由于人形机器人控制和操作相关的数据难以构建,仿真技术的发展将对人形机器人领域产生重大影响。通过高效的仿真技术,我们可以构建大量用于人形机器人应用的数据和虚拟场景,这对于人形机器人技术的进步非常重要。

当前阶段,人工智能和人形机器人技术的结合正处于一个开放性问题的时期。

无论是在高层决策应用、底层控制,还是场景构建和仿真等方面,都呈现出多样化的发展态势。虽然已经在特定场景中看到了一些成果,但这些成果是否足够泛化,是否能够在人形机器人上直接进行使用,仍然是一个挑战。

总之,AI增强人形机器人领域正处于一个充满活力和创新的时期,未来几年可能会出现多项颠覆性的技术变革。仿真技术、大模型以及其他AI技术的发展,将为人形机器人领域带来新的机遇和挑战。

在这个百花齐放的阶段,我们需要持续关注技术的发展动态,并积极探索如何将这些技术应用于实际场景中。

本文作者 吴彤,长期关注AI4S,欢迎添加微信 (icedaguniang)互通有无。

|GAIR live 圆桌预告

4月8日(周一)晚间8点~10点,雷峰网将举办一场主题为「大模型时代,机器人的技术革新与场景落地」的线上圆桌论坛。

本次论坛的嘉宾有:南佛罗里达大学孙宇教授、武汉大学李淼教授、逐际动力张巍博士、优必选科技庞建新博士。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的CCF-GAIR大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。


|AI+机器人相关资料

1,Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliabilityhttps://gairdao.com/doi/10.1142/S2972335324500029

2,《对话南佛罗里达大学孙宇教授:当大语言模型用于机器人任务规划丨IJAIRR》https://mp.weixin.qq.com/s/vrTMsssLQvmI11kX38Jvog


]]>
机器人 //m.drvow.com/category/robot/EUDIJ6kEoL60eoiK.html#comments Wed, 03 Apr 2024 15:44:00 +0800
讲座预约丨四位专家大论道 :大模型时代,机器人的技术革新与场景落地丨GAIR live //m.drvow.com/category/robot/cRO194JhNs8Xcris.html

站在科技创新的浪尖,我们目睹了人工智能领域的巨大飞跃,尤其是大型机器学习模型(大模型)的飞速发展,正如潮水般重塑着我们所熟悉的世界。

在过去几年中,机器人技术已经从理论研究的深奥殿堂,走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。在制造业的自动化流水线上,在医疗领域的精准诊断中,甚至在我们家中的智能助手里,机器人的身影无处不在,它们正逐步成为我们生活中不可分割的一部分。

而当我们展望未来时,大模型将在机器人研发中扮演何种角色?

它们将如何进一步推动机器人技术的发展,使其更加智能、高效,并更好地服务于人类社会?

这些问题不仅激发了科技界的无限遐想,也引领着我们不断探索和前进。随着大模型技术的不断进步,我们有理由相信,未来的机器人将更加贴近人类的需求,成为我们生活中更加紧密的合作伙伴。

为了深入剖析这一话题,雷峰网将于4月8日(周一)晚间8点~10点,举办一场主题为「大模型时代,机器人的技术革新与场景落地」的线上圆桌论坛。

本次论坛荣幸邀请到了:南佛罗里达大学孙宇教授、武汉大学李淼教授、逐际动力张巍博士、优必选科技庞建新博士,将分享他们的深刻见解和最新研究成果。

在这场论坛中,我们将深入探讨以下几个核心议题:

  • 全球视野下的突破:在国内外,哪些学术团队和工业团队在机器人领域取得了显著成就?他们的研究成果如何推动了这一领域的发展?

  • 从理论到实践:如何从零开始构建并部署一套高效的机器人软硬件系统?在这一过程中,我们面临哪些技术难题,又是如何一一克服的?

  • AI大模型的利弊:在诸多大模型里,比如大型语言模型、大型视觉模型、大型多模态模型、大型知识图谱和推理模型、你们更青睐使用哪些大模型?大模型技术如何增强机器人在感知、决策和交互方面的能力,以及在推动机器人技术发展的同时,大模型是否引入了新的挑战和问题。

  • 技术与现实碰撞:目前的AI技术仍然受限于特定场景,而实现真正的泛化和通用人工智能(AGI)仍然是一个挑战。如何使机器人能够真正走进开放式服务场景的挑战?倒推企业和学术界应该如何协作?

  • 未来畅想:AGI与人形机器人的结合,是否能够帮助机器人向人类智能迈出关键一步?在AI+机器人领域,未来几年可能会出现哪些颠覆性的技术变革?

添加策划人 吴彤 微信(微信号:icedaguniang),备注“姓名+职位”,即可邀请进入专家群,观看此次线上论坛,实时交流与提问。

嘉宾介绍

孙宇,美国南佛罗里达大学计算机科学与工程系教授

孙宇,2007年获美国犹他大学计算机科学博士学位。随后在三菱电机研究实验室(MERL)接受博士后培训。2016年至2017年在斯坦福大学担任客座副教授。

主要研究领域为机器人、智能系统、医疗健康应用。

曾发起IEEE RAS机器臂抓取和操作技术委员会,并担任第一任联合主席,及美国总统国情咨询委员会机器人方向的顾问。他发表了许多研究论文,获得了15项美国专利和2018年USF卓越创新奖。他还担任过多个编辑委员会的副编辑和高级编辑,包括IEEE Transactions on Robotics, IEEE Robotics and Automation Letters (RA-L), IEEE Robotics & Automation Magazine, ICRA, IROS,UR.

李淼,武汉大学工业科学研究院副教授,博导

李淼,华中科技大学机械本硕,瑞士洛桑联邦理工(EPFL)机器人与智能系统方向博士,导师Aude Billard教授。现任武汉大学工业科学研究院兼微电子学院博士生导师,弘毅学堂学业导师,医工融合研究院执行院长,湖北省集成电路封装与集成共性技术工程研究中心常务副主任。

长期从事复杂环境下的机器人抓取与自主操作技能模仿学习研究,创新性提出动态抓取自适应的科学概念,并荣获瑞士ABB机器人奖。

在机器人主流刊物发表论文80余篇,多次获得国际机器人会议最佳论文奖,拥有国内外发明专利80余项并得到多次科技成果转化,软件著作权30余项,担任多个机器人国际期刊副主编及编委。荣获EPFL优秀博士论文奖(2016),IROS国际机器人抓取挑战赛第二名(2016),ICRA国际云端机器人挑战赛第四名(2022),中铁建科学技术奖一等奖(2020),全国互联网+创新创业金奖(2018),中国创新创业英才(2020,全国每年十名),中国产学研工匠精神奖(2021),中国发明协会发明创新创业奖二等奖(2022),全国数字健康医学人工智能二等奖(2023),湖北省科学技术进步奖三等奖(2023),湖北省五一劳动奖章(2019)。

庞建新,优必选科技副总裁

庞建新,教授级高工。2008年获得中国科学技术大学信号与信息处理专业博士。2011年,庞建新加入中国科学院深圳先进技术研究院,参与研发腾讯“小Q”智能机器人的产品系列,从此从AI研究转向机器人研发。2015年加入优必选科技,现任深圳市优必选科技股份有限公司副总裁、研究院副院长,并担任广东省机器人定位导航技术企业重点实验室主任,中国计算机学会(CCF)智能机器人专委会常委,中国自动化学会机器人智能专委会委员。

主要研究方向是人工智能、计算机视觉和智能机器人。领导团队开展了一系列的机器人和人工智能核心技术的研发,产业化了一系列有影响力的机器人产品。

他主持了国家自然科学基金、国家发改委、广东省科技厅和深圳市等科研项目数十项,获得广东省科技进步一等奖、技术发明二等奖、吴文俊人工智能科技进步二等奖和中国发明协会发明创业奖成果一等奖等奖励,以及200多项国内外技术专利,在国内外学术期刊和会议上发表了三十多篇学术论文。

张巍,逐际动力创始人

张巍,本科就读于中国科技大学自动化系,在美国普渡大学获得统计系硕士学位和电气与计算机工程系博士学位。后续加入美国加州大学伯克利分校担任博士后研究员。从2011年开始在美国俄亥俄州立大学电气与计算机工程系任教,后晋升为长聘教授。2019年回国,加入南方科技大学担任长聘教授,也是深圳市鹏城学者特聘教授。

研究方向聚焦在控制与优化理论、机器人、机器学习、强化学习以及相关技术在足式机器人的应用。

2022年,张巍创立通用机器人公司逐际动力(LimX Dynamics),目前该公司已经是具身智能赛道上关注度颇高的选手。公司2024年的发展重点是继续攻关人形机器人的技术难题,主要包括全身协同的移动操作(loco-manipulation)、人形机器人核心硬件的开发、基于强化学习的系统化研发能力,以及推动双足机器人P1和四轮足机器人W1的产品化、商业化落地。

讲座信息

主题:大模型时代,机器人的技术革新与场景落地参考资料:

1,Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliabilityhttps://gairdao.com/doi/10.1142/S2972335324500029

2,《对话南佛罗里达大学孙宇教授:当大语言模型用于机器人任务规划丨IJAIRR》https://mp.weixin.qq.com/s/vrTMsssLQvmI11kX38Jvog

时间:4月8日(周一),北京时间20:00-22:00

观看方式:「雷峰网」视频号 与 「AI科技评论」 视频号同步直播

IJAIRR正在邀约论文和专题

《国际人工智能与机器人研究期刊》(International Journal of Artificial Intelligence and Robotics Research,简称IJAIRR),是由新加坡GAIR研究院与世界科技出版社联合出版的国际学术期刊。

作为全球首本专注于人工智能(AI)、机器人技术(Robotics)以及基础科学交叉研究(Research)的期刊,IJAIRR致力于成为AI与机器人领域研究的权威发布平台。

IJAIRR欢迎各类研究论文、评论文章、短篇论文、书评以及专题(Special Issue)形式的投稿。我们特别关注那些在顶级AI会议上发表并现场展示,但缺乏长期沉淀平台的优秀论文。为了给这些论文及其作者提供一个更广泛的发表和推广渠道,IJAIRR现正积极邀约相关论文投稿。

  • 如果您在本领域顶级会议上发表的文章(或即将发表)不超过一年,我们将协助您稍作修改后在IJAIRR期刊上发表。

  • 如果您领导的团队在顶级会议上有多篇论文发表,并希望在IJAIRR上围绕特定主题策划一个专题(Special Issue),我们诚挚邀请您深入讨论合作事宜。

  • 如果您是顶级会议的组织者,并有意与IJAIRR合作,针对特定会议策划一个专题(Special Issue),我们也期待与您具体商讨合作细节。

IJAIRR期待与您携手,共同推动人工智能与机器人研究的发展。


联系人:IJAIRR创刊主编朱晓蕊博士,xiaorui_zhu@gair.sg

关于期刊创刊主编等更多信息,可点击

https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA

关于雷峰网、GAIR大会、GAIR研究院(期刊和在线社区)的详细介绍,请阅读朱晓蕊教授的专访:

https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw

IJAIRR期刊的主页链接为:

https://gairdao.com/journals/ijairr

]]>
机器人 //m.drvow.com/category/robot/cRO194JhNs8Xcris.html#comments Tue, 02 Apr 2024 10:09:00 +0800
对话武汉大学李淼教授:以大模型视角看待一切机器人问题丨GAIR live //m.drvow.com/category/robot/XOJ2fZIntuyEO0Br.html “人们对机器人的抓取和操作存在很多误解,很多研究成果很难推进到实际应用环节。”

武汉大学李淼教授介绍,这是他放弃前往麻省理工 MCube Lab(操纵与机制实验室)Alberto Rodriguez教授团队做博士后研究,选择回国创业的重要原因。

李淼教授博士毕业于瑞士洛桑联邦理工学院,师从学习算法与系统实验室的创办者Aude Billard教授,长期致力于机器人学习和控制、物体抓取和操作等领域的研究。

他关于动态抓取算法研究的博士论文,在瑞士洛桑联邦理工学院获得了全球每两年仅一名的瑞士ABB奖(Asea Brown Boveri Ltd. ),也是该奖的唯一华人获得者。这项研究提出了复杂物体灵巧操作的鲁棒性算法以及成功应用于现实世界的机器人操作问题,尤其在机器人抓取、操作方面。

李淼教授回国后依然延续了这项研究,为抓取算法寻找合适的落地场景。

大模型技术出现后,李淼教授的研究内容也随之变化,一方面与业界合作,将大模型技术应用在家庭服务机器人的产品研发上;

另一方面,在学术研究上,也开始尝试将扩散模型(Diffusion Policy)和手术机器人动作生产策略相结合、将大模型和医疗影像相结合。

“我在与团队成员交流时一直强调,我们要以大模型的视角来看待一切机器人的问题,无论是算法研究还是其他各类工作,如果和大模型不相关,也许5年之内就会被淘汰。”

李淼教授指出,大模型将彻底改变机器人领域的发展进程。

4月8日(周一)20:00-22:00,雷峰网将举办主题为「大模型时代,机器人的技术革新与场景落地」的线上圆桌论坛,届时李淼教授将分享更多前沿观察。

以下为对话(经编辑):


01 从理论研究到机器人研究

雷峰网:硕士毕业后,您为什么选择了瑞士洛桑联邦理工学院读博?该校的机器人研究有何特色?

李淼:我最开始是在华中科技大学申请的直博,硕士阶段结束后,考虑到当时国外的机器人研究比较领先,所以尝试申请了国际上机器人专业排名最高的几个学校,也拿到了很多offer,比如美国的约翰·霍普金斯大学、英国的帝国理工大学等等。

我希望选择一个与AI算法结合更紧密的方向,所以最终去了瑞士洛桑联邦理工学院Aude Billard教授的学习算法与系统实验室(Learning algorithms and systems Laboratory)。

由于我本科、硕士阶段的机器人研究方向更加偏向理论,和数学、医学、动力学等学科的相关性很高,而Aude Billard教授团队的研究则更加注重数据,通过模仿学习等手段收集机器人工作过程中的数据并进行分析,Aude Billard教授是这一领域的开创者,也是瑞士机器人专题网络负责人。

除Aude Billard教授的实验室之外,瑞士洛桑联邦理工学院还有很多技术领先的机器人研究团队,如研究仿生机器人的生物机器人实验室(Biorobotics Laboratory)、发明了折纸机器人的可重构机器人实验室(Reconfigurable Robotics Lab)等等。

瑞士洛桑联邦理工学院机器人研究的整体风格就是小而精,学校拓展了非常多具体的研究方向和团队。

雷峰网:工业机器人四大家族之一的ABB也诞生于瑞士,您多次提名和获得该校的ABB奖,这对您后来的创业方向有什么影响?

李淼:ABB的总部在瑞士,与瑞士洛桑联邦理工学院有很多合作,ABB在学校里设立了的一个奖项(Asea Brown Boveri Ltd. ),每两年颁布一次,奖励奖励能源、自动化、电信等各个领域的原创科学工作,每次只有一个获奖名额,竞争非常激烈。

我凭借研发的复杂物体灵巧操作的鲁棒性算法以及成功应用于现实世界的机器人操作问题获得了2018年的奖项(论文:《Dynamic Grasp Adaptation -- From Humans To Robots》),同时我也是唯一的华人获得者。

以往的机器人研究中开发了大量的算法,但是并不能很好地解决实际问题,而我的这项研究第一次成功地应用于现实世界的机器人操作问题,尤其在机器人抓取、操作方面。

2016年我离开瑞士洛桑联邦理工学院后之后,发觉在机器人领域的很多研究成果仍旧很难推进到实际应用环节,人们对机器人的抓取和操作存在很多误解,所以我决定回国创办一家公司,将机器人技术推广到实际应用场景之中。

我回国后的创业团队依旧延续了对这项技术的探索,将其应用在物流、药房等场景的抓取、操作中,不断打磨解决方案。

雷峰网:2016年您回国创业,从事机器人抓取与智能控制相关应用的研究。为什么决定回国创业?

李淼:最开始回来时我还是一个fresh PHD,对行业的认知还有限,尝试为抓取的算法找到合适的落地场景,从物流、工业到医疗场景都进行了落地尝试,最后聚焦到医疗场景。

这时候我们发现,一个机器人产品不仅仅需要有抓取技术,还需要有很多辅助的硬件设配相配合,慢慢就形成了综合的解决方案。

2017年我来到武汉大学工作后,前期的这些工作也间接影响了我在学校里的研究方向,使我更加关注机器人的落地应用。

雷峰网:早在2022年,您与港中文的陈翡教授就合作发表过一篇烹饪机器人的论文《Robot Cooking With Stir-Fry: Bimanual Non-PrehensileManipulation of Semi-Fluid Objects》,这篇论文的关注角度与孙宇教授此前发布在IJAIRR期刊上的《 Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability》一文有哪些不同?您认为在烹饪场景中机器人技术还有哪些值得探索的方向?

李淼:在厨房这个场景中,对机器人的要求是最综合的,不论是精细的运动,还是更高维度的规划,以及对不同模块的理解,烹饪场景都是最丰富的。

甚至在其他场景中鲜少用到的味觉和嗅觉,烹饪场景中也有涉及。

机器人在烹饪场景的工作可以分为两个大的逻辑,一是上层的任务规划,二是底层的动作规划。我和陈翡教授的合作更多是动作层面的规划,孙宇教授的研究则是关于任务层面的规划。

要将上层的任务规划和底层的动作规划打通,还需要一个中间层 middle layer,也可以叫做胶水层。

在当前的研究领域,针对中间层架构的深入探究尚未达到预期的成熟度。

无论是采用规划领域定义语言(Planning Domain Definition Language, PDDL)以形式化地描述和连接自动化规划任务,还是依赖于基于规则的专家系统进行决策支持,亦或是利用神经网络构建的专家系统,这些方法在实现高效、可靠的中间层处理能力方面均显示出了一定的局限性。

这些技术在处理动态变化的环境、提升决策的透明度和解释性、以及增强系统的泛化能力等方面仍面临诸多挑战。

雷峰网:在您对机器人领域的研究中,也融合了机器视觉、深度学习等不同学科知识,如何看待机器人研究中跨学科合作的意义?

李淼:机器人研究可以大体分为四块:设计(具身)、感知、规划、控制。

我们从感知的角度来看,当机器人需要获取视觉信息时,就需要视觉传感器的配合;机器人需要获取触觉信息时,就需要触觉传感器的配合,看起来似乎是多学科交叉融合的研究。

但是我们从当下大模型的视角或数据驱动的视角来看,这些东西本身就是一体的。

不论是具身层面还是感知层面,机器人都是多模态的。机器人的外观既可以是人形,也可以是狗形;机器人的获取的信息既可以是视觉信息,也可以是触觉信息。我们可以将这些内容都看作是机器人研究的一部分。


02 当机器人遇上大模型

雷峰网:大模型技术的出现为机器人研究带来了巨大的影响。在您的研究中对这项技术进行了哪些应用?

李淼:在我和业界的合作中,已经开始尝试将大模型技术应用在家庭服务机器人的研发上。

以扫地机为例,在扫地机的感知中,我们利用大模型进行数据生成,合成仿真数据以提升真实数据的不足;同时又将逻辑推理融入感知中,基于本身的语义地图,,让扫地机更智能地进行运动判断,避免线材、杂物等障碍物的干扰 ;

在清扫报告部分,我们利用大模型生成清扫报告, 同时允许用户进行报告中内容的自定义选项添加,从而更全面的了解家庭情况。

在学校的研究里我们还没有用到真实的大模型,但是也已经开始向这方面的研究靠近,比如扩散模型(Diffusion Policy)和手术机器人动作生产策略相结合、大模型和医疗影像的结合等等。

我在与团队成员交流时,一直强调我们要以大模型的视角来看待一切机器人的问题,无论是算法研究还是其他各类工作,如果和大模型不相关,也许5年之内就会被淘汰。

以前我们做的那些工作,现在从大模型的视角来看,所设计的模块一定要足够大,将其建成“data in、 data out” 的形式,只要输入不同模态的数据,就能得到想要的结果。

举一个例子,我的博士论文做的是机器人抓取,主要任务是消除抓取过程中的不确定性。我当时的做法是选择在机器人的规划层和执行层分别处理不确定性。

简单来讲,在机器人抓取一个杯子的过程中,规划层可能会出现视觉误差,无法保证手指准确地抓到杯子上,执行层可能会出现重量误差,无法保证机器人为杯子施加一个合适的力。

所以我将抓取这个杯子过程中存在的不确定性分配到不同的环节,再分别处理。

和机器人不同的是,人在拿去一个杯子时并不会区分规划层还是执行层,二者之间是并行的。

我们将这两个环节合并到一起,就是现在所谓的多模态,数据变得更加充沛,无法对其进行特征的抽取,就只能将其转变为大模型的思路来解决,即输入所有的数据,让大模型自动理解这项任务,将规划和执行融合到一起,输出一个我们想要的结论。

雷峰网:机器人智能控制这一领域当前的发展趋势如何?

李淼:机器人控制的发展最初是基于传统的示教器示教;后来发展为模仿学习,从点对点的模仿学习逐渐升级到利用生成模型来做模仿学习;再到后期又发展为强化学习,只要给定一个目标,设置reward function(奖励函数),机器人即可完成任务。

随着任务越来越复杂,设置reward function时需要满足更多的条件,就逐渐变成的大模型。

当机器人对力的诉求、视觉的诉求、触觉的诉求等不同模态有人融入其中,就演变为多模态、大模型的发展趋势。

这个发展思路也存在缺点,就是随着对数据要求的增加,大模型会变得越来越复杂,需要更多的参数。

事实上,我们追求的应该是小参数的计算,也许200个参数就已经是个不小的数目。

但大模型时代往往都是数十亿、数百亿甚至数千亿级别的参数,这对芯片的算力有很大的要求,尤其是需要在毫秒级得到计算结果的情况下。

因此,未来需要“端、边、云”(端:物联网中的各种设备、传感器、智能硬件等;边:网络边缘、移动边缘、物联网边缘等;云:云计算、云存储、云应用等领域)三者相协同,将大模型部署在云上,在单侧部署时只解决单侧的局部问题。

例如在人形机器人走路的例子中,大家的目光都聚焦在如何让机器人走地稳这个问题上,但是人形机器人从A地到B的长周期导航,目前仍无法解决,我们可以将这个概念具体化:

端(设备):机器人的传感器和控制系统可以直接在机器人本体上进行一些简单的处理,比如即时调整步伐以保持平衡。

边(边缘计算):对于更复杂的决策,如避开障碍物或规划路径,可以在机器人附近的边缘计算设备上进行。这些设备可以更快地处理数据,减少延迟,并减轻云端的计算负担。

云(云计算):对于需要大量计算资源的任务,如长时间的导航规划,可以在云端进行。云端的强大计算能力可以用来处理和分析大量的数据,生成详细的导航计划,并将其发送回机器人。

在这个例子中,边缘计算的作用是处理那些需要较快响应但又不需要云端巨大计算资源的任务。通过这种方式,可以确保机器人在执行长周期导航任务时,既能保持较低的延迟,又能利用云端的强大计算能力进行复杂决策的制定。因此人形机器人长周期导航问题,可以通过“端、边、云”三者协同的方式来解决。

雷峰网:您的研究团队未来一段时间的研究方向是什么?会侧重哪方面的技术探索?

李淼:主要还是围绕机器人的抓取和灵巧操作,以及相关的行业应用做研究。

机器人行业的从业者们以往关注的更多是表层的应用,比如看到现实中有人用手去抓东西,于是就让机器人来做这项工作,取代人进行体力劳动。

然而,从实际情况而言,我们观察了很多不同行业,例如在介入手术、脑外科手术等应用场景中,需要人手能够完成更加灵巧的操作。

这些灵巧的操作如何用机器人来实现?其中涉及到哪些具体的技术?都是我们未来关注的重点。

我们会持续挖掘这些以往不易被发现的场景,开发适应场景的相关技术。

但未来这些技术是否能够在对应的场景中真正实现产业化,还是个未知数。

我曾经评估过脑动脉瘤手术这个场景,这项手术的成功率仅为50%,对医生的操作经验要求非常高,也许20年内都无法实现全自动手术机器人的产业化。

但我依然认为这项工作对全人类来说是具有长期价值的。

我的团队目前已经开始进行相关的研究工作,例如触觉传感器的研发。在脑动脉瘤手术中,触觉传感器既要检测法向力和切向力,又要应对极端环境下的操作。

因此,我们要将机器人的设计、感知、规划、控制等各个环节打通,用大模型的方式将这些场景模拟一遍,才能推动研究。

雷峰网:从您在工业界的经验来看,机器人从技术研发到场景落地的过程中存在哪些难题?

李淼:目前最大的难题是大模型的核心规律scaling law(标准律),即很难在机器人方面进行创新,尤其是在工业场景下,很难达到规模化的程度,这也是所有机器人创业公司面临的共性问题。

也许做核心零部件、电机、减速器的公司活得还不错,可一旦涉及到做具体的机器人产品,不论是六轴机器人、四轴机器人或是并联机器人,销量和销售额都不会很高。

机器人行业甚至至今都没有出现一款统一的芯片,又何谈规模化。

这意味着,机器人本身或许就不具备一个统一的形态。

我认为机器人虽然叫这个名字,但不能将它完全等效为一个人形机器人,如果站在生物的角度来看,其实有更多不同形态的生物能够更好地解决问题,比如人的弹跳能力不是最好的,跑动速度不是最快的,甚至还不会飞,所以人形形态并不是机器人最终的选择。

抛开具身这个层面,我们也要看机器人的智能层面能否得到很大的提升,只有通过智能层面驱动其他不同智能产品的迭代,才能解决机器人行业的共性问题。

例如,智能家居系统可以通过集成更智能的机器人技术来提供更个性化的服务;自动驾驶汽车可以通过机器人的感知和决策技术来提高安全性和效率;无人机可以通过机器人的导航和控制技术来进行更复杂的任务等等。(欢迎添加微信icedaguniang,交流认知,互通有无。)

GAIR live 圆桌预告

4月8日,北京时间20:00-22:00,雷峰网将举办主题为「大模型时代,机器人的技术革新与场景落地」的线上圆桌论坛。

本次论坛嘉宾有,南佛罗里达大学孙宇教授、武汉大学李淼教授、南方科技大学张巍教授、优必选科技庞建新博士。

“全球人工智能与机器人大会”(GAIR)始于2016年雷峰网与中国计算机学会(CCF)合作创立的 CCF-GAIR 大会,旨在打造人工智能浪潮下,连接学术界、产业界、投资界的新平台,而雷峰网“连接三界”的全新定位也在此大会上得以确立。

经过几年发展,GAIR大会已成为行业标杆,是目前为止粤港澳大湾区人工智能领域规模最大、规格最高、跨界最广的学术、工业和投资领域盛会。

GAIR Live 作为雷峰网旗下视频直播品牌,旨在输出新鲜、深度、原创的大咖访谈与对话内容,打造辐射产、学、研、投的特色线上平台。

大模型与机器人相关资料

1.《对话南佛罗里达大学孙宇教授:当大语言模型用于机器人任务规划丨IJAIRR》

2.论文:Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability

IJAIRR正在邀约论文和专题

《国际人工智能与机器人研究期刊》(International Journal of Artificial Intelligence and Robotics Research,简称IJAIRR),是由新加坡GAIR研究院与世界科技出版社联合出版的国际学术期刊。

作为全球首本专注于人工智能(AI)、机器人技术(Robotics)以及基础科学交叉研究(Research)的期刊,IJAIRR致力于成为AI与机器人领域研究的权威发布平台。

IJAIRR欢迎各类研究论文、评论文章、短篇论文、书评以及专题(Special Issue)形式的投稿。

我们特别关注那些在顶级AI会议上发表并现场展示,但缺乏长期沉淀平台的优秀论文。为了给这些论文及其作者提供一个更广泛的发表和推广渠道,IJAIRR现正积极邀约相关论文投稿。

如果您在本领域顶级会议上发表的文章(或即将发表)不超过一年,我们将协助您稍作修改后在IJAIRR期刊上发表。

如果您领导的团队在顶级会议上有多篇论文发表,并希望在IJAIRR上围绕特定主题策划一个专题(Special Issue),我们诚挚邀请您深入讨论合作事宜。

如果您是顶级会议的组织者,并有意与IJAIRR合作,针对特定会议策划一个专题(Special Issue),我们也期待与您具体商讨合作细节。

IJAIRR期待与您携手,共同推动人工智能与机器人研究的发展。图片

联系人:IJAIRR创刊主编朱晓蕊博士,xiaorui_zhu@gair.sg

关于期刊创刊主编等更多信息,可点击https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA

关于雷峰网、GAIR大会、GAIR研究院(期刊和在线社区)的详细介绍,请阅读朱晓蕊教授的专访:https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw

IJAIRR期刊的主页链接为:https://gairdao.com/journals/ijairr

]]>
机器人 //m.drvow.com/category/robot/XOJ2fZIntuyEO0Br.html#comments Fri, 29 Mar 2024 13:21:00 +0800
从2024 AWE 看智能清洁家电的「冰与火」 //m.drvow.com/category/robot/NUBtEW6yn6h7RrcA.html 3月中旬,一年一度的中国家电及消费电子博览会(AWE)如期而至。成百上千家企业携产品亮相上海浦东新国际博览中心,向与会者展示自家的新技术、新功能。现场摩肩接踵,热闹非凡。

一个颇有意思的点是,传统白电与智能清洁家电分属于不同的展馆 ,隔街相望。

家电巨头们直接包下半个场馆作为展区,宣传产品和技术,吸引一大片游客驻足。相比较前者,智能清洁家电企业更加务实,许多企业直接将自家展台变成直播间,邀请主播和达人来探展、带货。

从这个细节不难看出,穿越过产业周期的白电企业,在面临市场波动时,显示出了极强的韧性。而智能清洁家电企业在过去几年时间里,虽然吃到了品类红利,实现快速增长,但整体规模距离白电企业还有一定距离,在经历产业周期调整时,势必会受到影响。

不少从业者告诉雷峰网,这一届AWE实际上没有什么新鲜产品,原本被寄予厚望的清洁家电,也偃旗息鼓,风光不再。“已经有几家智能清洁家电创业公司被并购了,很多公司都过得极为艰难”。甚至有人直言“智能清洁家电已经跌入谷底”。

但凡事皆有例外,在市场低迷甚至遇冷的时候,行业中总有那么几家公司异军突起,与市场大盘表现格格不入。

比如追觅科技,在过去几年时间里市场份额不降反升,营收也取得了不错的增长。

2019年至2023年,追觅科技近5年复合年增长率超过100%,并在2023年一举实现提效、高端化、提升市占率三个目标,率先打破行业“不可能三角难题”。其中在2023年,追觅科技国际区业务同比增长120%,双11全渠道总销售额超21亿元,同比增长100%。

从2020到2022年,三年时间里,追觅整体业绩增长10倍,自主品牌业绩增长20倍,成为智能清洁赛道行业Top品牌,产品覆盖中国、美国、德国、日本等100余个国家和地区。 

智能清洁家电市场真的熄火了吗?

从整体市场看,这两年确实增速在放缓,但追觅科技的逆势增长从侧面回应了这个问题:在同一个市场中,有企业兴,有企业落,这并不关乎赛道的冷与热,而在于企业本身是否有足够的韧性和柔性,来应对市场的波动起伏,进而穿越产业周期,就像那些身经百战存活下来的家电巨头一样——“任他风浪起,稳坐钓鱼台”。

在面临市场大考的时候,追觅科技或许不是那个成绩最好的学生,但逆势而上的业绩足以说明,其已经具备应对市场变化的能力,并形成了适合自身的独特发展路线。

资本市场遇冷,智能清洁家电破局

从某种程度上看,智能清洁家电行业肇始于消费升级这一浪潮,与传统白电的发展逻辑有些微不同:传统白电行业属于“供给-需求”驱动,虽然也踩中了过去数十年从无到有的消费浪潮,吃到市场红利,但在企业发展路径上,这些企业并不依赖于资本的强力推动。

很多白电巨头一开始都是外贸起家,然后一点点开辟市场,赚得利润之后投入再生产、再扩张,从0到1,从1到10,再从10到100,形成一个稳定的增长飞轮。

智能清洁家电企业的发展路径,则要激进得多——得益于资本市场的火热,以及线上电商平台对于线下零售的革命,智能清洁家电企业在初期就能拿到不菲的投资,用于扩大生产,并通过广告投流触达消费者,快速抢占市场份额。

这种发展路径能够很快造就一家独角兽,大大缩短企业“从0到1再到10”的成长周期,但后遗症也非常明显:揠苗助长的结果是秧苗并没有汲取足够多的养分来茁壮身体,根基并不牢固,以至于风吹树倒。

当一家公司,过度依赖某种资源时,最终会被这类资源反噬。

过去几年,部分创业公司在资本的加持下大肆扩张,短期内迅速崛起,取得不错的效果。但在高速发展过程中,搭上资本快车的部分公司并没有掉过头来复盘短期成功的经验,其飞速扩张所产生的问题也被短暂的繁荣掩盖, “能收一时之效,却无百年之功”。

坦白来说,这种激进扩张策略并非完全不可取,前期依赖资本进行市场拓展往往最直接有效,类似成功的案例并不少见,比如滴滴、美团等等。然而与这类互联网平台不同的是,智能清洁家电本身属于硬件行业,边际成本远高于平台型企业,并且产业链更长、组织结构也更复杂,跨部门协同壁垒极高。因此,智能清洁家电企业在借力资本高举高打之后,必然需要及时查漏补缺,以克服“木桶效应”。

当下,智能清洁家电的增长确乎遇上了瓶颈。一方面,主要市场消费群体已基本覆盖,智能清洁家电本身的消费弹性较大,加之存在更换周期,复购的频率比前两年较低;另一方面,消费市场亟待复苏,短期国内市场需求的增量并不明显。

对资本的路径依赖,使得部分智能清洁家电公司很难摆脱困境;而消费市场的不确定性,又给企业们带来了生存压力。内外因素叠加之下,创业公司维持正向经营已属不易,如何进一步提高渗透率,继续保持合理的增长,成为智能清洁家电企业的当务之急。而像追觅科技这样能够实现逆势增长的智能清洁家电企业,并不多见。

那么,追觅科技取得增长的秘密到底是什么?

 追觅科技增长方法论:以技术创新引领发展新篇章

“追觅科技这种高举高打的模式是否可持续?”

这是很多业内人士心中的疑问。毕竟追觅科技在过去几年时间里,投入了大量的资源用于研发、扩品、营销,必然会带来极高的经营成本,这些成本是否都转化为了能够让追觅科技自身造血且保持增长飞轮的收益?很多人都想知道,即便追觅科技想要“哪吒闹海”,又从哪里搞来那么多风火轮?

不妨从结果去倒推一下追觅科技方法论的可行性。

根据奥维云网数据,2023 年中国线上市场扫地机器人销额/ 销量占比TOP5 品牌中,追觅科技销额同比增长116%,销量同比增长83%,双双位居第一。在另一家机构中怡康的监测中,追觅科技在2023年10月大清洁电器市场占有率(电商全景)排名中,位居大清洁电器市场第一。在海外业绩上,2023年追觅科技海外业务同比增长120%。

在营收方面,2023年追觅科技持续盈利,5年复合年增长率超过100%。从结果看,追觅科技的策略现阶段被证明是行之有效的。

据雷峰网了解,追觅科技的策略共15个字:“技术全包围+大胆创新+全价位段布局”。

技术全包围,即通过将行业里最好的技术做到更好,做到比别人更进一步,通过持续的技术创新和产品升级,打造同价位段中最好的产品。

大胆创新,即做到“人无我有”,在深度用户洞察的基础上,打造更具革新价值的、能真正满足消费者需求的产品,通过高研发投入打造更具竞争力的产品,推动市场渗透率和普及率的提升。

全价位段布局,即通过家族化产品布局,将尖端技术应用到不同价格段的产品中。通过技术下放和成本控制,推动智能清洁产品的大众化普及,实现尖端技术普惠。

该策略体现在业务中,就是通过技术创新,一方面革新产品功能,解决场景痛点,提高用户体验;一方面降低成本,实现技术普惠。

比如,在AWE现场,追觅科技重点宣传了三款产品,分别是带有仿生“双”机械臂的尖端旗舰扫地机器人X40系列、Pocket高速造型吹风机P10,以及正在研发的“扫地机器人+洗地机+吸尘器+基站”多合一产品。

以X40系列扫地机器人为例,为了解决贴边清扫痛点,追觅科技自2023年5月推出仿生机械臂技术,并在最新的X40系列中搭载上拖布外扩及边刷外扩,当扫地机器人识别到墙边、桌腿、床边等边角地带时,扫地机器人会通过仿生机械臂将拖布及边刷外扩,模仿人手的清洁习惯,“伸手”将边角的污渍擦净,实现<0.1cm的贴边距离清洁。目前该技术已下放到大众旗舰价位段的扫地机器人S30 Pro Ultra产品中,既解决消费者需求痛点,又带来科技普惠。

追觅Pocket高速造型吹风机则采用了创新柔性折叠技术,机身可以实现0-180°自由弯折,并通过搭配不同的风嘴配件,可实现造型和速干需求的结合,例如当卷发棒用。同时在内部设计上,Pocket将马达从传统的手柄处上移,让出风口、电机、进风口呈直线分布,实现直线出风,风力达70m/s,做到“形态折叠、风力不折叠”。同时,机身重量只有300g,不占行李空间,方便携带,适合旅游、出差等场景。 

类似的创新还有全嵌入式超薄上下水扫地机、扫地机洗地机吸尘器基站多合一等等,这些技术创新成为追觅科技逆势增长的根本原因。

在技术创新之外,追觅科技同时做了组织管理变革,比如重新梳理了供应链,减少了各类流程成本;又比如,依托高速数字马达和智能算法搭建起全新的研发平台和体系,实现技术复用,从而针对场景做出差异化产品,快速进入新兴赛道,打造基于“高速数字马达+智能算法”的业务生态。

 表面上看,追觅科技的业绩增长似乎是一个偶然的例外。但实际上,这是以“技术创新+组织变革”为双重驱动力的必然结果。换言之,高举高打的追觅科技,在取得增长之后马上自我检验,已经具备增长的韧性和柔性,并在市场中站稳了脚跟。

 当智能清洁家电穿越周期,新的增长点正在涌现

如果用一个字形容当前的智能清洁家电行业,则莫过于“卷”。

一边是市场需求增速放缓,更新换代周期拉长;一边是大量跨界玩家涌入,分化市场。整个智能清洁家电市场成熟度日渐提高,从最早的品类红利到拼技术,再到卷成本,呈现出同质化竞争的趋势。

在这个背景下,企业们纷纷开始寻求突破瓶颈的办法,堪称“八仙过海,各显神通”。总的来说,主要有以下三种:

  • 扩品

不少智能清洁家电企业开始利用自身的核心技术,开始做品类扩张。比如追觅科技重点发力个护领域中的吹风机,添可也推出了吹风机新品,石头也推出了洗地机等等。

  • 低成本方案

通过技术创新,将研发成本降低,从而把更好的技术方案下放到低价格段,让产品更具竞争力。典型如追觅科技的X系列,石头的p10系列。

  • 出海

在国内需求亟待复苏的背景下,多数智能清洁家电公司将增长放在了出海上,石头科技吃到了出海的红利,而科沃斯、云鲸等也在积极布局海外业务。至于追觅科技,从一开始就目标海外市场,取得了不错的业绩,也将持续巩固自身在海外市场的核心优势,拓展新兴市场获得更大增长。

 这三种方法追觅科技都在布局,但追觅科技认为,智能清洁家电还没有到达行业内竞争市场的阶段,不一定非要卷成本、打价格战,把市场做得更大才是关键。因为其渗透率还能进一步提高,原因在于——

“未来几年,消费升级将持续深化,需求也会不断增长。家庭清洁属于频次高、稳定的刚性需求,并且伴随着人口结构的变化,智能化的清洁产品必然成为主流。”

智能清洁家电行业的发展曲线是波浪式上升的过程,即在一个上升周期结束后,会出现瓶颈期,直到技术突破或产品创新带来新的增长点,市场又快速上升,直至下一个周期。

就像洗衣机一样,从直筒式洗衣机到滚筒式洗衣机,再到洗烘一体机,每一次技术和产品的创新,都带来了行业新的增长,同时也在解决消费者需求痛点,带来新的体验。

这其中的关口在于,如何以技术创新来驱动消费增长,即通过供给来影响需求,促进消费。

在过去几年时间里,追觅科技做了许多创新,比如机械臂外扩、抹布抬升、基站自清洁等等。从市场反馈看,这些创新为消费者所buy in,这也是追觅科技取得逆势增长的原因所在。

因此,追觅科技的路线是,坚持走高端,同时布局全价格体系,以创新为驱动力,推动市场发展,并实现业绩增长。

从整个智能清洁家电行业来看,目前市场处于一个上升周期后的瓶颈期,虽然短期遇冷,但如果把目光放得更长远一点,这个市场仍有很大的发展潜力。处于这个周期的企业们,需要做的是厉兵秣马,等到行业上升至周期临界点,一飞冲天。

 总结

传统白电在市场上的渗透,从0到1再到如今家家必备,经历了长达数十年的成长期。如今的智能清洁家电厂商,就像是数十年前的白电厂商,也正处于行业增长期,正一点点地提高渗透率。在这条路上,有人放弃,选择中途退出;有人勇敢应对挑战,并保持乐观,积极向上,比如追觅科技。

如果当下是智能清洁家电的肃杀时刻,那么冬天来了,春天还会远吗?雷峰网

]]>
机器人 //m.drvow.com/category/robot/NUBtEW6yn6h7RrcA.html#comments Thu, 28 Mar 2024 09:54:00 +0800
浙江人形机器人创新中心发布通用人形机器人「领航者1号」 //m.drvow.com/category/robot/vg9QTmKSaVBgpuKd.html 3月27日,浙江人形机器人创新中心发布通用人形机器人「领航者1号」 。据了解,该团队核心成员主要来自浙江大学,并且在人形机器人领域积累了18年的技术,有着丰富的研发经验和技术纵深。

2006年,该团队研制出小型仿人足球机器人,实现多机协作踢足球,并连续十多年获得全国冠军,四次获得RoboCup机器人世界杯仿人组亚军。


2008-2011年,该团队研发出乒乓球对打仿人机器人,可实现145个回合的人机对打,并能够适应正反拍、旋转球,获得浙江省科学技术奖一等奖。此后,该团队开始研究新一代室内外快速鲁棒行走人形机器人,可适应多种地形、推力扰动、动态避障等。


2023年10月的北京测试中,该团队的机器人是“唯一一个”室外连续通过多种地形并跨越沟壑的产品。

该团队告诉雷峰网,此次发布的「领航者1号」,在浙江大学人形机器人“悟空4.0”的基础上进行了全新的升级,创新性的提出了机理控制、模仿学习与强化学习融合的方法。

具体看来,「领航者1号」身高150cm,体重50kg,拥有39个自由度,单臂负载4kg。搭载彩色相机4个、RGBD相机2个、IMU2个,边缘算力275 TOPs。整机系统系完全自主研发,硬件端则搭载了自研的新型行星减速器、轻量化仿人机械臂和多自由度灵巧手,其中多自由度灵巧手有15个手指关节,6个主动自由度,指尖力10N,单手重量600g,关节速度150度/秒。

算法端,「领航者1号」采⽤模拟学习同⾮线性运动控制紧密融合的⽅式,机器人在对⼈的动作进⾏快速学习的同时考虑机器⼈的执⾏能⼒,从而打通了⼈的动作映射到实物的整条链路并且可泛化,赋予机器人动作类人学习的能力。

同时,「领航者1号」构建了无模型的端到端伺服控制,不依赖大模型,不依赖物体模型,也可动态适应环境操作,摆脱了对云端算力的依赖,让算法的本地部署更便捷。目前,部分算法已经在头部工业企业中落地应用并得到了商业上的认可。

在机器人的臂腿协同控制上,「领航者1号」也尝试采用机理建模与强化学习相结合的方式,保证对不同环境的适应和执行的可靠,已经初步实现了机器人的全身运控。雷峰网

]]>
机器人 //m.drvow.com/category/robot/vg9QTmKSaVBgpuKd.html#comments Wed, 27 Mar 2024 20:30:00 +0800
四足机器人:8位玩家的进击之路 //m.drvow.com/category/robot/WmVr2UAoylo5CF8E.html 2023年2月,工信部等十七部门印发《“机器人+”应用行动实施方案》,提出以产品创新和场景推广为着力点,分类施策拓展机器人应用深度和广度。一时间,机器人行业迎来升级换代、丰富应用的落地窗口期。

作为机器人领域里的重要分支,四足机器人赛道在近几年里风起云涌,前有各大玩家纷纷推出的系列吸睛新品,后有一众玩家成功融资的消息。例如,宇树科技于2024年春节前完成近10亿元融资的讯息火速刷屏。

四足机器人并非新兴事物,已经沉淀了几十年的研发历史。第一次将四足机器人带入公众视野的,是来自美国的波士顿动力,能走能跑、灵活稳定的机械狗Spot一炮而红,一举惊艳了众人。

随后,专注四足机器人的中国企业也开始出现,由实验室走向现实场景的万里长征之路就此启程。

在众多企业玩家里,既有人蛰伏深耕近十年之久,也有人在近些年里因势而为、乘势而上,抓住机遇一举躬身入局。他们的存在,为四足机器人的发展与落地带来更多想象力与可能性。

雷峰网特此梳理了国内四足机器人赛道里的8位主要企业玩家,记录下他们的奋斗足迹。

1、宇树科技——王兴兴

出生于制造业重镇(宁波)的王兴兴,从小就很喜欢捣鼓机械,创业做机器狗也是一个一直盘旋在他头上不得不去做的事。

王兴兴还在上海大学读研时,就独立自主研发了第一款产品Xdog,也是全球首款小型高性能低成本四足机器人产品,性能方面足以比肩全球学术圈高水准。

事实上,早在2013年硕士刚入学时,王兴兴就想到了机器狗方案,一度准备辍学创业。但考虑到时机尚不成熟,最终按耐不动。

Xdog产品的推出,虽然让王兴兴抱得大奖归,但却未能一炮而红,没有投资人愿意投,王兴兴的创业计划再次搁浅。

2016年6月,王兴兴毕业后去了大疆,负责云台算法。未曾想,王兴兴上传在YouTube上的“Xdog”视频经外媒报道后,在机器人圈里小火了一把。一时间不少人抛出了橄榄枝,王兴兴预感机遇来了,仅入职大疆两个月就果断出来单干,成立了宇树科技。

在接受雷峰网采访时,王兴兴表示,宇树的第一款产品徕卡狗,在宇树成立一年后就做出来了,整个团队只有3个人。为了更好量产,又继续打磨了一年,直到2018年下半年才正式发布。

2020年,宇树发布Go2,才开始正式迈向消费端。现在最低版本售价控制在9000多元,基本上是全球最便宜的机器狗。

数年间,宇树科技从1人、3人团队成长为现在的数百人公司。2024年2月,宇树完成了B2轮近10亿元人民币的融资,本轮资方涉及美团、源码资本和金石资本,老股东深创投、中网投、容亿、敦鸿和米达均跟投。

宇树产品主要面向行业应用,如电力巡检、消防救援等落地场景。例如,宇树推出的面向行业应用的四足机器人B2,目前已广泛应用于几十个项目,包括国家能源集团某电厂巡检机器狗项目等。

2、云深处科技——朱秋国

朱秋国有着双重身份,一面是浙大教授,另一面是云深处创始人。

朱秋国本科与研究生阶段均就读于浙江大学,师从褚健教授和熊蓉教授,硕博期间主要研究领域为双足仿生机器人。期间,他还参与了双足兵乓机器人“悟空”的研制工作。这一经历也激发了朱对机器人研究的兴致,毕业后留校继续研究仿生机器人。

2017年,朱秋国成立了云深处科技,依托浙大优渥的机器人资源,背靠浙大实验室与团队,不断打磨和沉淀四足机器人技术;此外,借助强大的浙大校友网络,云深处不断推广产品、传播品牌,一步步提高影响力。

据了解,云深处的核心团队,包括CEO朱秋国、CTO李超等人在内,最早成立了南江机器人公司,2015年开始搞四足机器人。直到2017年,南江机器人被卖给了上市公司华丽家族之后,朱秋国、李超等人才成立了云深处。

2018年,云深处就推出了国内首个完成自主导航和智能交互的机器狗绝影Pro。“绝影”一名的来由,是借用了《三国演义》中曹操的坐骑“云影”。

随后,云深处对产品进行了多次迭代升级。从初代绝影发展到了绝影X30,针对电力巡检、消防救援、煤矿勘探等领域应用不断打磨产品,同时,还推出了可二次开发的灵巧型智能机器狗绝影Lite2,将视野转向教育科研。

3、蔚蓝智能科技——刘维超

刘维超就读于淮海工学院计算机专业,大一就获得学校专为他设立的机器人实验室。2008年,毕业后的刘维超选择留校任教,期间曾受邀前往德国深造。

2011年,刘回国后开启创业之旅,成立了一家物联网公司;2014年,在南京工业大学科技园成立创业型科技公司“螃蟹实验室”。

机器人作为刘的科研起点,最后也成了他创业路途的落点。2019年,刘创立了南京蔚蓝智能科技有限公司,专注于四足机器人,将研制的产品命名为阿尔法机器狗(AlphaDog),专为家庭服务和企业设计。

2023年,蔚蓝智能完成过亿元A1轮融资,由国资市场化基金领投,老股东追投。

在产品落地上,刘维超坚持家庭陪伴路径,“同行基本上仍然在做行业应用、二次开发,面向小众的群体,我们是一个面向消费市场、面向家庭陪伴的BabyAlpha,在全球范围内这是一个独特的存在。”目前,产品主要应用在家庭场景中,负责安防监控、收发快递、老人看护和儿童教育。

4、哈崎机器人HachiBot——谌振宇


2019年,谌振宇在北京创办了哈崎机器人(HachiBot)并担任CEO。

回溯起来,谌振宇的工作履历堪称丰富。

2001年至2005年,谌振宇在百度任职,先后担任工程师和搜索部门的高级经理。

2010年,谌振宇以内部创业者身份加入去哪儿网,开创无线事业部,从零开始带领去哪儿网由PC端向无线端转型,开启了0TA市场的无线时代,也因此为业界所熟知。

2016年1月,谌振宇担任去哪儿网首席执行官。加入去哪儿网之前,谌还是抓虾网的首席技术官和联合创始人。

几乎一直都在创业的谌振宇,将自己的下一条赛道瞄准向了“机器人”,致力于打造陪伴型机器人。

哈崎机器人将产品命名为“铁汪汪”,在家庭场景中能实现全自主运动,最大亮点在于情感功能的实现,做到与人交互。

哈崎机器人坚持“做智能生命”,主打家庭陪伴的温情路线,“哈崎”取名也是源自电影《忠犬八公》里的忠诚小狗之名“Hachi”。

对此,谌振宇表示,“我们在进入机器人行业时,在思考机器人到底应该解决什么样的问题,除了能干活意外,我们还希望机器人能温暖大家,温暖社会”。换言之,哈崎机器人试图打造的是能满足人类陪伴需求的智能电子宠物。

5、逐际动力——张巍

张巍本科就读于中国科学技术大学自动化系,拥有普渡大学电气与计算机工程系博士学位。

2008至2017年,张巍一直在研究hybrid dynamic system(混杂动态系统),即如何使用系统控制机器人不同的运动。张由软件算法靠向了机器人。

2019年,张巍回国加入南方科技大学,此外,还任美国俄亥俄州立大学长聘教授,兼任加州大学伯克利分校博士后研究员。2021年,他与俄亥俄州立大学团队在美国率先用强化学习的方法,完成了人形双足机器人室内外的稳定行走。

2022年,张巍觉得技术成熟了,决定亲自下场入局,成立逐际动力LimX Dynamics。

张巍向雷峰网分析,足式机器人的关键核心在于“腿”,需要打造出全地形移动能力。这样既能覆盖轮式机器人的不足,同时又能绕开早已杀成一片红海的轮式机器人赛道。

为此,逐际动力主要做的是四轮足,兼顾软硬件,并采用感知方案来增强机器狗的稳定性,致力做“地面大疆”。

2023年逐际动力完成了天使轮、Pre-A轮融资,总金额近2亿元。天使轮有峰瑞资本、智数资本、明势资本和昆仲资本,Pre-A轮资本领投方为绿洲资本。

目前,逐际动力产品包括人形双足、四足机器人及相关软硬件解决方案,主打通用足式机器人,注重解决全地形移动能力,让机器人能够在各种复杂场景下移动自如。产品具体落地应用聚焦在工业巡检、物流配送、特种作业、家庭服务等2B和2C领域。

6、小米——小米实验室

2020年10月,小米机器人项目成立,“铁蛋”项目由小米手机部、小爱同学、小米相机部以及追觅科技共同研发。

很快,铁蛋的软件架构就迭代了四五次,很多功能也逐渐打磨成了面向消费者的产品级。短短的十个月时间里,团队就推出了机器狗铁蛋第一代。

据悉,CyberDog(铁蛋)的研发团队,既有从小米不同部门里抽调人员,也有自告奋勇参与的兴趣选手,还包括两位应届生。这支“东拼西凑”起来的队伍,2022年凭借着成功研制的“铁蛋”,拿下了小米年度百万美金技术大奖。

有从业者向雷峰网表示,在一代铁蛋的研制过程里,追觅主要帮忙组装成型,以及研制关节。但到了二代铁蛋,则完全由小米实验室自行独立研发。

最新仿生四足机器人——铁蛋二代,陪着雷军在2023年小米年度演讲上惊艳亮相。

在性能交互上,相较于一代有了显著提升,同时基于仿生与人性化的理念,产品外形上更接近一只杜宾犬,拥有流畅的金属肌肉线条。

产品在落地方面,会先造福有开发能力的机器人爱好者,不过,最终目标还是要走入家庭场景,对标真实的宠物狗,主打陪伴功能。

7、银弗科技INNFOS——闫巡戈、崔昊天、朱梓鸣

(图:从左至右依次为CTO崔昊天、CEO闫巡戈、COO朱梓鸣)

银弗科技联合创始人崔昊天,毕业于北京工业大学,多次在核心刊物发表论文,科研经历丰富。

大学期间,崔昊天带领团队制作的外骨骼式主从机器人在大学生挑战杯上斩获“特等奖”,打破了北工大的参赛历史记录,引起广泛关注。

2011年的全国大学生挑战杯之后,“90后”崔昊天认识了“80后”闫巡戈和“70后”朱梓鸣。彼时的朱和闫刚开始创业,极力邀请崔昊天加入。

至此,三人一拍即合。2011年,INNFOS成立研发团队。到了2014年,INNFOS正式成立公司。自成立以后,银弗科技就从最底层的电机设计、电机驱动、高精度编码器、柔性关节等方面进行创新与研发。

产品端上,考虑到关节是掣肘机器人发展的重要因素,INNFOS主要研发机器人的智能柔性执行器,做机器人的底层硬件技术设计研发。

2018年6月,INNFOS正式成为达闼旗下独立运营的子公司,达闼科技也对INNFOS SCA的研发生产给予极大支持。

8、鹏行智能——赵同阳

鹏行团队于2016年成立于深圳,成为小鹏汽车在“未来交通探索者”战略下的生态公司。

说起鹏行智能,绕不开的一个关键人物是赵同阳。

赵同阳本科毕业于株洲师范学院自动化控制专业。2012年毕业后,赵先创立安信可,负责物联网。

2016年,安信可业务稳定后,一直想做四足机器人的赵同阳认为时机到了,抱着赚到的第一桶金就再度创业开干。

据悉,赵同阳表示最初想做的是双足,但是难度太大,就转做四足。2016年成立了终极进化科技,但只有他一个光杆司令。于是,赵开始四处找人,最终组了个5人的小团队,几个人一直埋头干了三年多,才开始扩张。

2018年,成立智擎新创,第二年,赵又成立了Dogtix。

据了解,一直采用“小作坊”生产的赵同阳,与何小鹏偶然的一次沟通后,决定加入“鹏行智能”团队。

2020年,鹏行智能获得何小鹏及小鹏汽车投资,开启高速发展。

2021年,鹏行智能发布了智能机器马第三代原型机。机器马支持语音交互、人脸与声纹识别,可通过屏幕屏幕表达情感,还拥有独家的乘车驾驶系统和乘车配件,能满足小朋友的乘车需求。

2023年小鹏还推出全新自研的双足机器人PX5,其部分定位、控制技术均来自机器马,目前该产品仍处于工程机状态。

结语

为四足机器人而一往无前的中国玩家们,一同拾柴火焰高,让这一赛道始终热火朝天,推动着四足机器人从虚拟走向现实,从实验室走向大众。

目前,或许四足机器人离普通老百姓每天的日常生活还是比较遥远,面向消费端的应用落地还在摸索中,但四足机器人在电力巡检、消防侦察、工业巡检、建筑测绘等领域已经释放了强大的潜力,未来还有更多令人期待和兴奋的可能性。

据相关数据统计,预计2025年电力巡检、工业巡检、建筑测绘和勘测领域机器人市场规模超过850亿元,消防侦查和公共安全机器人市场规模超过700亿元。

不少人看好四足机器人的发展前景,但同时,也有人面对这波机器人热,保持了冷思考。

一方面四足机器人的控制系统复杂度较高,技术上仍有需要突破攻坚之处。另一方面,四足机器人的制造成本高昂,难以实现大规模量产,目前的应用落地尚未明朗。此外,如何让四足机器人更和谐地融入人类社会,也是一个重要挑战。

但无论如何,四足机器人已经在全力“奔跑”起来了。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/WmVr2UAoylo5CF8E.html#comments Fri, 22 Mar 2024 18:16:00 +0800
家用擦窗机器人市场亟待爆发,科沃斯窗宝持续引领行业 //m.drvow.com/category/robot/6RLjK57nf6AE4om6.html 3月12日,科沃斯在苏州举办了主题为“在一起,开创窗宝新时代”的活动。活动现场,科沃斯窗宝相关负责人介绍了窗宝品类的发展历史、核心技术发展现状,以及对行业未来发展的期望。同时,科沃斯也进行了擦窗类产品的测试,展示了当下擦窗机器人的优缺点,从而给业内公司产品改进提供了参考。

据了解,科沃斯从2011年发布首款窗宝5系至今,已经过13年的迭代和产品创新。2023年,科沃斯发布了w2系列,并于今年年初又发布了一款W1S产品,主打性价比,将价格下放到1500元左右,形成全面的价格体系。

从行业看,据销售渠道统计,2023年第四季度,擦窗机器人品类突然涌现了20多个品牌,整个行业已经有100余个品牌,销售量已经达到40多万台,其市场增长率在26%左右,高于同期的传统家电的增长。

科沃斯窗宝相关负责人表示,经过调研,消费者对擦窗机的需求痛点是清洁窗户以及安全,而阻碍消费者购买擦窗机的印务主要有三点:担心卡困跌落、价格高、清洁效果不好。

为了解决这些问题,科沃斯推出了全新的W2 pro。W2 pro搭载了一个便携基站,虽然基站本身已经不奇怪,但科沃斯首创将多项功能集合在一起,放到一个收纳盒子里,比如安全绳和电源线二合一,电池等等。其内置的移动电源,满电状态可以清扫65平米的窗户,不需要额外接线,便捷轻快。同时,基站本身带配重,有800N的吸附力保证安全性,低电量的时候还能保证30分钟的吸附力,以防止跌落。

此外,对于擦窗机器人贴边清洁的痛点,科沃斯W2 pro底部配置了四个圆形导向轮,通过内置的传感器以及自研的规划算法,在进行贴边清扫时,能够实时感知障碍物体,并帮助机器人避障或是防止跌落。

在现场,科沃斯还举办了现场测试,将行业主流产品进行对比。科沃斯相关测试工程师表示:产品测试主要围绕清洁效果、清洁效率、智能性、安全性等窗宝用户最关注的项目,测试形式包括清洁效果打分、无框玻璃清洁效果、高低台阶玻璃、低矮边框玻璃、玻璃缝隙、卡线、安全绳拉力测试、负重等。

测试结果表明,大部分窗宝产品清洁效果表现尚可,但在安全性上表现良莠不齐。企业需要强化产品安全性、适用性设计,提高消费者体验。具体到科沃斯,其最新的窗宝W1S以清洁效果79.94分、负重7千克、无框玻璃等测试全数通过。

科沃斯工程师表示,窗宝W系列产品上既有高可靠性设计,更有双向喷水、贴边清洁、重污清洁等窗宝必备能力,满足了主流消费者的窗玻璃等多立面清洁需求。

其他方面,科沃斯也已经在窗宝品类拥有 110多项专利,获得红点奖等20余项产品、设计奖项。相关数据显示,科沃斯擦窗机器人产品市占率位居前列。如今,擦窗机器人品类市场亟待爆发,科沃斯将发挥龙头作用,引领方向、制定标准,从而促进行业蓬勃发展。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/6RLjK57nf6AE4om6.html#comments Wed, 20 Mar 2024 17:25:00 +0800
科沃斯携新品亮相AWE,创新技术展现智慧清洁方案 //m.drvow.com/category/robot/DakyDcmWCeUKeKVE.html 3月14日至3月17日,2024年中国家电及消费电子博览会(下称“AWE”)在上海新国际博览中心举行。科沃斯集团旗下“科沃斯机器人”与“TINECO添可”携手亮相,为参展者呈现一场智能科技与创新生活的双重盛宴,展示生活新方式与新体验。

本次展会上,科沃斯带来了十款机器人产品,包括“首款恒贴边防缠绕全能扫拖专家”地宝T30 PRO、即将发布的高端旗舰地宝X2S与一站式家庭清洁中心地宝X2 COMBO等全能扫拖机器人。

地宝T30 PRO:边角清洁与毛发防缠绕新升级

长期以来,边角缝隙清理、毛发缠绕一直是家庭清理的痛点与难点。据介绍,科沃斯开年旗舰新品地宝T30 PRO,搭载TruEdge™灵隙™灵动恒贴边技术与Zero Tangle™灵缠™双梳齿防缠绕技术,对这些痛点进行了技术上的全面升级。

  • 高效清洁,轻松清扫常见边角

科沃斯地宝T30 PRO搭载无级悬停拖布盘,在启动后将自动伸出拖布盘,并始终保持拖布盘外扩,每个状态都可以悬停住,精准控制,时刻恒定贴边清扫,覆盖死角等难清洁区域。即便遇到障碍物,拖布盘也能根据障碍物的形态进行柔性伸缩,实现动态调节,不会硬碰硬撞弹回,确保拖布盘紧贴墙壁或障碍物边缘。

  • 创新设计,实现毛发零缠绕

毛发缠绕一直是一个清洁难题,清洁滚刷时往往非常脏,且清洁难度高。科沃斯经过近百万次实验自主研发,采用V字滚刷和双梳齿腔体的黄金空间搭配,使得毛发接触到滚刷时,能被理直理顺后直接吸入尘盒,从而有效解决毛发缠绕问题。相比部分扫地机采用刀割毛发以解决缠绕问题的方式,这一设计安全性更高。除此之外,V型滚刷紧贴地面,结合抗静电刷毛,将地面、地毯缝隙的灰尘、脏污一扫而净,清洁效率高达99.4%。

据了解,地宝T30于今年2月1日发布上市。当月科沃斯实现了线上市占率断层第一,份额为68.18%。在市占率与销量上,科沃斯始终占据扫地机器人行业第一梯队。

地宝X2 COMBO与地宝X2表现亮眼

除地宝T30 PRO外,高端旗舰地宝X2、地宝X2 COMBO也凭借其方形外观、超强清洁覆盖度和创新单品组合方式备受关注。地宝X2 COMBO将扫地、拖地、吸尘、自清洁等多功能集于一体,成为科沃斯首款一站式家庭清洁中心,带来覆盖全屋的完整家庭清洁解决方案。

现场还展出了即将上市的地宝X2S,升级后的YIKO语音2.0能做到自主理解模糊语音指令,并选择符合用户需求的功能来执行,开启全能扫拖机器人智能化新篇章。

作为全球领先的多品类机器人公司,科沃斯已将服务机器人应用场景不断扩展。展台现场,立面清洁窗宝、割草机器人、商用清洁机器人产品也赢得消费者驻足观看,取得不错的市场反响。

“智能科技,创享生活”,作为家电及消费电子领域的顶级展会之一的AWE,为各家品牌提供了展示创新成果的窗口。科沃斯所展出的全新机器人产品,体现了其“让机器人 服务每个人”的品牌使命。在未来,科沃斯将继续往更交互智能的方向延伸,进一步助推服务机器人行业向前发展。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/DakyDcmWCeUKeKVE.html#comments Fri, 15 Mar 2024 21:04:00 +0800
苹果合作商 mophie推出樱花限量版“三合一无线充” //m.drvow.com/category/robot/SweZW71J1BYblvDb.html 日前,苹果合作商 mophie推出了限量版的樱花“三合一无线充”,适配iPhone 15/14/13/12 系列 通过Qi 认证的无线充手机,以及 AirPods/AirPods Pro,和Apple watch 。

在外观方面,这款无线充采取了“樱花粉”的配色,以及三折设计,便于收纳与出行,适用于多种外出场景。配置上,这款无线充配备了一条USB-C to C 充电线、一个30W USB-C 快充充电器。

从产品细节看,无线充的中间采用了苹果MagSafe原装端子,可无缝对接苹果手机磁吸充电需求,最大无线充功率15W;左边则专门为AirPods 外壳设计的独特腔体,无线充电功率高达 5W;右边主要为iWatch充电,加装了独特的iWatch 原装模组, 支持3.5W 安全充电。

其他细节上,这款无线充搭配了一个用环保回收塑料制成的粉色收纳袋,更加便于收纳。

作为苹果长期战略合作伙伴,mophie先后为苹果设备打造出多款高质量安全快充配件,特别是 iPhone 不再配送充电器后,mophie 先后为 iPhone 量身定做了 20W PD 充电器、20W 1A1C 双口充电器、20W迷你充等多款快充。

关于 mophie®

mophie® 是电源领域的知名品牌,是一家屡获殊荣的设计商和制造商,致力于创新革新移动充电领域 (Stay Powerful®)。mophie®因其创新的移动解决方案而广受赞誉,是独具匠心的背夹电池的开发者。作为无线充电、便携式充电器、数据线和插墙适配器领域的创新者,mophie® 的产品以时尚和高性能著称,实现了硬件和设计的无缝整合。mophie® 的产品在 Apple、Best Buy、Verizon、AT&T 和 T-Mobile 商店以及其他主要零售商处均有销售。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/SweZW71J1BYblvDb.html#comments Wed, 06 Mar 2024 21:45:00 +0800
人形机器人|星动纪元开源端到端强化学习训练框架“Humanoid-Gym”,开启「sim-to-real」 新时代 //m.drvow.com/category/robot/cJo6GYgVkx8iQ9T7.html 2024年3月5日,具身智能与人形机器人公司星动纪元联合清华大学、上海期智研究院开源了人形机器人强化学习训练框架Humanoid-Gym。此举意在降低人形机器人算法的开发门槛,助力全球学界和业界的研究者们在人形机器人领域的创新工作。

雷峰网了解到,星动纪元于2023年8月在北京成立,由清华大学交叉信息研究院孵化,致力于具身智能以及人形通用机器人技术和产品的研发。创始人陈建宇是清华大学交叉信息研究院助理教授、博士生导师,同时也是清华大学特聘研究员、拥有10+年机器人和AI研发经验。

2024年1月份,星动纪元完成了超亿元天使轮融资,由联想创投领投,金鼎资本、世纪金源等跟投。此前,星动纪元已在人形机器人强化学习技术上取得多项突破,并在全球范围内首次通过端到端强化学习实现人形机器人野外雪地行走和上下楼梯。

这次开源的 Humanoid-Gym 框架,旨在通过精心设计的奖励函数以及域随机化技术, 显著简化人形机器人的训练以及实现 sim-to-real 转换的难度,从而解决由于人形机器人结构高度复杂性导致其在强化学习训练以及从模拟环境向真实世界迁移(即 sim-to-real transfer)的过程中遇到的挑战。

目前,该框架已在星动纪元旗下的两款机器人——小星(1.2米高)和小星max(1.65米高)上成功验证。感兴趣可通过以下地址访问:

Project page: https://sites.google.com/view/humanoid-gym/

Github 代码库: https://github.com/roboterax/humanoid-gym

星动纪元表示,除了 用sim-to-real 验证以外,另一个常见的做法是用第二个更高精度的仿真环境来做初步做验证(sim-to-sim)。本次Humanoid-Gym开源后,用户可以通过该框架轻松运用sim-to-sim转换功能,先在更高精度的仿真环境Mujoco中进行初步验证与筛选,从而提升sim-to-real转换的效率和成功率。

除此之外,该开源项目还引入了若干评估指标,用以衡量训练策略的效果,包括但不限于速度追踪、动作丝滑程度等。

目前,星动纪元有两款型号的人形机器人产品:小星和小星Max,来适配不同应用场景的需求。小星体型更小巧,动态性能强,可完成室内外跑、跳、高速行走等动作。小星Max为全尺寸人形机器人,身型高度和成年人相当,手臂、腰部以及全身其他部位具备更高的自由度,还配有高自由度灵巧手,未来目标场景是在工厂制造场景或服务场景,替代人类完成各种各样较为精细的操作。

此次开源的Humanoid-Gym训练框架,标志着星动纪元在人形机器人技术推广和共享方面的积极姿态。通过降低进入门槛,星动纪元期望激发更多的创新思维和解决方案,共同推进人形机器人技术的未来发展。

]]>
机器人 //m.drvow.com/category/robot/cJo6GYgVkx8iQ9T7.html#comments Wed, 06 Mar 2024 13:06:00 +0800
亚马逊终止收购iRobot,扫地机器人巨头四面楚歌 //m.drvow.com/category/robot/rnky79LQ2WuXN1Gq.html 1月29日,亚马逊宣布终止对iRobot的收购,扫地机器人行业里面最大的一笔收购案随即告吹。尽管这笔交易从最初的17亿美元降到了14亿美元,但在欧盟的反垄断铁拳下,世界上最大的电商平台与扫地机市场份额最大的企业之间的“联姻”最终画上了休止符。

市场对于这次失败的并购并不意外。早在1月上旬,就有媒体报道称欧盟或将不会同意批准亚马逊对iRobot的收购,理由是“这可能会限制扫地机器人、吸尘器市场的竞争”。

一位清洁电器行业专家告诉雷峰网,作为世界上最大的电商平台,亚马逊在全球拥有着绝对的渠道优势;iRobot则是扫地机器人的“鼻祖”,其Roomba堪称是扫地机器人的代名词,在全球市场拥有超过50%以上的市场份额。一旦亚马逊并购成功,相当于“既做裁判又做选手,会限制其它企业的市场竞争。”

事实上,欧盟尚未作出最终的裁决,亚马逊仍然有机会进行申诉。不过,亚马逊已经决定停止这笔交易。两家公司在一份共同声明中写道,该收购计划“没有办法获得欧盟监管批准,阻止了亚马逊和iRobot一同前行”。

另一位清洁资深人士表示,亚马逊主动停止收购iRobot,并未等到2月14日欧盟的最终裁定,表明亚马逊本身也不再看好这个标的。从业绩上看,iRobot近几年的财务状况一直不乐观,其扫地机市场占有率持续下滑,面临来自中国厂商的强烈竞争。

并且,受宏观环境影响,亚马逊在过去一年开展“瘦身”运动,裁掉了很多不赚钱的业务,所以停止这笔收购在情理之中,尽管为此需要支付一笔高达9400万美元的“分手费”。

从二级交易所的数据也可以看出市场对于这次联姻失败的态度:过去一周时间里,iRobot股票大跌20%以上,而亚马逊的股价则大涨近8个点。这意味着亚马逊表面看似输了,实则赢得盆满钵满。

对于iRobot而言,最为难受的不是交易告吹,也不是股票大跌,而是其扫地机市场的基本盘持续被来自其他厂商蚕食,来自中国的竞争者正在攻破自家的北美后院。

从“扫地机鼻祖”到如今四面楚歌的境地,iRobot这二十年时间,似乎走完了一家大公司的路径:开辟新市场,花费十数年成为绝对霸主,接着进入瓶颈期,现在只能眼睁睁看着别的企业后来居上,自己逐渐走向没落。

iRobot的遭遇不禁让人唏嘘,但同时也抛出一个问题:昔日霸主节节败退,iRobot到底做错了什么?

一、策略失误:痛失中国市场

时光倒回近十年前——2014年,彼时iRobot风头正盛,吞下了当时过半的全球市场份额,牢牢把控着北美市场的话语权,几乎打遍无敌手。

2015年,iRobot的创始人兼CEO科林·安格尔就放下豪言壮志:“除了美国以外,未来5年之内中国将成为iRobot第二大市场”。此后常常能看见其在中国活动的身影,准备在中国市场大干一番。

其实,这并非iRobot第一次吹响进军中国市场的号角。

早在2011年,iRobot就曾与国内科凡达智能进行合作,后者作为iRobot的独家总代,在国内销售Roomba系列产品。

不如人意的是,iRobot系列产品虽然成功登上大陆15个电商平台和500多家实体终端,销量却始终没能跑起来,水花平平。

多位熟悉iRobot的业内人士向雷峰网分析,这一次的失利是有原因的。

首先,当时国内市场发育不成熟,需要时间和成本去教育消费者接受扫地机这一新事物,难度较大。

其次,iRobot的售价高昂,令人望而却步。Roomba 570于2007年上市,价格在1000美金以上,6年后该品进入中国,售价高达3000+元,而且还常搞“数量有限”的饥饿营销。

iRobot创始人科林曾在2014年表示,iRobot绝不会打价格牌,追求低价位并非他们的市场战略。原因在于,iRobot前期投入太大,一款产品往往投入一两亿美金,因此需要高客单价来填补巨大的研发投入。但在当时,国内市场消费能力并不足以支撑起类似的科技消费品。

最后,iRobot 营销渠道重线下而非线上,线上投入不足,没有抓住互联网兴起的机会。结果就是整整五年,iRobot在科凡达的代理下迟迟没有大规模打开中国市场。

考虑到中国将是日后重要的战略市场,失去耐心的iRobot直接砍掉了中国大陆总代科凡达,准备亲自出山,势要给市场下点硬功夫,赌未来五年内iRobot会翻盘。

于是,2015年,iRobot迎来第二次进军的号角。

碍于军工背景所带来的诸多不便因素,iRobot开始做减法,将军事合同部门(iRobot Defense & Security)单独切割为Endeavor Robotics,此后iRobot就专攻家用机器人。

瘦身成功的iRobot,本该是长驱直入中国大陆市场,但奈何又频频犯错,错失了很多机会。

  • 营销策略老套,错失新媒体机遇

在营销策略上,iRobot就犯了第一个错——没有抓住扫地机的科技属性进行推广,也没有因地制宜选择最合适的营销平台。

当时负责iRobot全球运营与供应链的人是Oscar,也是iRobot的二号实权人物。在2008年加入iRobot前,他曾在消费品巨头宝洁工作了十年。

顺理成章地,Oscar聘请了曾在宝洁工作多年的前同事Kelly Zhang担任中国区总经理,负责中国区销售。但以Kelly zhang为主的中国区团队欠缺科技消费品的营销经验,几乎原封不动地照搬了宝洁系的一贯打法,花了大量的资源用于投放电视广告,而忽视了新媒体的作用。

熟悉iRobot的罗海告诉雷峰网,扫地机不同于个人护理产品,其带有显著的科技属性,iRobot对新媒体平台的忽视,直接让其错过了那些对科技最为感冒的城市中产,未能有效触达实际消费者。

此外,iRobot也错过了中国电商这辆迅速腾飞的快车,反而是科沃斯抓住了时机,一跃而起。

2011年,淘宝商城刚从淘宝拆分出来,取名天猫,鲜有品牌愿意入驻。为了改变这一局面,天猫主动扶持小品牌,找到了科沃斯,并给了很多流量。

科沃斯做了陀螺仪导航的产品之后,立马签下钟汉良(2016年)做代言人,把产品推向市场。此时的天猫已经崛起,当年双十一科沃斯拿到了天猫家电类销量第一。紧接着,科沃斯继续乘胜追击,2018年又推出了一款VIO技术路线的产品DJ35,3月就进入了天猫预售,最终总销量达到接近100万台。

  • 盲目自大,给了国内玩家弯道超车的机会

在渠道上碰了一鼻子灰的iRobot,很快又尝到了第二个失误所带来的苦果——对专利的忽视,以及对对手的轻视。

iRobot军用背景出身,积累了丰富技术,扫地机Roomba可以说是其技术降维后推出的产品。事实上,iRobot也格外注重技术保护,曾在2017年就利用专利保护将11家竞争对手(其中3家为中国公司)驱逐出北美市场。

但2015年以前iRobot从未在中国大陆申请过专利,仅在香港、台湾等地申请了,结果这片大陆空白就为国内玩家留下了学习空间和追赶机会。

加之中国大陆从2014年起就一直有在为iRobot做代工,产业基础和制造水平在不断缩小。

石头刚起步时就特地去拉了上海赫比的投资,正是因为赫比是 iRobot 的代工厂,也是小米供应链里唯一有做扫地机经验的厂商。

此外,在技术上一度叱咤风云的iRobot,免不了“arrogant”(自大)的毛病,包括iRobot此前的CTO Paolo Pirjanian都这样认为:中国企业还做不出扫地机。

说起来,iRobot还算是石头的“救命恩人”。

石头第一次面临破产时,就卡在硬件关上——齿轮箱成了最大拦路虎。没有经验的石头团队兜兜转转干了半年,愣是快把1500万经费烧完了,齿轮箱也没个影。

无奈下,石头转而寻求与力嘉的合作,让后者供货。力嘉是iRobot的供应商,在生产齿轮箱这块非常娴熟,不过力嘉与iRobot签有排他协议,与其他企业合作需要得到iRobot的首肯。

当力嘉跑去询问iRobot是否能和一家中国企业合作时,得到iRobot的回答是——同意。

很快,石头凭借搭起来的供应链,2017年便扬帆出海,冲击着iRobot的海外市场份额。

iRobot的轻视,无形中为自己培养了众多劲敌,亲手将自己送入了被动境地。

正如刘慈欣在《三体》里提到的,“毁灭人类的不是无知和弱小,而是傲慢”。

直到2019年, iRobot 董事会才终于重视中国区的种种问题,开始新的变革,从摩托罗拉招了一批具有科技背景的人,换掉宝洁系员工。随后,原二号人物Oscar离职,中国区总经理Kelly Zhang也紧随其后,离职iRobot。

iRobot两次试图在中国市场的山头安营扎寨下来,却总是不得其法,搞得灰头土脸。

不仅如此,iRobot的北美大本营又出现大盘回缩,雪上加霜。2021年,iRobot 首次出现亏损,2022年全年亏损2.8亿美金,2023年在三季度就已经亏了2.4亿美金。一位券商从业者告诉雷峰网,iRobot一年收入规模在十几亿美金,如果按目前每年2~3亿美金的节奏亏损,公司很快就会亏没了。

iRobot的下坡路不是一朝一夕就走完的,而是不断地叠加失误,导致在错误的路上越走越远。

二、死磕视觉:被国内玩家抄了后院

如果说营销和渠道的失误还有机会扭转,那死磕视觉路线和产品定位的失误,是iRobot节节败退的根本原因。

凭借着早期研发投入和技术积淀,iRobot 在技术端上具有明显的先发优势。

2010年,激光和视觉导航技术开始不断涌现,扫地机的智能化日益精进。一直以来,iRobot始终坚持在技术领域深耕,尤其是不断打磨视觉导航方案。但该方案对光线和环境依赖较大,复杂环境里扫地机可能会“休克”,技术路线难度极大。

iRobot是视觉导航的坚定拥护者,同时也是业内视觉导航的天花板。

业内人士周丹向雷峰网表示,国内扫地机走视觉导航路线的,很难做到像iRobot那样,一个摄像头既能做定位,又能做识别,还可以避障。

视觉导航方案存在技术壁垒,如果正面跟iRobot硬刚,那国内企业难有出头之日。

因此,国内企业很明智地选择了“曲线救国”,采用了激光导航+各类传感器的路线方案,并且迅速迭代,不断优化导航技术。

2016年,石头科技率先推出了性价比极高的激光导航扫地机器人,一炮而红。接着,科沃斯也采取了VIO(Visual-Inertial Odometry),即“视觉+惯性”的里程计(前端)的方案,并搭载在DJ35产品上,销量超过30万台。

这时,一直死磕视觉导航的iRobot就陷入了一种尴尬的境地:进则难以一时半会攻克视觉技术难题,退又不愿调整路线,改用激光导航;整个公司陷入进退两难的窘境。

如果说技术路线之争是一次艰难交锋,那么产品功能的滞后,则是iRobot变相将市场拱手让人了。

不同于北美市场,中国市场里“先扫后拖”是基本需求,但iRobot始终坚持着“扫拖分离”的理念,认为很难同时兼顾扫拖双功能,因此iRobot分别推出了扫地机器人Roomba、洗地机器人Scooba和擦地机器人Braava。

这一认知,就让iRobot与中国消费者失之交臂。人们大多难以接受扫地一把、拖地一把,嫌麻烦,扫拖一体目前已成为中国扫地机器人主流产品的主打功能。

另一方面,近年来iRobot在产品业务上不断拓新,投入了大量资金研发新业务,试图补足产品矩阵,以撬动第二增长曲线。

但新产品的市场表现一般,大量的研发投入未能尽数收回,反而让iRobot财务状况收紧。

例如,iRobot 做了5年割草机,曾推出割草机器人Terra,但该产品没有引起什么声量。熟悉iRobot的王新向雷峰网表示,iRobot投入了5年的研发,采用UWB的方案,但最终因为稳定性、可靠性问题,没有大规模量产。最后,割草机业务也不得不放弃。

如今,石头、科沃斯、追觅等国内品牌已经杀到了iRobot的后院,iRobot面临着一次严重的挑战。

在产品更新上,国内企业的产品迭代速度非常惊人,几乎每个季度都会推出新的产品。相比之下,iRobot平均一年半才出新一次,速度并不快。一位业内人士告诉雷峰网,iRobot由于军工企业出身,自身没有那么重视产品更新,也没太留意中国品牌的冲击,结果就是现在中国品牌的产品要比iRobot领先了两到三代左右。

该业内人士表示,2021年,全能型基站扫地机在国内就已经火爆了,但是2023年海外才逐渐兴起。从市场端角度看,国内市场是全球领先的,“iRobot在技术端上已经几乎没有优势了”。

三、结语

正如马克·吐温所言:“让你陷入麻烦的不是你不知道的事情,而是你知道的事情并没有确定发生。”

这场收购未能真正谈好并落到纸面上,沉甸又迷蒙的阴云再度笼罩在iRobot上空。

业内人士周丹向雷峰网表示,这场收购对亚马逊影响不大,但对iRobot却是至关重要。

“如果没有下一个接盘者,iRobot的处境将岌岌可危,因为它难以再从产品端去打出更有竞争力的产品,这需要重新调整技术、供应链等,将是个大工程。”

对于iRobot而言,如今的局面并非不可挽回,其在欧美市场的品牌影响力仍然存在。但在中国品牌出海的强势猛攻之下,iRobot也需要开始新的变革,用技术更好、功能更全的产品来扳回劣势。

可以预见的是,伴随着国内扫地机器人企业不断出海,国内品牌与iRobot之间的拉锯战将持续下去。这场攻防战,在亚马逊宣布停止对iRobot的收购时,就已经全面打响。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/rnky79LQ2WuXN1Gq.html#comments Thu, 22 Feb 2024 11:05:00 +0800
清洁再进一步!追觅科技发布「仿生“双”机械臂」扫地机器人X40 //m.drvow.com/category/robot/arr0TNzBCRbdDnRr.html 2月2日,追觅科技在苏州总部举行了2024年首场扫地机新品发布会。

会上,追觅科技发布了首款搭载仿生“双”机械臂的尖端扫拖旗舰X40系列(下称“追觅X40系列”)。据了解,追觅X40系列在追觅科技首创的仿生机械臂抹布外扩基础上,新增了行业首创可升降的边刷外扩,使扫拖一体机器人首次实现了边刷、抹布双臂联动,进一步提升了扫地机器人在清洁边角缝隙方面的能力。

  • 解决贴边、缝隙清洁

一直以来,边角缝隙清洁,用户家庭清洁工作中面临的痛点之一。房屋整体清洁,很大一部分时间和精力都要花在“边边角角”的清洁上。为解决这一难题,扫地机器人厂商们曾尝试过各种形态、技术的努力,但效果并不明显。

基于此,追觅在2023年上半年推出了首款搭载仿生机械臂技术的追觅扫地机器人X20系列,通过机械臂“外扩”来实现拖布对更大面积以及更多缝隙场景的覆盖清洁。随后,追觅又推出了新的升级版本X30、X40系列,持续优化产品。

具体参数上,追觅X40系列通过边刷外扩可大大提升悬空柜体直线沿边清洁的面积,相比上代技术提升了71%。并且,X40系列可实现<1mm墙边死角的贴边清洁,还可高度模仿人手的清洁效果,对空隙高度大于1cm的各类家具、电器的底部,也都能将仿生机械臂伸入4cm进行深度清洁。

  • 吸力更强、干湿分离

除了全新升级的仿生“双”机械臂外,为追求更为全面的清洁效果,追觅X40系列还围绕吸力、干扫湿拖分离、自清洁等多个方面进行了优化。

据介绍,追觅X40系列扫地机器人搭载了自主研发的尖端风机Turbo Force 5,吸力高达12000Pa,相当于能够吸起接近7.96kg的重物,能够解决许多黏着物和比较重的垃圾。

另一方面,针对有些用户在使用扫拖一体机器人时也会遇到困扰,比如滚刷边刷被二次污染、拖布打湿地毯等。

对此,追觅X40系列扫地机器人采用了全球首创拖布+滚刷+边刷“三重升降系统”。当扫地机器人在边刷、滚刷下降扫地时,“三重升降系统”可以抬升或拆卸拖布,避免吸扫的灰尘杂物沾水,也避免湿拖布打湿地毯。当扫地机器人拖布下降拖地时,“三重升降系统”能够抬升边刷、滚刷,不但可以避免边刷、滚刷二次污染,还能避免尘盒进水导致发臭,从而实现“干湿分离”。

  • 解决毛发缠绕问题,高效除菌

在使用过程中,毛发缠绕一直是用户不胜其烦的问题。追觅X40系列扫地机器人标配主动式割毛防缠绕滚刷2.0,采用了创新三组刀头设计,提供了更强大的切割性能。此外,毛条也升级为防静电材质,倾斜角度调整为黄金50度,滚刷缠毛率进一步下降。 

除菌方面,追觅X40系列扫地机器人增加了杀菌广度。除却行业普遍只有针对大肠杆菌、金黄葡萄球菌、白色念珠菌的杀菌方案。追觅X40系列扫地机器人则增设了UV紫外线杀菌技术,通过紫外线灯照射拖布30分钟,相当于阳光直射7个小时的强度,能够高效杀灭红色毛藓菌等脚气致病真菌、螨虫以及病毒等病原体。

此外,追觅X40系列搭配了污水箱除臭模块,通过缓释抗菌除臭颗粒实现稳定持久抗菌除臭,除菌率高达99.9%,解决了用户困扰已久的污水箱发臭问题。

除了X40系列,追觅科技同时发布了S30系列扫地机器人、可180°平躺探底清洁的洗地机H30 Ultra,以及“口袋造型师”追觅Pocket高速折叠吹风机等。

追觅科技中国区总裁郭人杰表示,追觅科技凭借“技术全包围+大胆创新”技术战略,及技术快速迭代沉淀带来技术复用能力,在多个品类持续进行创新,为用户带来全新的体验价值。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/arr0TNzBCRbdDnRr.html#comments Wed, 07 Feb 2024 14:10:00 +0800
独家丨进击的服务机器人:普渡科技携手云迹共建行业「新范式」 //m.drvow.com/category/robot/jBiLiNsfWgSTkc8j.html 1月24日,普渡科技宣布与云迹科技达成战略合作,双方将在技术、产品、渠道、售后等方面进行全方位合作,进而提高产品竞争力,拓宽业务市场。

具体看来,合作包含两部分:

技术:双方将加强在多层建筑中的技术应用合作和跨厂商协同,打通包括梯控在内的技术壁垒,构建更开放的行业生态。

产品:普渡和云迹优势互补,通过合作进一步丰富产品矩阵,提升产品的客户价值,以更好的满足市场需求。

对于普渡科技来说,技术合作将有利于产品创新,复用云迹的国内渠道,将推动其配送机器人、清洁机器人在国内市场的更大规模落地。合作也意味着云迹将借助普渡在海外的资源和积累,拓展国际市场和更多的应用场景。同时,双方将合作进行售后服务的优化。

从行业看,这也是业内首次出现两家机器人独角兽达成战略合作,意味着机器人行业开始从“竞争”走向“竞合”,服务机器人的商业化进入全新阶段,新的生态也正在形成。

此外,本次合作中,普渡首次提出了R2X,即Robot-to-Everything 的概念。R2X旨在通过建立统一的协议和标准规范,让机器人接入物联网,实现机器人与环境、人机协同以及机器人之间的协同,从而构建起完整的IoT生态,进一步激活机器人的场景价值。

新增长:品类+渠道

作为国内服务机器人领域的独角兽之一,普渡机器人以餐饮配送机器人出道,并在2021年发布了首款商用清洁机器人CC1,正式进入商用清洁机器人赛道,形成了配送+清洁的产品矩阵。

与其他商用清洁机器人产品相比,CC1的体积较小,通过性强,外观可爱,且为洗、扫、推、吸四合一功能,更适合环境复杂、客流量大的场景。

通过与云迹合作,普渡进一步拓展了酒店这个场景,更好地发挥了自身的产品矩阵优势。因为酒店本身就存在配送、清洁、迎宾等多重需求。比如酒店餐厅这个细分场景,既需要送餐、回盘等配送机器人,清洁也同样是刚需。

普渡科技创始人兼CEO张涛形容这次合作为“1+1>6”,其中的“6”具体解释为:普渡在自己的区域和渠道卖自己的产品;普渡在自己的区域和渠道卖云迹的产品;普渡把产品卖到云迹的区域和渠道;云迹在自己的区域和渠道卖自己的产品;云迹在自己的区域和渠道卖普渡的产品;云迹把产品卖到普渡的区域和渠道。

从结果看,合作给普渡带来的好处至少有两点:

  • 进一步开发酒店场景纵深

双方的交叉代理模式使得普渡不需要额外增加拓展国内酒店客户的BD,并且R2X技术协同机制能够强化普渡的梯控技术能力,也能缩短产品研发周期、提高竞争力,有利于削减研发和商务成本,推动产品快速落地。

同时更大程度挖掘酒店餐厅这个场景的价值,提供配送和清洁两类产品,从而提高产品在酒店客户中的渗透率。最终实现“配送+清洁”的双轮驱动。

  • 拓展国内国外两个市场

全球化一直是普渡的战略重心和优势,80%左右的产品销往海外市场。本次合作除了推动双方在国内下沉渠道的产品落地以外,更重要的是,云迹可以走出国门,进入海外市场;而普渡则依托云迹在酒店场景的积累,发掘更多海外酒店客户,从而实现更大规模的海外市场拓展。

一言以蔽之,双方都将从合作中受益。对于客户来说,无疑将从两个行业头部共同搭建的产品、服务和售后得到更多的选择和保障。

新范式:构建R2X生态

众所周知,酒店是一个融合场景。相较于餐厅、写字楼这类功能性用途单一的场景,酒店集住宿、饮食、休闲等功能于一体,其对机器人的需求更加多元化。

比如,一家酒店既需要闭合式配送机器人,负责前台与客房之间的末端配送;也需要清洁机器人来做日常的清理、吸尘、消杀等工作。而在酒店餐厅,开放式送餐机器人和更小体积的清洁机器人的需求正在日益增长。

因此,这类融合场景实际上需要不同的机器人来执行单一场景的任务。并且,站在需求的角度,不少客户也倾向于多元化选择,即择优购买不同品牌的机器人,以此来达到机器人的最佳利用效果,提升效率。

但一个长期困扰行业的难题是:如何实现跨品牌不同类型机器人的协同调度?

由于机器人厂商之间的技术路线的差异,底层协议互相独立甚至排斥,造成梯控系统和调度系统无法兼容。这就导致同一场景下,不同品牌服务机器人之间无法做到「群体协同」,甚至在某些极端场景下,不同品牌机器人之间互相「掐架」,就好像红绿灯出现故障的交叉路口—谁也不让谁。

曾有那么一个现实案例:两个不同品牌的机器人在同一条路上争夺路权,要对方让步,结果停在原地互不相让,谁也没有完成任务,最终在人的“斡旋”下才停战。

这种现象在旁观者看来很滑稽,企业却无法一笑置之。对于客户而言,购买机器人的初衷是「降本增效」,如果机器人之间做不到协同,就不能提高效率,这无疑是致命的缺陷。从另一个角度看,商用服务机器人本质上是B2B2C的生意,消费者的使用体验也会反馈给B端用户,从而影响B端用户的购买决策。

为了解决这个问题,普渡提出了R2X的概念,即通过统一的API和SDK,形成多机互联的统一协议和规范,让机器人不仅能够在同一场景下中协同工作,而且能够跨系统交换信息,实现「群体协同」,进而提高效率。

在R2X框架下:

客户选择多元化,可以采购不同品牌的机器人,也可根据自身需求定制;

不同厂商产品的协同门槛大大降低,能够被集成到IoT场景中协同作业;

降低了消费者的学习成本,提高用户体验,进一步增强市场教育,并从C端 push B端;

也就是说,R2X本质上搭建了一个链接多方的平台,不同机器人厂商、客户、消费者等角色都能从这个平台上受益。但R2X的意义绝不止于此,不只是酒店,比如工厂、写字楼、医院......这些具有复合型需求的场景都需要不同类型的机器人来执行任务。

R2X更大的意义在于,构建起融合场景下机器人协同的技术生态,并沉淀下来复用到其他行业,从而推动整个机器人行业的发展。就像手机行业的通信协议、全屋智能的Matter协议,本质上是为了构建不同品牌硬件之间的连接,解决真实场景的用户痛点,最大限度激发产品的价值;亦或是汽车行业的V2X,实现信息的互联互通。

无论什么领域,这样的底层技术生态,都是打通行业发展隐形天花板的重要一环,也必然是艰难的一环,需要有勇气又有能力的拓荒者。

新方向:从单品到生态

2023年,整个商用服务机器人赛道变得异常内卷。市场对服务机器人的需求愈加攀升,行业竞争加剧,创业者们都在思考如何破局。

出海显然是一条不错的路径。

普渡一直大力发展海外市场,在全球60多个国家和地区均有业务。截至目前普渡科技累计出货量超过7万台,是全球出货量最高的服务机器人企业之一。

但这只验证了阶段性市场策略的正确性,并非机器人产品取得的全面胜利。换句话说,许多B端客户对于机器人带来的价值仍然持怀疑态度,这才是机器人企业面临的核心问题——如何让公司的业务价值与客户所需要的价值相匹配,即给他们创造的效益显著高于其购买产品、服务的成本。

前面曾提到,许多B端客户需要的不只是适用于某一场景的产品,实际的经营中,场景是多样融合的。客户真正需要的是以机器人为核心,连接多个细分场景的IoT解决方案。这个方案,又必须要能够实现不同机器人之间在不同场景下的群体协作。

这个背景下,普渡提出的R2X显得愈发重要。而在普渡和云迹的合作中,双方将建立技术协同机制,进一步强化服务机器人在多层复杂建筑中的自主导航能力,并利用双方合作带来的技术优化以及PUDU Cloud云开放平台和开放SDK,打破信息孤岛,从而联通场景内部的各个信息端口,连接各类场景,帮助客户构建开放式的全栈智能服务生态,实现多场景的全栈式智能化生态运营。

从某种意义上讲,这种从做产品到构建生态的思路,为时下商用服务机器人突破内卷提供了一个可能的解法——完整的智能服务生态可以复用到其他行业,以及各类场景,助力企业实现将本增效。这或许将是未来商用服务机器人企业实现商业化落地的重要路径。

结语

普渡与云迹的这次合作,其最大的意义并不在于普渡切入了酒店这个场景,而在于给行业提供了一种全新的“技术-商业”范式——

双方通过对场景的深层解耦,以R2X为基础,共同为客户提供全栈式的智能解决方案,从而实现多方共赢:普渡、云迹获得业务增长,客户获得更丰富的产品矩阵组合和更优质的服务,消费者得到更好的体验,经销商、渠道商也能从中获益。

这次强强联合,已经吹响了商用服务机器人大规模落地的号角。雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/jBiLiNsfWgSTkc8j.html#comments Fri, 26 Jan 2024 15:47:00 +0800
清洁家电「下半场」:创新成为破局之道 //m.drvow.com/category/robot/EWIUFwjc43VJNZ6M.html “清洁家电已经进入瓶颈期,玩不出什么新花样了。”投资人济川感叹道。

数年前,在“扫拖一体+全能基站”的buff下,这个品类迎来了一场狂热的增长盛宴。二级市场曾出现千亿市值的龙头股,一级市场创业公司的估值也水涨船高,VC想要上车简直一票难求,“当时都是有价无市,机构抢着投,才能拿到一点额度”。

如今,这个旋转的飞轮终于稳了下来,资本也回归理性,二级市场上相关公司的PE,也越来越向传统白电公司靠齐。

这背后的原因在于,不论是扫地机,还是洗地机,功能上逐渐完善。并且,这个品类存在更换周期,加之当前消费尚未复苏,整个市场增速放缓合情合理。

不过,如果以白电来对标清洁家电,那么这个市场仍然具有很不错的想象空间。济川认为,“仅仅以欧美市场的渗透率作为对比,国内也还有接近一倍的增量。”

目前,扫地机和洗地机这类清洁家电,技术渐趋成熟,不过消费者的心智认知、需求刚性,还处于需要提升的物种,距离白电的普及率还有差距。不过,这也意味着清洁家电行业存在上升潜力。

“破局的关键在于技术创新。”济川表示,白电刚开始也不被称之为白电,而是奢侈品。如今白电有如此之高的普及率,本质上是技术不断创新并且成熟,对产品性能、稳定性的提升,以及成本的下探,从而实现了对大部分家庭的覆盖。

对于清洁家电而言,过去几年无疑是品类的红利期。而今,当品类红利见底,企业们如果要复制传统白电厂商的增长路线,那么「下半场」的竞争将围绕“技术创新如何提高产品的智能化程度、解决用户多元化场景需求痛点,以此持续提高渗透率”这个命题展开。

伴随着2024年的钟声,这场汇集各路英雄的「清洁家电突围战」,已经拉开帷幕。

清洁家电「上半场」:创新与时势的双轮驱动

清洁家电上半场,本质上是一次“技术创新+品类红利”为双轮驱动的集体繁荣。

从LDS带来的规划清扫以及成本下探,到扫拖一体功能的创新,再到全功能基站的出现,业内玩家们在创新这条路上越走越远。技术体现在产品上,便是扫地机器人智能化程度日益提升,功能逐渐完善,基本能满足一二线城市家庭用户的需求。

凭借着这些创新,行业玩家们吃到了“第一只螃蟹”,赚得盆满钵满。即便在疫情期间,消费市场也仍然活跃。甚至从某种程度上讲,疫情带动了家庭经济,尤其是小家电的增长,比如扫地机、洗地机、美容仪等等。

强劲的消费需求源源不断地转化为贸易订单,厂商开足产线,业绩蹭蹭上涨,石头、科沃斯等老牌企业在二级市场迎来高光时刻,被寄予“扫地茅”的桂冠,追觅科技、云鲸等也在资本市场上如鱼得水,成为新晋独角兽。

时间来到2022年下半年,以扫地机器人为代表的清洁家电市场突然「退潮」。消费已经不再像此前那般凶猛,整个清洁家电市场似乎进入了存量竞争的阶段。

在此背景下,厂商们开始寻求市场策略上的突围,最主要有三种手段。

一是拓品。在扫地机器人这个品类之外,开辟洗地机作为第二战场,比如石头、云鲸等先后入局洗地机。除了洗地机以外,科沃斯尝试探索割草机,石头则推出了洗烘一体机等等。

二是降价。原来清洁家电市场,主要有科沃斯、石头等玩家,但伴随着美的、海尔等传统白电大厂入局,整个行业竞争逐渐白热化,蓝海变成红海。各厂商推出了降价策略,以稳住自己的基本盘。

三是出海。国内市场已经高度内卷化,同质化竞争极其严重,于是在2023年,厂商们又集体发力去搞海外市场。从结果看,清洁家电厂商的海外业务增长势头非常不错,已经验证了出海这条路径的正确性。事实上,出海已经是诸多消费硬件公司的共识,追觅科技做自主品牌的第一步就是出海做全球化。

以终为始,这些厂商在消费降级下取得的逆势增长,毫无疑问证明了市场策略的有效,同时也指明了未来一年众厂商的发力方向——持续搞海外,以及推出新产品,甚至推出原有产品的入门款,来抢占下沉市场。

但从第一性原理出发,市场策略的胜利只能收一时之功。如果要进一步提高清洁家电的渗透率,仍要回归产品的本质,即以技术创新为驱动力,推出性能更优、性价比更高的产品,以适应当下消费者的多元场景需求。

这也正是过去几年清洁家电企业们能够崛起的本质原因,而今在增长放缓的背景下,技术创新显得愈发重要。在这些企业中,追觅科技或许不一定最具代表性,但一定是最特别的那个,走出了一条别开生面的发展路线。

3年增长10倍的方法论

据雷峰网了解,从2020年到2022年,追觅科技的整体业绩从数亿元增长到了五十多亿元,3年时间增长了接近10倍,自主品牌业绩增长了近20倍。即便是在消费尚未复苏的2023年,其在双11大促的业绩也维持了正向增长:全渠道销售超过21亿元,同比增长100%。

这些亮眼的成绩,首先归功于策略的成功。

坦白来说,追觅科技入局清洁家电并不算早,甚至是CR4中最晚的一家,2021年底才研发出全功能的自有品牌扫地机器人。彼时,科沃斯市值超千亿,而石头在科创板一骑绝尘,云鲸估值近300亿元。与这些友商相比,追觅科技几乎没有任何优势。

不过庆幸的是,这些友商的出彩表现,也无形中帮了追觅科技一把。二级市场的火热,让一级市场的资金看到了造富希望,而以高速数字马达为核心、拥有多项专利的追觅科技,瞬间成为投资圈的明星项目。2021年底,追觅科技获得了总额高达36亿元的C轮融资。

坐拥巨资的追觅科技,做了两个影响深远的决策:一是做自主品牌的扫地机,二是做当时市场竞争不那么激烈的洗地机。

做自主品牌的扫地机并不容易,追觅科技采取了很讨巧的策略:先做出海,再回国内,避免和国内友商直面竞争。而入局洗地机,这个决策后来也被证明是正确的,在2022年和2023年,洗地机成为追觅科技增长最猛的业务。

从策略上看,外界倾向于追觅科技的增长看作是营销的胜利,即通过大量的广告投放,触及用户,培育用户心智,以此来抢占市场,提高市占率。

这种观点具备一定的合理性,对于晚入场的追觅科技来说,既无品牌优势,又无渠道条件,采取这类扩张策略来打响第一枪,是最直接有效的方法。

但如果把追觅科技的业绩增长全归结于营销策略的成功,这未免有失偏颇。这就好比美团从百团大战中胜出,靠的绝对不是一股脑的烧钱,如果没有把平台搭建好,商铺入驻之后也会流失,其胜出的本质原因,在于搭建了一个能够让商家和用户产生信任的交易平台。

正如那句老话——巧妇难为无米之炊,再好的策略,如果没有产品打底,即便取得了一时之功,也不具备长久之效。从结果倒推,追觅科技连续三年业绩增长,并且在2023年逆势增长,仅凭策略二字,显然无法自圆其说。

创业者们经常提到的一句话是——“产品是1,其余的是0”,这句话足以解释追觅逆势增长的原因。

过去的几年时间里,追觅科技保持着较快的产品迭代速度。具体到扫地机、洗地机两大主营业务,以技术全包围及大胆创新的产品策略,在产品线及价位段布局做到足够丰富,可以精准解决消费者面临的痛点问题和行业技术难点,并基于高速数字马达+智能算法技术进行创新,推出在行业内更具竞争力的产品。

比如,传统方案的洗地机在进行清洗时,移动阻力较大,加之机身本身重量,略笨重,用户吐槽颇多。

为了优化洗地机的操控体验,追觅科技在行业内首次将轮毂伺服电机应用到洗地机,并在助力轮上搭载了传感器和双向助力伺服电机,可根据智能算法,每秒500次的频率来精准识别运动趋势,从而减轻拉伸阻力,让用户使用起来更省力。

又比如,为了解决扫地机贴边的难题,追觅科技首创了仿生机械臂技术。当识别到墙边、桌腿、床边等边角地带时,扫地机器人会通过仿生机械臂将拖布外扩,模仿人手的清洁习惯,“伸手”将边角的污渍擦净,实现<0.2cm的贴边距离。

这一技术已经升级到3.0版本,配备在x30、x20、S10 Pro Ultra机械臂版等产品上。而围绕这一技术,追觅科技又对“抹布外扩结构”、“抹布升降”、“外摆控制”、“外摆关联应用场景及运行”、“运行可靠性保证”等全链路技术点上进行了全维度的专利布局。

类似的例子还有很多,这些技术构成了产品竞争力的关键。因此,追觅科技逆势增长的背后,本质是以产品为基础,辅之以有效的技术革新策略取得的业绩。

此所谓“以正合,以奇胜”,对于企业,消费者用脚投票就是选择,好与不好,市场自有反应。从追觅科技2023年的业绩往回推算,表明消费者对于追觅科技的产品的认可大于偏见,而这又与追觅科技的研发息息相关。

逆势增长幕后的研发力量

“追觅太快了。”

这是很多人对于追觅科技的印象:SKU很广,迭代又很快,三五个月发新,速度堪比手机系统更新迭代。许多人认为“快”很容易乱,产品线铺太广是一种潜在的风险,这也是他们不理解追觅科技的点。

但如果换一个角度,产品线广、迭代快,也从某种角度上表明企业的研发情况。众所周知,做不同的产品,甚至做一款产品,迭代速度快,本质上反映出公司技术复用的能力,也就是所谓的“研发平台化”。

对于一家创业公司,研发平台化并不容易,尤其是追觅科技这么大体量——总员工4000人,产品研发技术人员占比超过70%。从管理的角度看,接近3000人的产品研发团队,融合在一起有条不紊地做产品,难度就很大。

据雷峰网了解,追觅科技将研发分为两块,分别是“心脏”(高速数字马达),和“大脑”(智能算法)。

在追觅科技的设计中,“心脏”和“大脑”技术作为底层通用的创新技术,可以多场景、多品类复用,比如扫地机、吹风机、洗衣机,都需要用到高速数字马达。依托这两大技术,追觅科技可以快速进入新兴赛道,针对场景做出差异化产品,实现技术价值。而在产品迭代中,技术也能持续升级,进而反哺给新品类,从而打造基于“高速数字马达+智能算法”的业务生态。

目前,追觅科技在气动、电磁、驱动、电子等方面进行探索,解决了许多技术难点。追觅高速数字马达实现了量产16万转/分的工艺,高速马达产线超20条,年生产1000万台以上。在算法方面,其智能算法能力通过学习超过405万组大数据,已迭代超过几十个版本,可识别环境、物品、人形及宠物四大类型,以解决场景化难点。

追觅科技内部将研发方法论总结为“四维研发法”——

超越行业,即对标行业做的最好的产品,且每一个技术、性能都做得更好,并且超越同行;

拓展新功能,为每种产品开发多种创新功能,以此保持行业领先地位;

跨行业创新,跨行业寻找创新点并实现应用;

颠覆品类,寻找开创性的新品类。

其中,第一第二两条法则,是为了保证产品在功能和质量上具备市场竞争力,而第三、四条法则,则是开发出颠覆性产品、技术的关键。

在这套研发方法论的指引下,追觅科技确实很快,在每一个全新品类上都能做出有竞争力的产品,并且推出仿生机械臂这类创新技术,从而奠定了其能够在2023年逆势而上的基础。

总结

从LDS到扫拖一体,推动清洁家电发展的根本要素是创新。

创新分为两类,一类是功能创新,即通过新的产品定义,或者结构改造,迭代出新的功能,解决消费者的新需求。另一类是技术创新,向上则是迭代新技术,让机器更智能;向下则是技术带来成本的下降,将价格打下来,通过价格机制去影响市场。

对于产品,功能和技术是一个硬币的两面,互相不可或缺。底层技术支撑着功能的拓展,功能的应用又反哺技术做迭代,二者相辅相成。对于企业而言,一个良好的研发体系,则是保证功能、技术创新的基础。

当清洁家电走向下半场,真的玩不出新花样了吗?

答案是否定的,企业仍然可以通过技术创新来提高产品的竞争力。

正如阿兰图灵那句名言——“目光所及之处,仍有许多事情要做”。清洁家电要达到白电一样的渗透率,还有很长的路要走。在这条路上,企业竞争的不只是产品,也是耐力和创新力。

在这个点上,追觅科技已经具备了与更强大对手同台竞技的资格。雷峰网

]]>
机器人 //m.drvow.com/category/robot/EWIUFwjc43VJNZ6M.html#comments Fri, 26 Jan 2024 15:39:00 +0800
Nova Cater AMR 亮相2024 CES,九号机器人携手Nvidia探索机器人新业务 //m.drvow.com/category/robot/Hgy9i8azqGncESIB.html 美国当地时间2024年1月9日,一年一届的CES展会在美国内华达州拉斯维加斯的会议中心如期举办。

机器人作为2023年最为热门的赛道之一,其受关注程度不言而喻。展会上,割草机、扫地机、泳池机器人、配送机器人等各种产品层出不穷,争奇斗艳。

其中,九号机器人首次在海外展示了室内配送机器人产品“九号飞碟”,而在“九号飞碟”的身旁,则是早已销往海内外多个国家的送餐机器人“九号饱饱”,以及由九号机器人与英伟达联合开发的自动驾驶研发平台“Nova Cater AMR(简称:NC)”。

据工作人员杨飞(化名)透露,“九号飞碟”主打以酒店为代表的室内配送场景,而Nova Cater AMR 则是一款高度可定制和灵活的自动驾驶研发平台,于2023年10月正式上线,可针对企业不同需求进行定制化服务,如仓库 AMR 建图、 仓库运输、科研仿真等,大幅提高企业的生产效率,降低人力成本。

作为九号公司旗下的商用服务机器人品牌,九号机器人主要聚焦于商用服务机器人的设计、研发、生产以及商业化落地。杨飞告诉雷峰网,“我们的‘九号饱饱’已经销往多个国家,而‘飞碟’也已在国内多个酒店落地。”

杨飞表示,“与英伟达合作的NC平台,是一个里程碑事件”。这意味着九号机器人在探索机器人商业化场景的进程上更进一步,并拓宽了更多的业务范围。

据雷峰网了解,九号公司在机器人领域的探索“一直不断”,从成立的那一刻起,就带着机器人的基因。

九号公司与机器人的不解之缘

九号公司有着强大的机器人基因。

九号公司早期的核心团队几乎全毕业于北京航空航天大学,带着极强的硬件属性。两位创始人(高禄峰、王野)对机器人有着“深深的执念”,在创立九号公司之前,王野曾经做过排爆机器人,遇到高禄峰之后,两人一拍即合搞起了机器人创业。

2014年,九号公司成立了机器人BU。2016年,九号公司收购Segway之后,正式成立了Segway Robotics(九号机器人),在北京建立起了一支强大的研发团队。

2016年,在美国的CES展会上,Segway Robotics与Intel合作的Segway Robot正式亮相。随后,Segway Robotics又研发出了首款个人服务机器人Loomo,并于2017年推出了货运机器人Loomo Go、Loomo shopping等版本。

此后,九号机器人的产品一发不可收。


2018年,九号机器人与美团合作发布了第一代“Segway 配送机器人 S1”,进入终端配送领域;

2019年,发布配送机器人九号方糖(S2)和室外配送机器人 X1。同年, 九号方糖配送机器人正式进入以酒店为代表的室内配送场景,开始进入规模化商用;

2020年,九号公司在国内科创板上市,九号方糖送物机器人(S2)完 成鸣锣,首开 A 股机器人鸣锣上市先河;

2022年,九号机器人发布全新室内配送产品,“九号飞碟”“九号饱饱”;

2023年, 九号机器人与英伟达共同合作开发的 Nova Cater AMR 正式上线。

即便在2020年上市前夕,高禄峰在沟通会上,也一直强调九号公司在机器人方面的部署。旗下机器人业务也有两位创始人亲自领导,九号公司对机器人的重视可见一斑。

“九号公司其实一直都在做机器人相关的技术储备,只不过前几年侧重于前沿技术的探索,这几年开始将这些技术实现场景化落地。”

杨飞告诉雷峰网,从2016年成立Segway Robotics开始,九号机器人团队先后与Intel、宝马、麻省理工等国际知名企业和院校进行合作,开发相应的感知、自动驾驶等机器人技术。

彼时的机器人行业下游场景应用较少,因此这些技术并未全部用于商业化,只用于少量的合作项目,比如与美团、饿了么的合作;大量的技术作为储备保留在了研究院中。

而今,伴随着无人配送的智慧化服务模式逐渐被市场所接受,以及新技术的突破和其背后的降本增效价值,机器人的下游应用场景逐渐清晰。在此背景下,九号机器人开启了更为广泛的商业化落地探索。

雷峰网获悉,在组织层面,为了更好地发展机器人业务、推动业务落地,九号公司将核心技术人才「嵌入」到各机器人产品线,以此来加速机器人技术的产品化、商业化。

“过去几年是一个技术研发到落地的过程。”杨飞表示,前几年大量的研发投入积累的技术,如今都成为每个业务的支点,为产品的研发和落地打下了基础。而在CES展会上出现的“九号飞碟”“九号饱饱”“Nova Cater AMR”等产品,本质上都离不开此前的技术探索与积淀。

携手Nvidia,九号机器人推出 Nova Cater AMR 平台

Nova Cater AMR能够实现自主路径规划、精准导航避障,就像一个具备自动驾驶能力的无人小车。然而,这本质上是一个高度可定制和灵活的自动驾驶研发平台。

换句话说,NC 是一个通用的移动底盘,旁边“九号飞碟”“九号饱饱”则是适用于具体场景的机器人产品。二者的联系在于,“九号飞碟”“九号饱饱”的实际上就是基于九号公司原有的九号机器人移动平台RMP( Robotics Mobility Platform) 研发设计的,而 NC 则是九号公司RMP业务的最新成果。

雷峰网了解到,NC具备自主感知、构图、导航等能力,在规模化部署方面表现优异,为开发人员提供了更加一个快速和可靠的软硬件平台。在该平台上,客户可针对不同需求进行定制化服务,如仓库 AMR 建图、 仓库运输、科研仿真等,提高生产效率、保障作业安全、降低人力成本。

杨飞告诉雷峰网,NC 由九号机器人携手英伟达联合开发。其中,九号机器人负责底层的移动能力和硬件的整合制造,而英伟达则为 NC提供了强大的算力与软件平台支持。

从性能上看,NC 以RMP为基础,具备良好的减震性能和通过性能,同时搭载了大容量电池与高效的轮毂电机,极大提高了负载和续航能力;并且,NC 基于NVIDIA AGX Orin,可以实现 ROS 2 的加速计算;在感知方面,NC配备了摄像头、激光雷达等多种传感器,以及高性能计算模块,能够实现360°全方位感知,进而完成自主规划、导航避障等任务。

在CES展会现场,九号机器人相关业务负责人与英伟达产品市场负责人共同接受采访时标示:“九号机器人始终以创造真价值的方式和路径发展机器人产品,我们希望通过提供有效的机器人解决方案,不仅能够解决人们的现实问题,也能够赋能行业,为整个机器人行业发展带来价值,我们与英伟达联合开发Nova Carter AMR,正式基于这一点,我们希望以通过与机器人生态系统企业拥抱合作的方式,强强联合,共同推动行业的发展,更快地将更好的机器人技术推向大众市场。”

事实上,九号机器人推出 NC 并不意外。早在2003年,Segway 就拓展了 RMP 业务,2015年九号公司收购 Segway 之后,RMP业务得以保留。而与英伟达的合作,也并非历史首次。2018年,九号公司曾与英伟达共同研发了一个带SDK功能的配送机器人概念款,但由于理念过于超前而没有转化为可落地的产品。

这次强强联合,将给市场提供更智能、更具竞争力的机器人移动底盘。

“NC平台具备通用的智能移动能力,并支持二次开发以及个性化定制,客户可以快速便捷地集成相关的软硬件,设计出符合自身需求的机器人产品,提高效率、降低运营成本。”

 To B+to C双管齐下,九号公司的国内外多元化布局

参展的三款商用机器人中,“九号飞碟”和“九号饱饱”同样吸引了大批目光。

作为九号机器人最早开始商用的机器人产品,“九号飞碟”“九号饱饱””九号方糖”等配送机器人已经在国内实现多个场景的商业落地。据杨飞透露,九号机器人已与万豪、希尔顿、瑞曼达等等主流一线酒店品牌合作,累计配送量超过千万次。

除了酒店场景,“九号飞碟”也进入了医院、政务大厅、写字楼等社区场景。此次参展CES,也是飞碟首次在海外亮相,意味着“九号飞碟”将走出国门。

杨飞告诉雷峰网,“飞碟”将主要销往亚太及欧洲地区。其中因为欧洲作为九号公司的核心阵地之一,“九号饱饱已经打了头阵,在欧洲市场有广泛落地,可以复用客户资源”,并且欧洲的劳动力成本相对较高,对机器人的需求更大。

商用机器人之外,九号公司在本届CES上还展示了短交通新物种——E-bike(电动助力自行车)、全新一代赛格威智能割草机器人、全新电动滑板车、移动储能等面向多领域、全场景的立体化产品布局。其中,割草机和移动储能是九号公司面向C端用户的近年来才推出的新兴业务,目前已经量产上市,完成商业化落地;E-bike则是基于公司在短交通领域的成熟供应链体系和研发制造工艺,以及智能化技术而布局的全新领域,并被市场解读为将推动E-Bike行业进入智能化2.0时代。

“公司实际上是两条路走,聚焦于BC两类客户群、国内国外两个大市场。”杨飞表示,在既有的电动两轮车业务基础上,拓展商用机器人业务作为新的业绩增长点。同时,基于九号公司海外的销售渠道,实现对国内和国外重点市场的全面覆盖。

 总结

一直以来,九号公司都以“简化人和物的移动”为使命。

在“人”的移动方面,推出了电动车、滑板车、平衡车等智能短交通产品,解决C端消费者短距离出行痛点;

在“物”的移动方面,推出了九号方糖、九号飞碟、九号饱饱等室内配送机器人,以及全新的NC移动平台,解决B端客户面临劳动力短缺、效率低下等难题; 

十多年的发展中,九号公司从默默无闻一跃成为智能短交通和服务机器人领域的头部品牌,在国内外已经建立起成熟的经销体系,“技术+品牌”成为九号公司对外拓展业务的名片。

对于九号机器人而言,九号公司强大的技术研发实力,无疑是其做好产品的基础,而九号公司的品牌、渠道,也将为其提供业务上的帮助。更重要的一点是九号公司从0到1再到100,丰富的量产经验和极致的供应链管理,能给九号机器人带来的先发优势。

“机器人要走进更多场景、全面落地,量产是所有企业必须要迈过的一道门槛。”

杨飞表示,技术落地为产品,会面临工程化问题,这是第一道坎;而在解决工程化之后,如何实现产品规模化(量产),则是第二道坎。九号机器人可以复用九号公司此前的业务经验和流程管理,从而避开工程化、规模化过程中隐藏着的各种各样的坑,从而率先完成机器人高效、可靠的量产,“这是九号机器人脱颖而出的核心所在”。

在解决量产这个大问题之后,九号机器人的产品将进入各类场景,为B端客户带来降本增效的价值。如同九号公司此前的智能短交通类产品,为C端消费者提供更智能,体验更好的短距离出行一样,九号机器人将解决B端客户面临的降本增效、智慧化服务升级等核心痛点,助力企业进行智能化转型,拓展新业务,“创造真价值”。

]]>
机器人 //m.drvow.com/category/robot/Hgy9i8azqGncESIB.html#comments Fri, 12 Jan 2024 11:51:00 +0800
外墙清洁机器人,如何「爬上」高楼? //m.drvow.com/category/robot/2B8HGELpGMqgS93Z.html “腰系一根绳,头戴安全帽,左手牵绳,右手刷窗。”

这是蜘蛛人的生活日常,他们垂吊在摩天大楼之间,用渺小的身躯一点一点将高楼外墙的污渍清理干净,给城市留下一张亮丽的名片。

对于蜘蛛人来说,烈日酷暑只是家常便饭,最难处理的是大风。一旦作业过程遭遇大风,整个人只得停下工作,身体蜷缩在一起,将安全寄托在那根生命绳上。

据相关部门统计,这样的蜘蛛人有十数万,他们在气候恶劣的环境下工作,每年因高空清洁作业导致的事故高达数千起。并且,高空作业时,人的活动大为受限,体能消耗得很快,工作效率并不高。

显然,这类危险且累的工作应当让机器人来完成。被“解放”出来的人,可以在地面上进行遥控指挥,不但安全得到保障,作业效率也大幅提升。

史河产品总监刘彦雨告诉雷峰网,传统人工作业的方式,每人每天可清洗600-800平米,而机器人可清洗900-1200平米,效率提高了50%以上;在成本方面,外墙清洗的平均费用大致在2-3元每平方米,而机器人可以将成本下降30%左右。

换言之,外墙清洗机器人从安全、效率和成本方面,都有无可比拟的优势。但现阶段,外墙清洗机器人的实际市场却还没有被打开,机器人的价值尚未得到释放,离大规模落地还有一段距离。

刘彦雨表示,当前外墙清洁机器人难上量的原因在于,高空立面清洁场景十分复杂,还有许多技术难点需要攻克。

难点:清洗、越障、安全

国内的玻璃幕墙分两大类,一类是全玻璃幕墙,另一类则是带框的玻璃幕墙。

全玻璃幕墙的所有材料(包括玻璃肋和面板)均为玻璃,其特点是透明、开阔,视野好,极具通透感,但加固难度会随着楼层的高度上升而成倍增加。因此,全玻璃幕墙只适用于一些楼层不高的建筑,比如高端展厅、汽车4S店等。

带框玻璃幕墙的骨架一般由性能较好的金属框架构成,玻璃面板则被嵌入至对应的凹槽内以固定。因稳定性、安全性极高,带框玻璃幕墙被广泛应用于酒店、写字楼等高层建筑中,市场占比高达80%以上。

全玻璃幕墙的清洗较为容易,机器人只需要吸附在玻璃上,按照规划作业,就能完成清洁,效果好且效率高。而带框的玻璃幕墙,机器人需要在清洗玻璃的同时,清洗边框。

传统的方案是机器用水冲洗,即采用类似于高压水枪的原理,将机器人内部水箱里的水喷射出来进行清洗。

刘彦雨告诉雷峰网,该方案存在两个不足,一是无法处理喷出的水渍,在重力影响下,水渍会沿着玻璃流淌,堆积在下方的框架上,造成二次污染;二是水的利用率很低,机器人换水频率较高,作业效率也大打折扣。

除了清洗边框这个难点以外,更大的挑战在于,机器人在清理完单个框内的玻璃之后,需要越过玻璃之间凸起的框架。这就带来两个问题:如何保证在越障时机器不会坠落,以及越障时清洗边框,并回收多余的水渍,提高水的利用率。

众所周知,带框的玻璃幕墙,玻璃连接处存在一个高数厘米的“坎儿”,机器人需要越过这道坎儿,才能进入下一个清洁区域。由于机器人吸附在玻璃上,在越障时,接触面存在一个微小的缝隙,会降低吸附力,如果技术不过关,很容易导致机器人直接脱离窗面在空中摇摆;而且,机器人属于带水作业,清洗边框时必须将水回收保证水的能耗以及清洁效果。

如果仅仅是清洗或者越障,机器人已经可以高效地完成。比如,越障可以采取足式底盘的方式,遇到边框时,机器人探出双足,越过之后回收,但这种方案的清洁效率较低。

“如何让机器人在越障清扫时保证效率,是一个比较大的技术挑战。” 

外墙清洗机器人的清洗、越障、吸附、回收这个几个功能是连贯且统一的,不可分割。这就导致机器人的内部结构非常复杂,对机器人产品的结构设计、采用的吸附和清洁技术要求极高。此外,复杂机器人的功能设计必须简单化,才能降低理解成本,让转型的“蜘蛛人”能够快速上手、使用。

在这个复杂的高空作业场景中,目前市场上还没有一款能够完美解决客户痛点的产品,这也是导致外墙清洗机器人难以大规模商业化落地的根本原因。

不过,问题也意味着机会。在经历数年的产品开发与迭代之后,史河机器人针对这些痛点,做了大量适应性改造,并推出了全新的外墙清洗机器人大黄蜂BeeBot Pro V20、BeeBot Mini V10,以及为这些机器人提供远程管控和升级的Move on the Cloud 物联网平台,从而尽可能解决当前外墙清洗的各种难点。

解法:产品、技术、价值

2020年3月,史河科技正式立项开发做外墙清洗机器人,并于当年10月份推出原理样机。半年后,史河科技在原理样机的基础上打造了工程样机。

该样机首次采用了史河自研的“移动卷扬”技术,仅需一个锚点,即可在楼顶快速、便捷地完成作业部署,从而解决了多场景的楼顶部署问题。随后两年时间里,史河又研发了锁水式的自清洁模组和无痕负压刮条等关键清洁技术,达到镜面级清洗效果,并将这些技术实现工程化和产品化,同时为产品的量产做了大量调校。

2023年3月,史河正式推出了第一款外墙清洗机器人BeeBot Pro V10(大黄蜂),正式进入立面清洁市场。

BeeBot Pro V10 采用固定“锚点 + 移动卷扬 + 索式牵引”的方式,来保证机器能够安全在纵框幕墙上移动;整个机器采用多腔负压吸附技术和高性能防滑材料来增强稳定性;在清洁结构上,BeeBot Pro 实现了洗、刷、擦、刮四合一 ,可无痕负压刮条,并清理水渍。

不过,BeeBot Pro V10 的缺点在于,无法清洗边框,越障能力稍弱。

基于此,史河开发出了全新的BeeBot Pro V20。相比较V10,V20带来了多个方面的提升:

  • 增加了边框清洗单元,类似于一个背包附件,该附件集成了双滚刷,可以对窗户进行高效的边框清洁;

  • 新增四轮转向模组,机器人除了上下移动之外,还可以左右横向移动;

  • 自适应的吸力恢复装置,以实现机器人在越障之后能够恢复吸力,保持吸力稳定和安全;

  • 清洗宽度从800毫米提升到1000、1200、1400毫米,适应国内常见的玻璃幕墙;

  • 配备水汽分离器,实时回收水分,保证续航;

  • 可实现蜂群作业,单人可同时控制三台机器,从而提高效率。

目前,BeeBot Pro V20已经可以解决边框清洗、越障、安全等行业痛点,但“在效率上还可以进行提升”。刘彦雨表示,产品解决问题只是基础能力,为客户带来降本增效才是机器人的价值,未来半年史河将花更多资源来打磨产品,提升机器人的整体运作效率。

除了大黄蜂之外,史河科技也推出了清洁机器人BeeBot Mini V10(小蜜蜂),从外墙清洗拓宽至内高空场景。

史河科技营销总监许鑫告诉雷峰网,外墙清洗属于刚需,根据相关的国家政策,甲级写字楼、酒店等企业,外墙每年需要清洗一次,但是目前的清洗效率较低;同样,内高空场景的清洁也存在,且成本更高。据了解,外立面清洁每平方米大概2-3元,而内高空场景则达到了10-15元,显然,内高空的单位价值更高。

虽然市场价值很大,但内高空场景的清洁存在一个明显的「供需缺口」。

“内高空场景下,传统作业方式需要花大量的时间「上梯下摆」,非常耗费体力,作业时间也少,清扫的面积不多。在收入与清扫面积挂钩的前提下,许多蜘蛛人并不愿意接活儿。此外,有些曲面的场景,蜘蛛人也无法清洁。”

为此,史河科技研发了体积更小、重量更轻的“小蜜蜂”。据了解,“小蜜蜂”的清洁效率接近每天800平米,且成本较低,已经能够满足内高空场景的需求,也可用于部分低空场景的外墙清洗,极具性价比。

自发布以来,“大黄蜂”+“小蜜蜂”的组合,已经服务了将近 200 栋楼,累计服务的面积超过 50 万平,覆盖了诸如杭州交投大厦、越洋国际、太湖科创中心等地标性建筑。

随着机器人的应用部署,硬件设备的持续增加,对于这些设备的远程管控、升级,以及对现场设备的运作状态、人员部署情况等等,需要一个数字化工具来实现可视化管理。因此,史河在两款机器人的基础上,搭建了一个云端的物联网平台“Move on the Cloud ”。

基于该平台,大黄蜂和小蜜蜂可实现持续的OTA升级,通过软件实现技术功能更新;同时,客户可以观察整个现场的实时情况,包括设备分布、里程、面积、续航,以及故障率、耗材使用明细等等,实现数字化管理。

许鑫认为,软硬件融合是机器人最本质的特征,机器人的生命周期很长,需要不断通过软件迭代来优化功能,单纯的硬件只能叫机械设备,很难满足复杂场景的清洁需求。因此,史河推出软件平台,根本目的在于提高产品的核心竞争力,提供一整套的立面清洁方案,解决客户更多的需求痛点。

模式:销售、租赁、RaaS

做好产品只是基础,如何触及客户,让客户愿意买单,除了产品具备竞争力之外,其商业模式也至关重要。

在商业化落地路径上,史河科技按照产品的差异,以及客户需求的不同,主要采用了三种模式:销售、租赁和服务(RaaS),这三种模式并不独立,可以互相搭配,灵活调整。

例如,针对客户存在临时清洗的需求,大黄蜂小蜜蜂都可以直接进行租赁,按周收费。

具体到产品,大黄蜂由于体型较大、设备更复杂、价格更高,并且需要由专业人士进行操作,因此主要采取“服务运营”和“设备租赁”的模式,并不直接销售单品。小蜜蜂则以设备销售、租赁为主,代理商可直接申请代理资格进行合作。

许鑫告诉雷峰网,外墙清洗机器人是一个全新的品类,市场上的客户还没有形成直接购买机器的习惯,更倾向于通过招投标的方式来购买服务。

因此,史河机器人对于这类客户,主要采取两种策略:一是直接以服务的形式与客户签单,史河通过自身的服务公司来进行项目交付;另一种是将设备租赁给相应的保洁公司,共同为客户服务,从中收取设备租赁费用。

而为了解决to B获客最后一公里的问题,史河科技又发布了十城计划,通过招募城市合伙人,去触达单一城市的有效目标客户,与城市合伙人一起提供外墙清洗服务,并收获价值。

许鑫表示,现阶段外墙清洗的智能化还处于初期,产品需要持续迭代,商业模式也正在探索之中。行业需要更多的机器人厂商、服务商、代理商等多方,共同进行市场教育,从而打造一个完整的合作生态,推动传统高空立面清洁的“机器人化”变革。

总结

据统计,我国整个一二线城市的建筑外墙大约70-80亿平方米,每平方米的清洁成本平均为3块钱,按照每年一次计算,那么外墙清洗每年的市场规模高达200亿元以上。如果再叠加室内场景,以及清洗频率更高的甲型写字楼、高档酒店等,实际市场规模将更大。

现阶段,人工作业进行立面清洁仍然是主流模式,但这种模式效率较低,存在各种安全隐患。未来,让机器人从事高危工作将成为大趋势,立面清洁机器人也将迎来一次市场扩容。

作为立面清洁的头部公司,史河也将持续迭代技术、打磨产品,在给市场提供完整的立面清洁解决方案的同时,助力蜘蛛人转型,使其成为机器人的使用者,从事更安全、更有价值的工作。(雷峰网雷峰网)

]]>
机器人 //m.drvow.com/category/robot/2B8HGELpGMqgS93Z.html#comments Tue, 26 Dec 2023 10:45:00 +0800
优必选即将上市,人形机器人行业前景几何? //m.drvow.com/category/robot/1d9AnXZbSQQH3KzS.html 1967年,日本早稻田大学的加藤实验室正式启动WABOT项目。五年后,名为 WABOT-1 的机器人走出实验室,世界上第一个全尺寸人形智能机器人诞生。

虽然 WABOT-1 行走一步需要45秒,步伐也只有10公分左右,但这项技术,在当时仍震惊了全世界。

时至今日,人形机器人技术几经迭代,呈现出三个明显的发展阶段:缓慢静态行走、连续动态行走、高动态运动。如今,人形机器人已经进入第四个阶段,也就是商业化初期阶段。

人形机器人设计的初衷,是创造一个能超越人类自身生产力的工具,将人类从重复、枯燥的岗位中解放出来,从事更具创造力的事业。

想要实现这一点,必须满足两个条件:高度智能化、规模化量产。

然而,人形机器人的优势固然明显,但其研发投入高、落地难的现实也困扰着诸多企业。像日本本田、软银,美国波士顿动力等先行企业也尚未解决成本控制、规模化量产的难题。

近年,特斯拉、亚马逊、三星等科技巨头先后布局人形机器人,掀起资本市场对人形机器人的关注,一度遇冷的人形机器人行业再次站在了风口之上。

这反映出当前人形机器人的两种现实:

1、人形机器人时代正在到来;

2、已经有一些人形机器人企业,开始找到了清晰的商业化模式。

围绕这两大现实,市场对人形机器人的预判,也出现两种极端对立的观点:一派认为人形机器人是大方向,未来将代替人进行工作;另一派则质疑人形机器人是伪需求,技术、成本都不足以支撑商业化。

12月1日,优必选正式通过港股聆讯,有望成为“人形机器人第一股”,再次掀起市场对人形机器人的关注。

政策、资本加持,人形机器人前景几何?

足式机器人国际知名学者张巍教授曾做过一个类比:手机是个人通讯娱乐的通用终端,智能汽车是未来结构化道路上的通用终端,人形机器人则将是面向各类非结构化场景的通用终端。

自上世纪60年代末以来,机器人广泛进入人类的生产生活,稳定、高效的机械结构在一些特定场景代替人力,完成重复、繁重且高难度的工作,有效缓解了劳动力不足问题。这类机器人,大多以轮式移动搭载机械臂的方式完成任务。

相较之下,人形机器人的尺寸和运动设计,以人类所处社会环境为参照系。这就意味着,人形机器人理论上可以解决任何需要人类解决的移动操作问题,而人类在享受生产生活效率提升的同时,却不必为机器人在环境上做出改变。

以整个社会建造过程中的沉没成本计算,开发人形机器人,无疑是加速机器革命,迎接人机协同时代到来,一种更为经济合理的方式。

与此同时,人形机器人的未来市场,看起来实在太过诱人。

全球老龄化趋势愈发明显,人口压力使得机器人需求不断增加,人工智能、5G、大数据、云计算等技术的不断创新下,传统业态向智能化的转型,进入全新的阶段。

政策层面也在鼓励机器人产业的萌芽。2021年国内,颁布《“十四五”机器人产业发展规划》;2023年工信部等17部门提出《“机器人+”应用行动实施方案》;10月工信部进一步发布《人形机器人创新发展指导意见》,明确提出集成人工智能、高端制造、新材料等先进技术的人形机器人,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品。

资本市场层面,优必选的上市目的地香港,近年来投入大量资源以吸引创科企业落地,例如拨款 300 亿港元成立“共同投资基金”;计划于五年内吸引100家具有潜力的创科企业落户香港,包括20家龙头创科企业等。香港特别行政区特首李家超也曾表示,“无创科、无未来”,香港正全力以赴建设国际创新科技中心,推进香港和粤港澳大湾区其他城市产业链优势互补,助力香港在创新科技发展实现新飞跃。

像优必选这样在深圳创业成长的创新科技企业,正是香港发展创科的重点引进对象,能够得到更多的支持和发展机遇。这次优必选赴港上市,也能补充港股在创新科技布局方面的不足,带动更多创新科技企业赴港上市,从而优化港股结构,为香港资本市场带来新动能。

在供应端,人形机器人的供应链,可以从机器人自动化、人工智能、自动驾驶等既有产业的上下游迁移发展而来,比如人形机器人的核心零部件、感知系统等都与上述行业有很深的同一性。

作为机器人的最高形态,人形机器人也被全球的科技、互联网巨头纷纷看好,特斯拉、亚马逊、三星等,或通过自研,或以投资形式,重注人形机器人。

比如,特斯拉推出了Optimus,亚马逊旗下的Agility Robotics 推出了Digit Robotics,三星也在今年初宣布投资韩国人形机器人企业Rainbow。

据高盛预测,人形机器人2035年市场规模将达1520亿美元,届时将与电动汽车市场旗鼓相当,相当于2021年智能手机市场规模的三分之一。

然而,人形机器人的商业化,是所有玩家亟需解决的首要问题。

作为集人工智能、机械控制、硬件结构等一体的终端产品,人形机器人的难度系数目前公认最高。

首先,人形机器人是一个复杂且庞大的工程系统,其运动能力与算法之间,存在着一条莫拉维克悖论:机器人可以在需要庞大数据计算的领域轻松击败人类,但却难以拥有像一岁小孩一样的感知和行动能力。

当前的人形机器人还处于弱人工智能阶段,尽管部分方向的技术和工艺已经成熟,但掣肘人形机器人发展的动态平衡、运动规划、移动感知等技术难题还没有取得突破性进展。

本田、软银等公司虽然在人形机器人技术探索方面布局超前,然而超高的研发成本,以及商业化模式的不明朗,使其陷入了叫好不叫座的尴尬境地,从而导致研发难以为继。

因此,这些明星玩家也在烧钱之后,或改弦易辙,或偃旗息鼓。

与此同时,也有还在坚持做人形机器人的公司,逐步走出研发工作室模式,初步探索出了商业化的雏形。这些公司包括波士顿动力、美国创业公司Agility Robotics,以及中国企业优必选。

作为国内投入人形机器人的公司,优必选在过去十多年的时间里,在伺服驱动器、运动控制、自主导航等技术上做到了国内顶级,除了推出了以 Walker 系列为代表的真人尺寸人形机器人,还走出了一条独特的商业化路径。

人形机器人的“春天”,在工业场景里?

此前,人形机器人企业商业化上的受阻,很重要的一个原因在于发展规划不够清晰。

ASIMO 机器人和 Atlas 机器人更像是为展示技术实力而研发的产品,而非有着慎重商业化考量的商品。

成立于2012年的优必选起步虽晚,但其商业化路径十分明确,目前,优必选的人形机器人产品聚焦工业制造、商用服务和家庭陪伴三大应用场景。

劳工成本上涨和工人短缺形势助推下,优必选、小米、特斯拉等多家企业都已将目光聚集于工业领域。

他们看中的是,人形机器人和传统自动化设备协作作业,可以解决复杂场景的柔性无人化,自主完成扭矩拧紧、柔性装配、物料搬运等任务,将人从重复性的劳动中解脱出来。

马斯克认为,人类社会对人形机器人的需求量甚至达到百亿级别,机器人的需求会远远超过车,特斯拉的长期价值将是人形机器人擎天柱。

在今年的世界机器人大会上,优必选创始人、董事长兼CEO周剑也提到,人形机器人已进入产业化落地阶段,其中智能制造将成为人形机器人首个大规模应用的领域。

基于这一认知,优必选在今年有两个大动作:一是在今年6月与新能源汽车制造供应链企业天奇股份成立合资公司;二是在前三代Walker机器人的基础上,研发工业版人形机器人Walker S,并已与多家新能源汽车头部企业合作,希望在工业制造场景落地。

优必选最为大众熟知的,就是其打造出的大型人形机器人 Walker 系列。从进驻迪拜世博会中国馆,再到成功出口沙特NEOM新未来城,Walker系列被认为是优必选人形机器人商业化的代表产品。

从2018年问世至今,Walker 经历了4次重大迭代。第三代 Walker X,全身拥有41个高性能伺服关节,使其可以在20°斜坡、15cm 高的台阶、3cm不平整地面实现自适应平稳行走,且最快行走速度达到3km/h。

在智能化方面,自平衡能力可以让 Walker 在受到外部冲击扰动或惯性扰动时,调整姿态保持平衡;手眼协调操作功能,通过视觉、力感、听觉感知的配合,可以让Walker 自如的拿取物品;全身柔顺控制,则相当于给机器人与人的交互过程,增添了一道安全锁,此外,Walker 还具有更强大的视觉识别能力,以及场景理解能力等。

据悉,优必选在制造业场景中的规划分为三个阶段:

第一阶段(2023年-2024年),以新能源汽车制造场景作为人形机器人在工业场景的切入点,实现人形机器人在搬运、涂料等工业场景中的测试。

第二阶段(2025年-2027年),逐步拓展至中等难度任务,重点打造3-5个专用场景下的应用,逐渐实现规模商业化,横向拓展至消费电子制造业等其它行业及应用场景。

第三阶段(2028年-2033年),进一步拓展到较为复杂的任务场景,具备超过10+种技能,成为多任务通用型工业人形机器人。

在人形机器人之外,优必选在其它领域的布局,同样是基于社会趋势演变的尝试。

2017年,优必选在AI教育行业开始商业化探索;2020年开始进入物流行业;2022年发布的智慧康养解决方案则来源于人口老龄化下的需求,针对这些场景,优必选已推出Yanshee偃师、AMR系列、Walker 系列、克鲁泽等机器人。

商用服务场景是人形机器人最快应用的市场。优必选2017年就已在AI教育行业开始商业化探索;2020年开始进入物流行业;智慧康养则来源于人口老龄化下的需求,针对这些场景,优必选已推出Yanshee偃师、AMR系列、Walker系列、克鲁泽等机器人。

教育、康养虽然是To B场景,却能直接接触到C端用户,为优必选打通消费者层面的品牌认知;与此同时,通过互动产生的内容,又能进一步丰富优必选的内容生态,为更多用户产生价值。

企业用户外,优必选还推出了面向消费者的家庭教育类机器人、家用扫地机器人 Airrobo 等产品。

初看之下,除了人形Yanshee 偃师和Walker系列,优必选针对行业应用、家庭应用等推出的多种服务机器人,其实和真正意义上的人形机器人相差甚远。

但实际上,这些产品都在不同维度上都应用到了优必选在人形机器人领域所积累的技术。与此同时,由于形态与一般的人形机器人不尽相同,意味着其所需的技术难度相比人形机器人要小得多。

“当前人形机器人商业化落地很难,由于技术不成熟以及市场容量本身较小,且多是G端客户。所以优必选实际上是将人形机器人的部分功能,先运用到具体的业务场景,在产生业务价值的同时打磨技术,进而反哺到人形机器人。”

机器人领域从业者Simon告诉雷峰网,人形机器人成本高、消费市场狭窄限制着其商业化,从市场和技术的角度考虑,优必选这种打法有一定合理性。

同时,Simon也认为,人形机器人市场想象空间很大,但现阶段的技术仍有缺陷,距离真正的类人还有很长一段距离。

人形机器人走进现实还有多远?

如果说,能够站在时代的缝隙中窥见星辰大海,体现着创新者的远见卓识,那么,在看清前路的艰辛与不易后仍能迈步远行,则体现着创新者的伟大。

人形机器人的大规模商业化之路,犹如万里长征,期间需要经过三道重要关卡的检验:供应链降本、技术创新、痛点场景理解。

人形机器人之所以迟迟难以落地,一个重要原因就是成本居高不下,本田 ASIMO 机器人一台造价便高达300万-400万美元,波士顿动力的 Atlas 造价也在200万美元,其中大部分成本来自于核心零部件。

据东吴证券研报,传统工业机器人核心零部件占整机70%以上的成本,考虑到人形机器人自由度更高,所需零部件更多,其成本占比也会更高。

因此,降低供应链成本,是人形机器人商业化落地的重要突破口。

优必选之所以能在行业中率先实现商业化,主要有两个原因。

其一,不同于大多数机器人公司在硬件方面采用代工生产的方式,优必选在成立之初就确定了研发、设计、生产全链条的生长路径。

其二,掌握并完全集成了机器人伺服驱动器、运动控制、人工智能感知、机器人定位及导航等核心技术及算法。

以伺服驱动器为例,作为机器人必不可少的核心零部件,伺服驱动器需要在接收到主控的位置命令后,通过位置、速度和力矩三种方式对伺服电机进行控制,实现高精度的平稳运行。

这就要求机器人的自由度(关节数量)越大越好。普通工业机器人的关节通常在2-10个之间,人形机器人则能达到数十个,关节数量越多,响应命令越精准及时,机器人就越能实现复杂的运动。

然而,定制化的驱动器(电机减速器、编码器及关节结构)价格高昂,若非自研产品,可能占到总成本的一半甚至更多。

在这一方面,优必选走在了前头。根据招股书,优必选是世界上极少数实现多系列伺服驱动器量产及实际产品应用的公司之一,已掌握从0.2Nm小型伺服驱动器到120Nm大型伺服驱动器的量产能力。

优必选-伺服驱动器

对于当下的人形机器人赛道来说,商业化竞争的另一个核心锚点,在于找到适合的应用场景。

2022年10月1日,特斯拉在举办的AI Day活动现场,公布了人形机器人“Optimus”原型机,埃隆·马斯克宣称:“擎天柱的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,最终价格将达到2万美元以下,3到5年间即可量产上市。”

多位人形机器人专家向雷峰网表示,马斯克所说的人形机器人售价降至2万美元以内,可以引爆市场,从消费者的角度看,逻辑没问题。从现实角度看,目前的技术还做不到。

优必选在创业前期,也曾在C端进行过大量的探索。但很快,优必选意识到,受限于人工智能目前的发展阶段,相比于消费级场景,B端场景更有可能获得大规模的应用。如前所述,教育和物流行业已经成为优必选最主要的收入来源。

当然,全链条的打造、研发体系的建立和场景的探索,离不开持续的技术投入。

招股书显示,2020年至2023年上半年间,优必选营收分别为7.40亿元、8.17亿元、10.08亿元、2.61亿元,研发开支分别为4.29亿元、5.17亿元、4.28亿元、2.24亿元,占当期总收入的57.9%、63.3%、42.5%及85.9%。平均下来,优必选在报告期内的年平均研发开支占总收入的56.5%。

在人民网最新发布的《人形机器人技术专利分析报告》中,可以看到这样一组数据,近十年来中国人形机器人技术专利累计申请数量已达6618件,是全球申请数量最多的国家。其中,中国企业优必选的人形机器人有效技术专利数量达763件,排名全球第一。

数量优势之外,优必选在人形机器人的技术布局上也具有全面性。

人形机器人技术构成主要分为本体结构、核心零部件、智能感知、驱动控制、支撑环境等方面。优必选自2012年成立以来,布局了机器人运动规划和控制、伺服驱动器、计算机视觉和语音交互、SLAM及自主导航技术、视觉伺服操作和人机交互以及机器人操作系统应用框架ROSA等核心技术。据报告统计显示,在核心零部件、本体结构、驱动控制三个领域,优必选的专利申请数量均为中国第一、全球第二。

“技术的商业化应用,到规模化量产,还涉及到供应链、市场等多方面影响,这是一个长周期。在这个周期内,企业的各项成本必然需要产品消解,反应到人形机器人产品上,就是高达数十上百万元的终端价格。”Simon表示。

不过,当前全球主要国家都普遍制定了数字化转型和人工智能战略,人形机器人前期市场的渗透率虽然相对较低,但并不意味着有价无市。随着技术进一步成熟,在可预见的未来,人形机器人的成本有望进一步降低,从而实现普及率的持续上升。

“人形机器人是一件很难的事情,短期内很难看到结果,但把时间纬度拉长,这个市场仍然具备想象空间。指不定在某个时间点,技术取得了突破,成本就大幅下降了。就像 ChatGPT 给通用型人工智能带来了曙光一样。”Simon补充道。

如今,在克服这三道关卡的过程中,技术的进步也许会成为一个有力的外部推动。

如前面提到的,ChatGPT的出现给通用型人工智能带来了曙光,也让外界看到了人工智能与更多领域结合的可能。人形机器人就是其中一个主要方向。

民生证券在今年二月的一份研报中提及,ChatGPT具有深度学习特质、出色的语言理解和文本对话生成能力,ChatGPT的语言理解和生成水平的便捷性或带来人形机器人下一拐点,为人形机器人注入“灵魂”。就连ChatGPT自己,在被问到相关问题时,也会表示“人形机器人是自己的最佳载体”。

作为ChatGPT母公司的OpenAI,自然不会忽视这一滚滚而来的趋势。其旗下的创业基金就在不久前被报道领投了来自挪威的人形机器人公司1X Technologies,让业内看到了先进的人工智能技术与人形机器人更进一步结合的可能性。

后记

人形机器人想要向前发展,技术探索与商业化探索,需要齐头并进。

当前,全球人形机器人市场呈现出两大市场趋势:

•技术不断推动下,应用场景不断拓展;

•生产成本逐渐下降,企业开始初步探索商业化。

作为国内首家做出人形机器人的企业,优必选上市备受关注,随之而来的,是外界对人形机器人发展前景的多样讨论。

对于人形机器人产业而言,其完整的产业化链条有待继续完善;但客观来说,优必选确实迈出了第一步。

]]>
机器人 //m.drvow.com/category/robot/1d9AnXZbSQQH3KzS.html#comments Wed, 06 Dec 2023 14:26:00 +0800
搭载开源鸿蒙系统、年底开始交付,乐聚发布首款人形机器人「KUAVO」 //m.drvow.com/category/robot/Ok8xyANUEKGlK2xT.html 雷峰网获悉,深圳「乐聚」机器人公司今日正式发布了首款搭载开源鸿蒙系统的人形机器人「KUAVO」。

据介绍,KUAVO(中文夸父)是一款大尺寸的高动态人形机器人,重量约45kg,全身拥有26个自由度,可以完成复杂地形自主行走、持续连续跳跃等系列高难度运动。具体来看,KUAVO的步速最高可达4.6km/h,快速连续跳跃高度超过20CM,是国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人。

乐聚CEO常琳认为,伴随着供应链、技术的成熟,人形机器人的零部件成本持续下探,加上大模型的涌现,机器人的智能化水平得到进一步提升。这意味着人形机器人即将抵达商业化落地的奇点,而KUAVO将在教育、医疗物流、家庭服务等行业实现落地应用。

常琳告诉雷峰网,人形机器人的终局一定是走进生活场景,但现阶段存在技术、成本等问题,还无法实现大规模批量生产。他表示,KUAVO机器人的商业化分为三个阶段:

  • 第一阶段将以to B教育、科研为主

这个阶段处于技术探索期,由于机器人的成本比较高、智能化程度也无法达到普通C端消费者的预期。因此,对于人形机器人企业而言,先聚焦客单价高的to B市场,在科研、教育等场景进行小批量交付,实现一定的自我造血的能力,非常重要。

目前,在教育科研领域,乐聚已与哈尔滨工业大学、苏州大学、山东大学、北京通用人工智能研究院等各大高校和研究院在研发方面展开了深度合作。

  • 第二阶段,人形机器人将进入行业场景

在第一阶段的基础上,企业通过不断迭代技术和产品,并且进一步降低生产成本,从而推动人形机器人走进特种、工厂、医疗等行业,让机器人替代人从事高危工作。乐聚已经与相关企业达成合作,针对特种救援、高危作业等应用场景提供可靠的产业化落地方案。

  • 第三阶段,机器人全面进入生产生活

该阶段,机器人技术和供应链都已非常成熟,成本也持续下探至数万元,人形机器人已经具备大批量落地的条件。人形机器人将全面进入家庭场景,满足生命健康、陪伴护理等生活需求。

常琳表示,对于人形机器人创业公司而言,一开始就做to C的生意并不实际,因为成本太高,没有消费者愿意付费,反而 B端客户更具购买力。因此,企业早期做to B市场,进行产品验证、迭代、降本,同时形成更好的现金流,以战养战,然后再做to C市场,是一条可行的商业路径。

在过去几年时间里,乐聚的业务重心以教育为主,其次是医疗和特种场景的机器人,已经落地在不同的场景中,积累了对应的技术,这是乐聚做人形机器人的基础。

不过,人形机器人要从实验室普及至生产生活,现阶段还存在几个难点。

一是核心零部件,如舵机、电机等成本太高;二是运动控制的相关技术需要攻关;三是人形机器人的结构非常复杂;四是对应的操作系统还不完善;五是人机交互水平有待提高;六是消费终端的app生态尚未形成。

现阶段,乐聚已经在前三个难点中有所积淀,但整个人形机器人的发展需要整个产业链的分工协同、合作。比如,KUAVO就采用了开源鸿蒙操作系统,虽然ROS系统的生态更为成熟,但开源鸿蒙系统需要有企业使用,才能不断迭代,从而形成自主可控的国产操作系统。

据了解,KUAVO目前已经有数十台订单,主要落地在科研教育、特种作业等领域,乐聚将于年底开始交付。常琳表示,在整个产业链的协同发展、共同努力下,人形机器人将以更快的速度落地,并迎来商业化的曙光。(雷峰网雷峰网)

]]>
机器人 //m.drvow.com/category/robot/Ok8xyANUEKGlK2xT.html#comments Tue, 05 Dec 2023 11:13:00 +0800
首发|前文远知行COO张力、港大副教授潘佳加入「逐际动力」,推动通用足式机器人进化 //m.drvow.com/category/robot/ZrZdK8eNo8voBdGd.html 雷峰网获悉,前文远知行COO张力正式加盟通用足式机器人公司「逐际动力」,成为联合创始人,并任首席运营官;与其同时加入的,还有香港大学计算机系副教授潘佳,将担任首席科学家一职。

张力曾任职思科中国长达19年,担任思科大中华区资深副总裁、CEO幕僚长等职务。2018年2月,张力加入自动驾驶公司「文远知行」,任COO,负责战略运营、市场拓展及商业化等工作。

2023年10月,张力正式加入逐际动力,成为联合创始人,担任首席运营官。

张力告诉雷峰网,足式机器人经过多年的发展,已经进入到新阶段。一方面,AI大模型、视觉等技术的应用与成熟带来了软件算法的新突破;另一方面,国家政策的大力支持、资本市场的持续看好,营造了良好的市场环境。

张力表示,自动驾驶与足式机器人在许多技术和供应链上相通,比如导航定位、路径规划、零部件制造、生产线等,足式机器人技术不仅和自动驾驶互补,并且落地场景相对可控,已经具备商业化落地条件。足式机器人可能是汽车行业未来的一个新的增长点。

在逐际动力,张力将主要负责海内外业务的战略规划、渠道拓展和项目落地,以及工业巡检、汽车制造、物流配送等行业的业务拓展和商业化,有望为足式机器人行业的商业模式带来创新和启发。

潘佳本科毕业于清华大学自动化系,获美国北卡罗莱纳大学教堂山分校计算机系博士学位。博士后期间,潘佳在加州大学伯克利分校电子计算机系从事机器学习与机器人相关的研究,现任香港大学计算机系长聘副教授。 

据悉,潘佳是最早将深度强化学习、自然语言处理等方法成功应用在移动机器人感知与动态避障问题的学者之一,其开发的机器人碰撞检测和距离计算库 FCL(Flexible Collision Library)和参与开发的机器人运动规划库 TrajOpt、ITOMP 等基于 CPU 和 GPU 的轨迹优化方法在机器人领域广泛应用。

潘佳认为,人形是释放足式机器人从底层运动控制的学习,到上层AI技术的应用的最佳通用系统。机器人越通用,越适用于采集可泛化数据,产生越大的价值,这些恰恰也反哺了AI技术在足式机器人上的发展,是人形机器人在不久的将来成为真正的生产力工具的必经之路。

加入逐际动力后,潘佳将担任首席科学家,负责为逐际动力提供前沿 AI 技术在通用足式机器人上的研究和应用转化,例如增强机器人在复杂场景理解、自主任务分解、运动规划和优化等方面的上层能力,推动通用足式机器人从运动智能向具身智能的迭代进化。

逐际动力创始人张巍表示,当前,通用足式机器人正处于技术与商业化交集不断扩大的重要时间节点。张、潘两人将在商业化和前沿 AI 技术攻关方面提供助力,从而推动逐际动力的技术攻关和商业化进程。

雷峰网长期关注机器人赛道,如你有好的观点、项目,欢迎添加作者微信nanshu0126互通有无。

]]>
机器人 //m.drvow.com/category/robot/ZrZdK8eNo8voBdGd.html#comments Tue, 07 Nov 2023 10:00:00 +0800
强势增长,追觅科技问鼎「扫地茅」 //m.drvow.com/category/robot/Hf9JeijooNr5zjXY.html

1920 年,捷克作家 Karel Capek 在科幻戏剧《罗苏姆的万能机器人》中创作了“ robotnik ”一词,首次引入“机器人”( robot )的概念,也成为了人类最早的机器人设想。
 
如今,当我们讨论百年前的机器人时,会发现它并不拘泥于某个具体的形态,而是人类科技突飞猛进的象征。
 
经过百年发展,机器人深入了人类生产生活的方方面面。中国也成为了世界上最大、增速最快的机器人市场。
 
消费级、商业级、工业级,各个场景的机器人市场都迸发出活力,源源不断涌入的新兴企业也让机器人赛道愈发热闹。

其中消费领域的扫地机器人市场,也迎来了新时代,涌现了一批技术与产品实力兼具的创新者,而时代会奖励创新者。

一、追觅:新晋扫地茅

2022年,扫地机器人市场发展趋于平缓,增长速度突然降了下来。
 
第三方机构奥维云网(AVC)的数据显示,2022年中国扫地机器人市场销量为441.4万台,同比下降23.8%。
 
市场增速放缓,但并不意味着扫地机市场就没有了转机。
 
2023年,国内迎来经济复苏,消费力也逐渐恢复,扫地机器人行业度过了阵痛期,开始实现正增长。
 
GfK数据显示,2023年扫地机器人上半年零售额达63.5亿元,零售量达192万台。扫地机器人市场开始回暖。
 
虽然市场总量在增加,但速度放缓,在玩家扩容,行业竞争更加激烈的背景下,更考验企业的技术硬实力和产品创新力,能实现增长的企业,屈指可数。
 
有家企业加速突破,剑指行业第一,它就是追觅科技。
 
其实,在整个行业市场增速放缓的2022年,追觅科技的业绩表现就颇为亮眼,实现了逆势增长,营收同比增长60%。其中,中国区业务实现了600%的增速。

更有力的证明来自消费者的认可,今年618,追觅科技全渠道销售额突破9亿元,增长超100%。
 
在细分市场上,追觅科技增长也非常快。2023年上半年,追觅科技以惊人的138.6%增长率成为扫地机器人行业唯一高增长品牌,其市场占有率升至行业第三,达到11.8%。

中怡康数据显示,2023年上半年,追觅扫地机以高达37.9%的市占率,稳居高端线(5000元以上价位段)市占第一。

追觅,已经成为行业新晋“扫地茅”。

不仅如此,追觅扫地机器人在全球市场也备受青睐。

2023年10月6日,追觅科技在日本推出了使用仿生机械臂技术的尖端旗舰扫地机器人——DreameBot L20 Ultra Complete。德国2023 IFA展会期间,荣获众多权威媒体认可,被评为“Best of IFA”;韩国首发期间,Naver 直播15分钟超千台售罄。

全球消费者的共同选择也侧面反映了一个行业现实。2023年,竞争白热化,消费者对于扫地机的认知已经“祛魅”,更青睐于集扫地、拖地、自动集尘、自清洁等功能于一体的扫地机,而不是只有扫地功能的单品。扫地机器人拼的不再是单个技术的提升,而是方方面面的进步。
 
此外,扫地机器人消费趋势日益变化。过去,人们对扫地机的期待不过是能把地扫干净,在近10年的市场认知培育之后,消费者不再单纯是技术发烧友,抱着玩一玩的心态购买扫地机,更多人把扫地机器人作为一种新家电,要求也随之升高。
 
随之而来的是,越来越多的消费者愿意为更强的清洁力、更便捷的使用体验、更丰富的清洁功能而买单。

一个明显的信号是,以多功能、高品质为主的高端机型是当下扫地机消费的大趋势。
 
追觅科技的产品创新和技术领先正逢其时。高增长的业绩就是它最好的注脚。

事实再一次证明,时代会奖励创新者,如今,扫地机器人领域,具备核心技术、产品创新和产品体验的企业,将迎来它的时代。

二、追觅何以成为「扫地茅」?

作为具有极客基因的全球化创新科技公司,追觅一直坚持技术投入和产品创新。
 
在技术日新月异、加速迭代的AI时代,核心技术已经是科技企业存在的基础和武器。
 
关键核心技术是要不来、买不来、讨不来的技术。

高速数字马达:转速领跑全球

作为一家致力于技术创新的全球化科技公司,追觅科技的企业基因得益于对核心技术研发的持续投入。

不断打破高速数字马达的极限是其大放异彩故事的一部分。追觅始终坚信,要做难而正确的事情,要做就做到极致。
 
智能清洁产品最难、最核心的部分是高速数字马达。马达转速越高,吸力越大,产品的清洁能力越强,用户体验越好。
 
自追觅创立之初,追觅就决定从最具挑战的部分做起,集中精力解决高速数字马达技术问题。
 
从全球市场来看,戴森凭借高速数字马达的核心技术,屹立吸尘器市场数十年。追觅将这一高速数字马达领域的领跑者作为目标,开始了艰难的研发历程。
 
从2万转速到10万,本质是硬件及高端制造能力的综合体现。
 
背后涉及高速数字马达的算法、电磁、材料、工艺、加工精度、工业设计诸多环节。
 
2017年,追觅用了2年时间研发出10万转/分钟的高速数字马达,并在此后不断触摸高速数字马达的行业天花板。 在这个过程中,追觅意识到马达制造核心技术背后全球产业链、供应链的重要性。
 
在高速数字马达技术突破到12.5万转/分钟时,追觅开始逐步建立起二级供应商,以求实现全球产业链、供应链的升级。2020年,追觅带着供应商逐步攻克了关键零部件,而追觅的高速数字马达技术也实现了15万/分钟的转速。
 
此时,追觅的高速数字马达技术,已经可以俯瞰世界。

除了全球化的技术竞争,追觅科技的全球化视角还体现在对供应链和生产线等环节的完善——比如自建智能工厂。

这一智能工厂拥有20逾条高速数字马达产线,年生产1000万台以上,使得追觅的马达制造能力快速迭代,同时突破了高速数字马达制造的关键工艺和材料。

如今,追觅的高速数字马达已实现量产16万转,生产18万转,储备20万转,跻身国际领先水平。
 
智能算法:扫地机器人更聪明的秘密
 
如果说高速数字马达代表的硬件和高端制造能力决定企业深度,那么AI技术则决定企业的广度。
 
解决了清洁能力问题之后,追觅开始提高扫地机器人的“智力”。

用追觅的话说,马达是机器人的“心脏”,智能算法是“大脑”。

智能算法这个“大脑”,通过多种传感器对环境进行识别、分析、判断,作出最优路径选择,让产品变得更聪明。
 
诞生在AI时代的追觅,同样将智能算法能力作为立身之本。
 
在智能算法研发上,追觅持续突破SLAM、ToF 固态雷达、结构光等核心技术,并结合AI技术,通过神经网络和场景重建,使得追觅产品拥有目标检测与识别、多传感器感知处理、导航定位及地图管理、场景识别和语义理解等能力。

SLAM智能算法和LDS激光雷达导航的结合,让扫地机器人能够识别家庭环境,合理规划路线,打造极致的用户体验。
 
多年来,追觅积累了人工智能和数字化技术实力,并以此建立起虚拟仿真平台。其贯穿追觅产品的设计、制造、验证、交互等过程,能在虚拟仿真场景下实现对产品结构设计、测试条件、交互场景的穷尽与迭代优化, 探寻产品结构、功能和设计的最优解。
 
这些都不是一蹴而就的,背后是追觅对技术的高度重视和大量投入。
 
目前追觅的技术人员人数占比超过70%,每年研发费占比约10%,研发投入远超同行,其中1/3花在本领域的产品迭代,1/3花到本领域的产品创新,1/3花到新领域的创新。
 
 产品创新没有尽头
 
在产品技术研发方面,追觅科技不断突破自我,不满足于跟随市场需求,而是主动引领市场新标准。
 
今年,追觅最新推出的扫拖机器人X30系列,是技术高地下的又一革新产品。
 
X30集多项行业首创技术于一体,搭载的仿生机械臂技术、「主动式」自清洁全能基站、毛发切割滚刷等,不仅可以扫地,还可以实现拖地、吸尘、杀菌、烘干等多种功能。
 
其中,仿生机械臂技术是追觅全球首创技术。这项技术,可以通过将带有拖布的机械臂自动外扩,让扫地机具备距离小于2mm的沿边清洁能力。
 
该技术于今年4月首次应用于追觅扫地机器人X20系列上。

在最新的X30系列扫地机器人上,追觅将仿生机械臂技术升级至3.0版本。在延续墙边、桌椅腿等场景<2mm贴边清洁的同时,追觅X30系列扫地机器人采用拖布外扩配合动态甩尾,让机械臂可以伸得更远,更贴近人手一样的灵活度。在夹缝高度大于1cm的各类家具、电器底部,也都能将仿生机械臂伸入4cm进行深度清洁,充分解决家庭的死角清洁痛点。
 
追觅对产品审美追求的要求也颇高。
 
新一代消费者更愿意为高颜值带来的附加值而买单,追求美的背后,其实也是追求一种生活方式。

在产品设计中,追觅极其注重产品与家居环境的融合度,扫地机器人置于客厅,不仅仅是清洁工具,同样是好看的艺术品。市场也证明,消费者愿意为充满设计感的产品买单。

10月正式上线的追觅超薄嵌入式扫拖一体机器人——空间大师Master系列就是设计美学和产品实力的强强结合,这款扫地机高度仅为 28cm,可将其置于墙角、桌柜、洗手间或阳台,解决了目前市场上扫拖一体机器人占地空间过高过大的问题。

三、什么样的企业能做技术普惠的引领者?

纵观历史,人类的每一次进步,都源于创新技术的产品化、普适化。
 
南宋时,指南针的诞生,使得航海更加安全与精准,为航海事业注入了生机与活力。
 
阿拉伯的商人将指南针传入欧洲,掀起了一场远航热潮,开启了世界市场的新篇章,推动了大航海时代的到来,贸易的发展带动着经济和文化的繁荣。
 
无论哪个时代,技术的普惠都需要引领者和跟随者。

何谓引领者?
 
第一,能引导行业进步,尤其是技术的进步。
 
特斯拉就是自动驾驶领域的当之无愧领导者。自从推出第一辆电动轿车Model S以来,特斯拉在电动汽车市场中便迅速崛起,并不断刷新行业记录。
 
特斯拉之所以成为自动驾驶领域的大佬,核心之一在于技术引领性。
 
以其最新发布的FSD Beta V12为例,它是有史以来第一个端到端AI自动驾驶系统,设计理念是通过整合车辆的所有传感器和摄像头数据,通过AI来实现自动驾驶。
 
“它对自动驾驶领域的冲击,就像当初的特斯拉杀入新能源汽车领域。”有专业人士如此形容。

当然,特斯拉自动驾驶系统之所以技术强大,是因为其综合了先进传感器系统、强大的计算能力、深度学习和人工智能技术、实时地图数据、主动安全功能以及持续的系统优化,并通过用户反馈和数据共享不断改进系统性能。
 
作为自动驾驶的领导者,特斯拉一直在带领自动驾驶行业不断前进。
 
回顾追觅,这种由技术创新带来的行业领导者案例,同样在追觅身上发生。

瞄准产业制高点,自研的高速数字马达技术是其技术攻关的起点。 以此为原点,追觅构筑起了SLAM算法、机器人控制、流体力学等全方位智能清洁技术图谱。截至今年10月,追觅科技全球累计申请专利达4209件,其中发明专利申请多达1451件,PCT申请296件,已累计获得授权专利2059件。
 
第二,能引领行业进行技术普惠的企业。
 
对于用户而言,他们使用的是产品,技术只有应用在产品上,才能真正实现技术普惠。
 
因此,追觅也将机械臂技术下放至三千价位段的S10 Pro Ultra机械臂版上。

不仅是机械臂技术,过去几年,追觅形成了家族化的产品布局,围绕高速数字马达、智能算法、流体力学以及机器人控制等核心技术,追觅将产品线拓展到扫地机器人、无线吸尘器、智能洗地机、高速吹风机四大品类,将尖端技术应用到不同价格段的产品中。
 
技术普惠背后是持续的技术创新。
 
其实,这也是大多数全球领先科技企业的共性。和苹果当年的产品路线类似,追觅也是以领导者的方式去做市场,且毫不吝啬对技术的投入,如此才能有持续的技术创新。
 
于追觅,降低前沿技术的使用门槛,让全球120多个国家和地区的消费者享受到前沿技术带来的便利。
 
在追觅看来,“这是一件有温度的事情”,技术是用来解决问题、服务用户的。他们坚持技术研发不能从变成参数竞争的竞争,而是能够真正解决用户需求和体验的。
 
作为智能清洁领域的技术领航者,追觅致力于让科技真正惠及大众,为社会创造更多的便利和幸福。
 
而这,恰恰是一个行业领导者应该有的核心技术实力和企业修养。雷峰网雷峰网雷峰网

]]>
机器人 //m.drvow.com/category/robot/Hf9JeijooNr5zjXY.html#comments Wed, 25 Oct 2023 21:14:00 +0800