
好家伙!开云体育
机器东说念主已入厂打工分拣快递,手法娴熟和东说念主类一模相同。
前几天,Figure 推出了端到端通用撤销模子——Helix,能让机器东说念主像东说念主相同感知、齐集和活动。
当今,是时候磨砺最新效果了。
视频中,一批Figure 02走上分娩一线,有条不紊地分拣快递,还能正确调遣条形码位置以供机器扫描……
最遑急的是,按照官方说法,这次场景微调只用了 30 天。而看成对比,第一个客户案例用了 12 个月之久。
端到端学习要领让 Figure 的机器东说念主或者快速学习新任务!

面对如斯进化速率,网友们直呼:咱们完啦!

背后要津:翻新了 Helix 系统 1
除了视频,针对本次实验的高速、小包装物流场景,Figure 还公开了Helix 施展的最新汇报。

在和 OpenAI 拒绝之后,就在上周五,Figure 公布了首个效果Helix。
看成一个端到端通用撤销模子,只需当然言语教导,机器东说念主就能提起任何东西,哪怕是从没见过的东西(比如这个开朗的小仙东说念主掌)。

更有道理的是,两个机器东说念主也不错共同合作,而且用的是统一组神经集聚。

凭据那时的先容,Helix 主要由两个系统构成,两个系统经过端到端教练,况且不错进行通讯。
系统 1:80M 参数的交叉扎观点 Transformer,用于处理底层撤销。
系统 2:基于在互联网限制数据上预教练的 7B 开源 VLM,用于场景齐集和言语齐集。

而这一次,Figure 在物流场景要点对系统 1(底层撤销)进行了一系列翻新:
1、隐式立体视觉(Implicit stereo vision):增强了 3D 空间感知,使机器东说念主动作更精确;
2、多圭臬视觉暗示(Multi-scale visual representation):蛊卦细节和合座场景齐集,提高操作精度;
3、学习视觉骨子感知(Learned visual proprioceptio):每个 Figure 机器东说念主当今齐不错自我校准,简化跨机器东说念主妙技移动;
4、绽放模式(Sport mode):使用粗浅的 test-time 加快时刻,同期保持高到手率和更快的践诺速率。
最遑急的是,Figure 针对该特定场景,进一步商量了数据质料和数目之间的衡量斟酌,并初步发现:
仅用 8 小时悉心挑选的数据就能教练出一个无邪且适合性强的计策。
底下具体张开。
在物流场景下,要津法子包括包装处理和分类,主如果需要将包裹在传送带上转机并确保标签正确扫描。
听起来是不是很粗浅,但如果要让机器东说念主取代东说念主类来完成这项责任,濒临的挑战在于:
包裹的尺寸、步地、分量等相反,机器东说念主不仅要能提起来,而且需要慑服最好执取和转机时代,以至放错了之后还能立马翻新。
为了撤销上述目的,Figure 领先翻新了 Helix 系统 1 的视觉智商。
新一代系统 1 通过采选立体视觉主干集聚和多圭臬特征提真金不怕火集聚来增强其空间齐集智商。
粗浅说,系统不再寂寞处理来自每个录像头的图像特征,而是领先在多圭臬立体汇聚首合并两个录像头的特征,然后再进行标志化(Tokenize)处理。
这么作念的公道是,保持了输入到交叉扎观点 transformer 的视觉 tokens 总和不变,幸免了打算支出。
同期,多圭臬特征提真金不怕火集聚或者同期捕捉到细节和更凡俗的凹凸文信息,这有助于提高操作的准确性和可靠性。

此外,为了处分在多个机器东说念主上部署和谐计策时碰到的挑战,以及怎样通过在线自我校准来撤销跨机器东说念主计策移动。
举例由于机器东说念主硬件差别导致的不雅察和动作空间的分散偏移,传统的手动校准要领不适用于大限制机器东说念主群体。
Figure 教练了一个视觉自体嗅觉模子(visual proprioception model),这个模子不错让每个机器东说念主通过自己的视觉输入来自我校准,估算出机械臂终局(即执取物体的部分)的精确位置和姿态。
况且这种自我校准是在线进行的,也便是说机器东说念主不错在责任的同期进行校准,这么就能最猛进度地减少因校准而需要住手责任的时代。

趁便一提,教练历程中,Figure 排斥了那些较慢的、遗漏的或失败的案例,不外有利保留了包含翻新步履的案例(非遥控操作员导致,当然产生)。
临了,为了达到并逾越东说念主类的操作速率,Figure 采选了一种被称为"绽放模式"的 test-time 加快时刻。
具体来说,他们让系统 1 以每秒 200 次的频率输出一系列动作,这些动作被称为动作"块"(action " chunks ")。
然后采选了一种插值要领来加快这些动作块的践诺。插值是一种数学要领,不错在原稀有据点之间生成新的数据点。在这里,他们将蓝本的动作块(比如代表 T 毫秒的动作)通过插值缩小为 0.8T 毫秒的动作块,然则仍然以每秒 200 次的频率践诺这些缩小后的动作块。
这种要领不需要编削机器东说念主的教练历程,仅仅在 test-time 对动作践诺进行加快。通过这种要领,Figure 机器东说念主或者在践诺测试中撤销高达 20%的速率提高。

Figure 独创东说念主:异日四年寄托 10 万台
总之,时刻升级让 Figure 走进工场的速率更快了。
官方提到的第 1 个客户,应该是指客岁 8 月发布的 Figure 02 进良马工场从事汽车安装的事儿。

那时良马工场花了12 个月才给机器东说念主安排好相宜的责任,而这一次,机器东说念主厚爱上岗物流仅用了 30 天时代。
也难怪 Figure 独创东说念主有底气布告,异日四年要寄托 10 万台东说念主形机器东说念主。

另一方面,跟着国表里各家机器东说念主纷纷"进厂打工",世界冷静达成了一个共鸣:
2025 是机器东说念主量产要津之年
从各家 demo 来看,东说念主形机器东说念主的时刻已基本老到,因此接下来的争夺主要围绕量产张开,而且要往践诺分娩场景走了。
比如在一家上海机器东说念主工场内,多半"异日工东说念主"正在分娩 ing。

嗯,齐卷起来吧!
参考相连:
[ 1 ] https://x.com/Figure_robot/status/1894781226676064459
[ 2 ] https://www.reddit.com/r/singularity/comments/1iymrxs/shanghai_robot_factory_where_humanoid_robots_are/开云体育