全球估值最高的人形机器人公司,即将融资超100亿
作者|向欣
今年 2 月初,摩根士丹利发布了最新研报《Humanoid 100》,梳理了全球人形机器人产业链上的 100 家核心上市公司。在大脑这一类别,美国企业数量最多,技术上也最领先。
最近,美国人形机器人独角兽 Figure AI 就亮出了他们在机器人大脑方面的大杀器——Helix。
Helix 是一个端到端视觉语言行动(VLA)模型,能够控制人形机器人整个上半身,让机器人识别、拾取几乎任何家庭物品,其中包括数千种它们从未见过的物品。
同时,彭博社报道 Figure AI 正在进行一轮高达 15 亿美元(约合人民币 108 亿元)的巨额融资。
要知道,Figure AI 已是现下全球范围内融资最多、估值最高的人形机器人创企,融资总额达 7.5 亿美元(约合 52.6 亿人民币),估值为 26 亿美元(约合 182.3 亿人民币)。
新一轮 15 亿美元融资完成后,Figure AI 估值将达到 395 亿美元(约合人民币 2874 亿元),一年内翻了 15 倍。
一位知情人士透露,投资者看好该公司的原因之一是其在复杂推理能力上取得了重大突破。
显而易见,Helix 就是促成新一轮 15 亿美元融资的大功臣之一。
发布后不到一周,Helix 已经开始应用。
2 月 27 日,Figure AI 发布了其人形机器人快速进行物流分拣的视频。
视频拍摄于 Helix 发布后的第三天,多个机器人同时在工厂工作。
上一次,Figure AI 花了整整 12 个月才让在宝马工厂的人形机器人学会安插汽车金属件的工作,这次学习新任务却只用了 30 天。
这充分说明 Helix 极大提升了人形机器人的学习与应用效率。
2 月 28 日,Figure AI 创始人 Brett Adcock 称,由于 Helix 的研发进展远超预期,公司正准备将人形机器人推向家庭应用领域,今年会开始进行相关测试,这比原计划提前了两年。
Helix 由 Figure AI 完全自研。此前,Figure AI 曾与 OpenAI 合作开发应用于人形机器人的智能模型。
在今年 2 月 5 日,双方终止合作。不过这并未影响投资市场对 Figure AI 的热情。
凭借端到端训练方法,与机器人展现的自主性、技能泛化性,Figure AI 成为投资者眼中最具潜力的人形机器人公司。
可收纳所有家庭物品
已应用于物流分拣
在 Helix 帮助下,人类可以同时指挥两个人形机器人干活,只需要下达语音指令,它们就能互相配合,动作流畅地整理、收纳几乎所有家庭物品。
Helix 目前已应用于人形机器人,使其能够快速完成物流分拣任务。
作为端到端 VLA 模型,Helix 有以下亮点:
以高达 200 赫兹的频率对机器人的上半身进行精准、实时的控制;
能够同时操纵两个机器人干活;
只需要用自然语言下达指令,机器人就能够拾取几乎任何家庭物品,其中包括数千种它们从未见过的物品;
仅使用一组神经网络权重学习所有行为,不需要根据任务微调模型;
对端侧芯片要求低,只需要两个低功耗 GPU 即可运行,能够立即进行商用部署。
Helix 硬件要求低,易于部署,并具备出众的多元操纵和智能泛化能力。这让 Figure AI 相信在未来几年内,其人形机器人便能面向家庭用户投放。
此前,VLA 模型在机器人领域中已得到重视,但主要应用于自由度较低的机械臂(自由度通常为 7 个),无法很好地拓展到人形机器人身上,对于复杂动作,还需要进行繁琐的动作标记。
Helix 则无需动作标记,能够直接控制人形机器人的整个上半身,协调 35 个自由度的躯体,使其能够流畅、自然地做复杂的动作,控制范围涵盖头部、躯干、手腕和每一根手指。
也就是说,相比之前的 VLA 模型,Helix 首次实现了 VLA 模型在人形机器人身上的部署,做到了更精细、广泛、高频的动作控制。
Helix 还能让两个人形机器人共用一个大脑,协同工作。
比如,在收纳物品时,Helix 让两台机器人同时行动,流畅地交接物品,而不是一个机器人操作完,另一个机器人才行动。
动图为 2 倍速
在智能方面,Helix 展现出极强的泛化性,它能够识别数千种从未见过的家庭物品,包括普通机器人较难识别的玻璃制品,且不需要任何人类演示和编程。
动图为 2 倍速
相比传统的手动编程与依靠人类进行数千次演示的方法,Helix 极大地降低了训练人形机器人的成本,使其学习效率呈指数级提升。
Helix 是如何学习和训练的呢?
Figure AI 介绍,Helix 仅使用了一组神经网络权重学习执行不同的任务,包括拾取和放置物品、使用抽屉和冰箱,以及机器人间的协同工作。
简单点说,就是 Helix 让机器人学会了融汇贯通,只用一种学习方法就能学习掌握多种技能。
同时,Helix 只使用了大约 500 小时的高质量监督数据来训练,这只是以往 VLA 数据集的 5% 不到,以极少的资源实现了强大的对象泛化。
模型架构:VLM+视觉运动策略
完全端到端训练
VLM 通常可以处理多种不同类型的视觉和语言任务,泛化能力很强,但处理速度较慢。
机器人视觉运动策略能够让机器人快速执行动作,但缺乏通用性。
Helix 的架构则融合了两者的优点,规避了缺点。
Helix 是完全端到端训练的,由两个系统组成:
系统 2(S2):主干是一个 70 亿参数的开源视觉语言模型(VLM),能够理解场景和语言,指挥机器人协同工作;
系统 1(S1):包含一个 8000 万参数的视觉运动策略,基于 Transformer 构建,能够对机器人进行精确、连续的动作控制。
这种简洁的架构让开发者能够分别对 Helix 的每个系统进行迭代改进。
在机器人系统中,运行频率越高,数据传输与处理速度越快,机器人接收和发送指令、状态等信息就更迅速。
以 VLM 为主干的 S2 运行频率为 7~9 赫兹,负责「慢思考」,进行高级规划。
由视觉运动策略构成的 S1 运行频率为 200 赫兹,负责「快反应」,实时执行和调整行动。
为了让 S1 和 S2 在运行时的延迟时间能够互相匹配,研发团队在 S1 和 S2 的输入中设置了一个经过校准的时间偏移。
Helix 的运行过程是这样的:
S1 和 S2 分别在机器人的两个专用 GPU 上运行;
S2 结合人类语音命令,处理视觉及机器人状态信息,将任务相关信息提取到一个潜在向量中,以 7~9 赫兹的频率传递给 S1;
同时,S1 以更高的频率处理相同的视觉及机器人状态信息,实现更灵敏的闭环控制。
来自 S2 的潜在向量映射到 S1 中后,S1 会以 200 赫兹的频率,将 S2 的语义表征转化为精确、连续的机器人动作。
在最新的物流分拣任务中,Figure AI 对 Helix 的 S1,即低级视觉运动控制策略进行了多项改进,提升了 S1 对环境的感知理解能力、跨机器人协作能力,以及推理速度:
环境感知理解能力提升:新 S1 采用了立体视觉主干架构,并结合多尺度特征提取网络,以捕捉丰富的空间层次信息,能够在捕捉环境细节的同时,保留对场景层面的理解;
跨机器人协作能力提升:在多台机器人上部署同一策略,需解决个体硬件细微差异问题。研发团队训练了一个视觉本体感知模型,让机器人依自身视觉输入,预测末端执行器 6D 位姿,实现高效跨机器人策略迁移。
推理速度加快:通过一种简单的推理加速技术,将 S1 的推理速度提升 20%。
Figure AI 将融 15 亿美元
未来 4 年生产 10 万台机器人
Figure AI 成立于 2022 年 5 月,截至目前,已获得 7.5 亿美元(约合 52.6 亿人民币)融资,是目前全球范围内融资最多的人形机器人创企。
Figure AI 创始人 Brett Adcock 是一位连续成功创业 2 次的企业家,已有超 20 年科技从业经历。公司团队成员来自苹果、特斯拉、谷歌 DeepMind、波士顿动力、IHMC 等科技领域知名企业与机构。
目前 Figure AI 已推出两代人形机器人。
Figure 01 于 2023 年 10 月推出;
Figure 02 于 2024 年 8 月推出,身高约 170cm,重 70kg,移动速度为 1.2 米/秒,可负载 20kg,单手具备 16 个自由度。
梳理 Figure AI 这两年多的发展会发现,端到端的训练方式,和机器人所展现的自主性、技能泛化性成为它快速成长,获得大额融资的核心原因。
Figure AI 历史上的三轮融资,都伴随着机器人产品的亮相和进步而来:
第一笔融资:
Figure AI 机器人概念图释出后两个月,2023 年 3 月,Figure AI 获得了 7000 万美元(约合 4.9 亿人民币)的投资。
第二笔融资:
Figure 01(测试版)实现迈步的两月后,2023 年 7 月,Figure AI 获得了来自英特尔资本的 900 万美元(约合人民币 6310 万)融资。
第三笔融资:
2024 年 1 月,Figure 01 经过 10 小时端到端神经网络训练后,学会冲咖啡,并能够自主纠错。
这次技能展示直接让 Figure AI 成为资本的宠儿。一个月后,2024 年 2 月 29 日,Figure AI 获得高达 6.75 亿美元的融资(约合 47.3 亿人民币),投资方包括 OpenAI、英伟达、微软等。
这是近两年内人形机器人行业数额最大的单笔融资。有人用「半个硅谷都投了」形容投资的盛况。
融资完成后,Figure AI 的估值达到 26 亿美元(约合 182.3 亿人民币),投资方 OpenAI 开始为 Figure AI 提供技术支持。双方曾在融资完成的十多天后就推出了合作研发的成果。
2024 年 3 月 13 日,搭载了 Open AI 模型的 Figure 01 展示出能够与人自然对话,理解人类的意图的能力。5 个月后新推出的 Figure 02 也内置了 OpenAI 定制的语音到语音推理模型。
但在今年 2 月 5 日,双方终止合作。Brett Adcock 解释说合作的问题在于集成。
他认为 OpenAI 擅长的智能模型(大语言模型)在适配人形机器人方面存在局限性,难以契合其需求,正确的解决方案是构建专用于驱动具体硬件的端到端 AI 模型。
与 OpenAI 分道扬镳后,市场对 Figure AI 的投资热情不降反升。
就在 Figure AI 宣布与 OpenAI 停止技术合作的 10 天后,2 月 15 日,彭博社报道 Figure AI 正在进行一轮高达 15 亿美元(约合人民币 108 亿元)的融资。
如果这轮融资顺利完成,Figure AI 的估值即将达到 395 亿美元(约合人民币 2874 亿元),相比去年翻了 15 倍。
知情人士透露,Figure AI 在提升复杂推理能力上取得的突破,是投资者对其抱有热情的原因之一。
此次发布的 Helix 模型,经过端到端训练,展示了强大的多任务处理和零样本泛化能力,机器人实现了更高的自主性,背后正是模型推理能力的极大提升。
新一轮融资预计将由 Align Ventures 和 Parkway Venture Capital 领投,两者均以在前沿科技领域的战略投资而闻名。
此外,Figure AI 的商业进程也正在稳步推进。
Figure AI 曾在 2024 年 1 月宣布与宝马合作,将人形机器人引入宝马的制造工厂。
去年 11 月,在宝马汽车工厂工作的 Figure 02 机器人每天已经能够完全自主地完成 1000 个安插汽车金属件的任务,工作速度提高 4 倍,可靠性提高 7 倍。
2024 年 12 月,Brett Adcock 宣布 Figure 开始创收,向客户交付了 Figure 02 机器人。
今年 1 月 31 日,Figure AI 宣布获得了第二个客户,但未透露客户名称,只介绍它是美国最大的公司之一,很多人猜测是亚马逊。
巧合的是,在最新释出的视频中,Figure 的人形机器人执行的就是物流分拣的任务。
Brett Adcock 称,与宝马及第二位神秘客户的合作,将使 Figure AI 未来四年内人形机器人的产量将达到 10 万台。
FigureAI 也将在今年 2 月搬入新楼。新的办公场地比原来大 10 倍,正在为团队扩张与机器人量产做准备。
技术与商业化协同并进,让 Figure AI 成为目前世界上发展势头最为强劲的人形机器人公司之一。
从 Helix 模型的问世与迅速落地应用中可以看出,人形机器人行业正迎来技术突破与商业落地的加速期。
随着更多参与者涌入,人形机器人技术竞争将愈发激烈,具身智能有望凭借人形机器人这一理想载体,更快地从实验室走向现实世界的各个角落,为人类的生产生活带来前所未有的变革。
原文标题 : 全球估值最高的人形机器人公司,即将融资超100亿

最新活动更多
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
即日-3.25立即报名 >>> 【在线会议】医疗设备的无线共存、高速数字与射频测试
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
即日-3.31立即报名>>> 【在线会议】AI加速卡中村田的技术创新与趋势探讨
-
4月1日立即下载>> 【村田汽车】汽车E/E架构革新中,新智能座舱挑战的解决方案
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论