又到了年末跳大神的环节,去年讲的ARVR,今年开始讲通用机器人领域。 2024可能是通用机器人领域过去10年历史上最激动人心的一年,也是可能是未来10年最不激动人心的1年。真的非常高兴成为历史的一部分。以下是我对2025年的预测。
1. 硬件趋同
预测:到2025年底,人形机器人将实现商品化,类似于电脑,手机等所有的电子产品。
大多数人形机器人将会更加的相像(其实已经很相像了),且包含或多或少相同的技术,结构和标准化组件,这些组件的技术壁垒会极大的减少。规模经济将推动现有的行业领导者更快的更新产品,并且走向垄断和行业前端。
原因:
基于强化学习的闭环控制(使用在模拟环境中训练的策略)已经被确定为实现实时控制的最佳方式。 使用强化学习策略控制机器人意味着你不需要关注机器人公司传统上关心或试图实现差异化的许多执行器特性。 大多数仍在坚持的公司也会转向某种变体的开源MIT Cheetah执行器。 由于规模经济和制造成本,专用执行器设计将无法保持竞争力。
注意事项:
虽然硬件组件会趋同,但不同机器人的设计仍会有少许差异。 在机器人设计决策方面仍有一些悬而未决的问题,比如如何安排髋关节的自由度、是否在颈部或躯干中加入自由度,以及使用什么类型的抓手。 根据应用场景的不同,不同机器人做出不同的设计决策仍然是有道理的。
影响:
优质的通用机器人硬件将实现商品化。现有的美国机器人公司巨头(如特斯拉、Figure或1X)相对于中国同行都不会拥有任何实质性优势。 而中国同行之间,可能会发生比较严重的内卷 (大部分中国的机器人公司都是在23年融资成立,25年是交作业的时间)。 到2025年底,在美国市场,一台优质全尺寸人形机器人的市场价格将低于10,000美元,一台优质家用机器人将低于5,000美元。
2. 不会出现ChatGPT时刻
预测:机器人领域可能永远不会出现"ChatGPT时刻"。
所谓的ChatGPT时刻:指某家公司一直在独立开发一个模型,然后将其发布到某个商品化机器人平台上,神奇地使该机器人能够以高可靠性执行通用任务。
原因:
训练通用机器人模型所需的多样化数据规模比人们目前认识到的要大得多。 仅仅让一个非常好的语言模型或多模态模型来控制机器人是不够的。实现"ChatGPT级别"实用性的唯一途径是收集大量(即数百万小时级别到千万小时级别)的具身特定数据。这将需要持续的发布迭代改进。 试图为特定领域构建机器人,然后使用这些数据来引导通用性,也是一个失败的策略。 π0模型(https://www.physicalintelligence.company/blog/pi0)展示了我们距离拥有一个好的通用具身AI模型还有多远。
注意事项:
即使没有"ChatGPT时刻",2025年的机器人也会好得多,我们可能会跨过这样一个门槛:对大多数人来说,机器人的成本将低于它提供的价值,这意味着它们将成为可行的产品。 我们可能会迅速接近ChatGPT的性能水平,但这将是渐进的而不是突破性的。
影响:
头部公司必须尽快转向将真正的产品推向市场,或与已经这样做的公司合作。
3. 消费市场增长
预测:到2025年底,美国售出的人形机器人中超过一半将面向个人。尽管随着人们进行自己的实验,这与商业用途会有很大重叠。
原因:
通用机器人的实用性将与前几代机器人有很大不同。 通用机器人最初的"杀手级应用"将是语音和视觉。 早期采用者会更关注"人形"带来的酷炫感而不是"机器人"作为工具的属性。 任何将自己与传统机器人2B业务绑定的公司最终都会落入过去困扰许多机器人公司的同样陷阱。他们将被迫远离构建优秀的通用模型,转向在自由度过多的平台上重新实现经典控制。
注意事项:
除了消费者采用外还会有2B应用,但大多数真正的2B应用会更像相对专业消费者而不是传统的2B企业级应用,这与传统机器人采用有明显不同。 将新类别的消费电子产品推向市场是极度困难和挑战的。许多人会在摸索如何做到这一点上踩非常大的坑。
影响:
机器人公司将需要有真正的产品上市,而不是酷炫的视频。并且要开始关注产品定义,品牌、广泛的消费者吸引力、消费者市场细分等他们传统上不必关心的事情。 机器人公司将开始更像消费电子公司或者互联网公司,关注用户参与度和留存率等事项。