(精选报告来源:报告研究所)
1、承上启下:前述“机器人三流派”
承接三大流派。其中 2025 年 1 月的《机器人:三层融合,2025 年产业质变!—机 器人系列深度报告之二十一》,提出机器人流派至少包括机械圈(注重结构与力学)、自 动控制圈(注重系统与规划)、ICT 圈(注重智能与生态,当前有大量互联网、软件、智 能车、芯片人才在该领域)三大流派。当前的机器人,实际上是上述三大流派的融合进步、 与不同领域适配。
但产业发展往往超过理论,当前面临以下问题,希望本篇解决: 1)现代 AI 算法对经典机器人算法的帮助。若推导成立,预计 2025-2026 年机器人 智能化程度类似 2024 年 AD/ADAS 一样质变。此前机器人算法的论述未必详尽,希望 详细论述控制、规划、感知算法如何现代化,即强化学习 RL、端到端 End-to-End。世界 模型与仿真也与其有关。 2)当前热门机器人产品,其算法的来龙去脉。宇树 Unitree Robotics(Go2、G1 与 H1 等)、云深处 DeepRobotics(绝影、山猫与 Dr01 等)、波士顿动力(Atlas 与 Spot 等)、特斯拉 Optimus、Figure(01、02 及最新模型 Helix)、智元(远征与灵犀 等)都是代表性的机器人机器人/机器狗/机械臂公司。它们算法来龙去脉是什么,与上述 理论对的上吗? 3)从机器人、机器狗、机械臂的行为特征,即可推测出什么算法发挥作用或失灵。 4)东方与西方机器人算法的分析,能与最近发布对得上。分析出西方的机器人算法 偏重实验室与数学,东方的机器人算法偏重物理与数学。所以西方近期机器人算法主要是 VLM 模型、世界模型,避开了物理和工业的一些场景问题。东方近期机器人算法主要是 RL 强化学习、柔顺、协作、高爆发、稳定性、高频响应,因为这是各行各业机器人渗透 都会遇到的实际问题。而数学上的理论完备性是后续再解决的。 5)东西方 AI 算法差异,最终硬件方案也会有差异。例如波士顿动力从液压方案切换 到电机方案,再例如谐波减速器、行星减速器、RV 减速器的均衡等。算法底层研究,可 以帮助对机器人硬件方案的研究。 换句话说,西方的媒体和投资者,容易误解东方的机器人产业链,因为常沿用西方思 维:他们会低估现代 AI 算法,还会过于关注西方机器人产业链的习惯(追求数学完备性、 硬件精度等)。
2、三环节:控制+规划+感知,分别现代 AI 化?
2.1 控制的高次项问题:拉格朗日(牛顿欧拉)公式+稳定性判据
控制理论的基础来自拉格朗日动力学公式、或“牛顿-欧拉“动力学公式。两者分别 从能量、经典力学描述了同样的动力学原理。
但以上是经典理论,实际操作起来要考虑工程可行性,尤其数学、物理积累的误差。其优点是:严谨、转化为解矩阵、恰与 GPU 的特性匹配,不足是: 1)计算复杂度。实际高频高速场景下,实时计算受到环境、延迟等限制。复杂度太 高,积累错误增多,要么响应缓慢,要么异常行为增加。 2) 全局建模。古典理论注重整体完备,工程追求局部更新。全局建模容易积累 错误。 3)符号计算。利于用户理解,但不利于处理器高效运行。 4)高次项。这是最关键的,机器人的位移是零阶变量,速度是一阶导数,加速度是 二阶导数。处理器处理二阶以内问题会效率较高,但惯性力、科氏力、齿轮弹性变形、关 节摩擦等都是超越二次项的高次项。
理论与实际工程存在差异,已经体现在机器人动作中,例如以下现象:轨迹跟踪误差 大、动作抖动、延迟卡顿、局部死循环、能耗异常。在古典机器人控制理论中,这是完美 的,但实际上工程误差大:要么对上述高次项处理精度低,要么通过动力学/逆动力学补 偿误差不及时。这会体现在机器人的诸多动作中,例如轨迹跟踪误差大(常为摩擦系数影 响)、动作抖动(常为 PID 控制器计算误差)、延迟卡顿(案例之一为动力学模型误差需 频繁修正)、局部死循环(案例之一是局部规划算法的代价函数权重失衡)、能耗异常 (案例之一为计算误差需重复迭代优化)。
除了上述能量和动力学考虑,还要考虑稳定性。以上的论述,对于机械臂等上肢控制 尤为适用。若考虑下肢轮足,还需要增加稳定性判据。李雅普诺夫稳定性判据1、捕获点 算法 CP(Capture Point)、零力矩点算法 ZMP(Zero Moment Point),均为代表。
2.2 控制:经典 AI × 现代 AI
本节论述:前述经典控制算法的不足,尤其高次项问题,可通过现代 AI 算法增强。 由于现代 AI 对控制的增强很明显,所以这里用“乘号”表示其增益效果。 经典控制算法会在现代机器人场景中,伴随较大误差,需要现代 AI 算法升级。考虑 前述动力学动力学、稳定性,AI 算法伴随大量数学运算,在 GPU 为代表的 AI 算力中实现。 AI 算法升级即现代 AI 算法,例如强化学习 RL 与端到端。几乎每个分支都涉及实时 高精度计算。而以高次项为代表的误差,会明确限制机器人功能进步。因此现代 AI 算法 (以 RL 强化学习、端到端为代表)的全面渗透,是机器人控制算法取得质变的关键。 投资者可以通俗的认为,近 1 年机器狗、人形机器人取得较大进步,都是强化学习、 端到端等现代 AI 算法渗透到了机器人控制的方方面面,加强这些数学和物理公式。
2.3 规划:经典 AI+现代 AI
规划算法较为直观,因为 VLM2模型、VLA3模型,均是近期产品发布重点,也较为直 观。下面展示了规划按照目标、环境信息、原理、场景划分的大类,以及在经典规划算法 下的弱点。这里使用“加号”来表示现代 AI 对规划的增强,但不像控制算法那样迫切 (因为前述控制算法的复杂度、全局建模、高次项问题,要更加严重)。
现代规划算法,也明显渗透到规划算法较多领域。例如: 1) 波士顿动力规划算法。我们预计为 HRL(分层强化学习)+MPC(模型预测控 制)。优势是多任务协调,而且利于动态场景。 2) 特斯拉规划算法:Occupancy Network(占用网络)。这在 Tesla AI Day 发布。 优点是利于实时避障。 3) 宇树科技规划算法:PPO(Proximal Policy Optimization)+ Sim2Real(模 拟与现实结合)。 代表性信息来源是其 GitHub 上开源代码(含 PPO 算法和 Sim2Real 迁移代码)。而 这几种算法的描述,可以在 ICRA 2023《High-Fidelity Motor Control for Quadruped Robots via Reinforcement Learning 》 、 IROS 2022 《 Sim-to-Real Transfer of Locomotion Policies for legged Robots Using Domain Randomization》中借鉴。 4) Figure 规划算法:刚刚发布 VLA(视觉-语言-行动)模型 Helix。 通过“系统+系统 2”架构实现语义理解和高频动作控制,这和理想 AD 的公开发布 (慢系统+快系统)、华为 AD 的公开发布(GOD+PDP)有异曲同工之妙。 5) 云深处机器人规划算法:我们预计为 Online RL(在线强化学习)+联合规划提 升动态避障。 其中前者的推测依据是“强化智能算法”和“动态调整权重”的公开描述4。后者的 依据是“具备多传感器融合下的….自主导航规划与动态避障…”的描述5。
2.4 感知:经典 AI,局部现代 AI
机器人感知算法,已经在 AD/ADAS 领域得到充分研发与工程化。因此感知算法技术 外溢到机器人领域,较为自然。 高次项问题(控制算法)、全局优化问题(规划算法),在感知环节中并不明显。因 此仅有全局、环境理解、复杂场景时,感知识别才需要现代 AI 算法。因此感知环节中, 应当仅有局部具备现代 AI 算法的必要性。
现代感知算法,也明显渗透到其较多领域。例如: 1) 波士顿动力的感知算法。 我们预计为多传感器(激光雷达+IMU),可能引入了 VLA 联合模型帮助感知。 2) 特斯拉感知算法:采用 Occupancy Network(占用网络)、多模态、端到端。 优势是非刚性、动态、多模态,高精度。占用网络在 Tesla AI Day 发布。通过神经隐 式场建模三维空间占据,替代传统栅格地图,提升动态障碍物检测能力。3) 宇树科技感知算法:预计为多模态,端到端。 多模态部分,结合深度相机和激光雷达,可实现 360°环境建模,支持动态避障和精 细操作(如三指灵巧手 Dex3-1 的物体抓取)。 端到端部分,宇树科技基于自研 UnifoLM 大模型,深度强化学习 RL、仿真训练来构 建端到端的感知体系。宇树科技通过该模式实现了 “任意动作任意学” 的能力,意味着 机器人能够在复杂多变的环境中,基于所感知到的信息,直接生成相应的动作决策,无需 人为预先设定详细的中间步骤指令集。 4) Figure 感知识别算法:预计为端到端+VLA/VLM。 端到端部分,明确使用端到端 VLA 模型,直接从视觉+语言生成动作。多模态部分, 深度融合视觉、语言(与 OpenAI 合作)、力控数据,实现复杂操作。 5) 云深处机器人感知识别算法:我们预计为 SLAM+多模态+VLA/VLM 多模态部分,融合激光雷达、摄像头、触觉传感器,提升环境理解能力。 VLA/VLM 部分,云深处科技联合浙江大学团队,公开展示了其机器狗 X30 与“AI 大 脑”合作的最新成果。“机器人云脑”,其实是一个结合了大语言模型(LLM)、视觉语 言模型(VLM)以及视觉语言行动模型(VLA)的大型智能决策系统。 6) 智元机器人感知识别算法:自研仿真框架+多模态 多模态部分,自研仿真框架 AgiBot Digital World 生成多模态数据(视觉、力控、 关节运动),用于模型训练。机器人平台配备了 8 个摄像头、灵巧手、六维力传感器和高 精度触觉传感器,可收集多维度数据,为多模态感知提供基础。
2.5 结论:现代 AI 化,控制>规划>感知
至此,对于机器人算法,感知、规划、控制环节,使用现代 AI 算法的必要性依次提 高。换一个角度: 1)AD/ADAS 渗透率高增时,往往市场关注的是智能车感知算法。例如前融合、 Nerf(神经辐射场,常用于 3D 变换)、Diffusion 方法。
2)既然规划、控制使用现代 AI 算法的必要性增加,因此机器人算法的潜力更大。换 个角度,机器人领域 AI 算法突破后,对机器人整体体验的提高幅度会很大。这再次支撑 “预计 2025-2026 年机器人智能化程度类似 2024 年 AD/ADAS 一样质变“的判断。
3、有趣实践:由机器人动作,推测算法
基于前述分析,根据机器人(或机器狗等)动作特征,即可以反推出内部采用了哪种 AI 算法,或哪种算法可能奏效/失灵的表格,如下。从中也可以得出现代 AI 算法普遍体现 在动作上: 1) 运动丝滑、柔顺。例如使用了强化学习(RL)算法弥补动力学公式的高次项。 2) 协作性强。例如用分层强化学习(HRL)、语义驱动算法(Semantic-Driven,例 如 VLM 模型)。 3) 创造力强,可“人机互动”。例如用 VLA 模型,这一点中美一致。 4) 高速场景多。例如使用了强化学习(RL),且配合低延迟的模型预测控制(MPC) 与海量数据,充分训练。
4、两个重要问题:东西方差异,算法影响硬件?
下载完整报告,请扫描下方图片二维码入知识星球社群查阅下载
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

入群方式:添加助理微信【touzireport666】,发送「个人纸质名片」或「电子名片」审核后即可入群。