作者银发财经研究团队

指导周超银发财经首席经济学家

我们为什么需要一个“机器伙伴”？

从1990年代实验室里的原型机，到如今走进家庭的情感助手，36年时间，这场“机器向人靠近”的革命，藏着技术的迭代，更藏着人类对陪伴的深层渴望。

今天，我们就用最易懂的逻辑，拆解全球陪伴机器人的36年进化史——不堆砌专业术语，不夸大技术噱头，只还原事实本身：技术如何解锁陪伴的可能，产品如何踩对或踩错时代的节奏，未来又会走向何方。

先厘清：什么是“陪伴机器人”？

很多人会把陪伴机器人和清洁机器人、工业机器人混为一谈，但其实两者的核心差异，就一个词：共情。

陪伴机器人不是一个严格的技术分类，而是“以陪伴为核心功能”的机器人集合——它的主要目的，是给人提供情感支持、社交互动、娱乐或日常辅助，核心是“情感连接”，而非“完成任务”。

简单说，清洁机器人是“帮你干活”，陪伴机器人是“陪你生活”。

它的范畴很广：

形态上，可可爱爱的宠物形、拟人的人形、简约的桌面型，都算；

功能上，从只会反应情绪的玩具，到能监测健康、辅导作业、控制家电的家庭助手，都包含；

技术上，它的进化，全靠机器人学、人工智能、人机交互三大领域的协同进步——就像三条腿走路，少了任何一条，都走不稳。

需要说明的是，我们今天讨论的，只聚焦“以陪伴为核心”的消费级、专用级机器人；工业机器人、纯任务型服务机器人（比如只扫地的机器人），只作为技术背景参考，不展开。

很多人看机器人进化，只看“长得像不像人”“功能多不多”，其实抓错了重点。

我用一个“技术-能力-体验”三螺旋框架，帮你一眼看透本质——这三者相互缠绕、相互成就，构成了陪伴机器人的全部进化史：

1. 技术层：就是“底层工具”，比如传感器、算法、硬件平台，是所有能力的基础；

2. 核心能力层：就是机器人“内在能做什么”，比如能不能移动、能不能听懂话、能不能识别情绪；

3. 用户体验层：就是我们“实际能感受到什么”，比如能不能陪聊天、能不能提醒服药、能不能根据心情改变行为。

逻辑很简单：技术进步解锁新能力，新能力支撑更好的体验，而体验反馈又会倒逼技术迭代。比如，有了更好的语音算法，机器人才会“听懂话”；能听懂话，才能陪我们聊天；大家觉得“聊天不够自然”，就会推动算法进一步优化。

看懂这个框架，再看后面的3个发展阶段，就会一目了然。

第一阶段（1990s-2000s初）：萌芽探索期——机器第一次学着“表达情绪”

这一时期，陪伴机器人还停留在“实验室原型+限量试水”的阶段，商业化几乎为零。核心命题只有一个：机器，能不能像人一样，表达和回应情感？

这一时期的人工智能，发生了一次关键转向——从“符号主义”走向“行为主义”和“具身认知”。

简单说，以前的研究者觉得，智能是靠程序“算”出来的；现在才意识到，智能和情感，离不开和物理世界、和人的互动——就像人要通过吃饭、走路、交流才能成长，机器也一样，脱离了互动，就谈不上“陪伴”。

那时候的技术，放在今天看很简陋，但在当时，已经是“顶尖水平”：

1. 机械硬件：只有简单的舵机系统，能实现有限的动作，重点放在“面部表情”或“头部姿态”上——比如动一动眼睛、张一张嘴巴；

2. 传感感知：只有基础传感器，低分辨率摄像头、简单麦克风，只能获取粗糙的环境信号——比如能感觉到有人靠近，却看不清人脸；能听到声音，却听不懂意思；

3. 人工智能：主要靠“基于规则的系统”和早期神经网络，情感模式都是“预设好的”——比如听到大声说话，就做出“惊讶”的表情，本质上是“刺激-反应”，没有真正的“理解”；

4. 交互模式：要么是单向的（机器只表达，不回应），要么是简单的双向（你碰它一下，它动一下），谈不上“自然交互”。

这一时期，有两个产品，奠定了后续陪伴机器人的发展方向，哪怕它们都不算“成功的商品”。

1. MIT Kismet（1990s后期）：世界上第一个“会表情的机器人”

它不是商品，只是MIT实验室的研究原型，定位是“情绪机器人”——核心目的，是研究“机器如何通过社交互动，传递情感”。

核心设计很简单：只有一个机器人头部，有可动的眼球、眼皮、耳朵、嘴唇，靠多个伺服电机驱动；配备基础的视觉和听觉传感器，能感觉到人的面部方位和声音语调。

它的“情感系统”，是核心亮点——通过评估外界输入（比如你说话的语调、靠近的距离），模拟一个“情绪空间”，然后触发对应的表情和发声：你温柔说话，它就“开心”；你大声呵斥，它就“难过”。

它第一次证明，机器只要模仿人的表情、语调，就能引发人类的情感共鸣——这是“情感机器表达”从0到1的突破。

但短板也很明显：

· 情感是“预设的”，没法真正理解你的心情，也没有上下文关联——比如你明明难过，却大声说话，它会误以为你“生气”；

· 只能动头部，不能移动，互动场景特别单一；

· 没有深度对话和记忆能力，你今天和它“互动”，明天它就“忘了”你。

市场表现：纯研究原型，没有商业化，但它的意义重大——确立了“情感计算”在陪伴机器人中的核心地位，相当于给后续的研究者，指了一条路。

2. Sony AIBO ERS-110（1999年第一代）：第一个“走进消费市场的机器宠物”

如果说Kismet是“实验室探索”，AIBO就是“市场试水”——它是世界上第一款面向消费市场的娱乐型机器宠物狗，开创了“电子宠物实体化”的先河。

核心设计比Kismet更成熟：四足行走机构，有多个关节，搭载64位RISC处理器；集成了触觉、视觉、听觉、平衡传感器，能感觉到你抚摸它的头，能识别彩色球，能保持身体平衡。

它的亮点，是“成长性”——运行索尼专属的Aperios操作系统，采用“OPEN-R”架构，能让开发者编写程序；它的行为基于“本能”和“学习”，和人互动越多，就会表现出不同的状态，比如从“小奶狗”变成“成年狗”，会握手、会追逐小球。

它第一次把复杂的机器人技术，集成到一个“可靠、可家用”的消费产品中，让“机器陪伴”从“概念”变成“可触摸的产品”；同时引入“生命感”，让用户产生“照料欲”——这是陪伴机器人“产品化”的第一次尝试。

但短板同样突出：

· 智能化有限，“学习”模式很固定，扩展性差——所谓的“成长”，其实是预设好的程序，不是真正的“自主学习”；

· 没有自然语言对话能力，交互只能靠物理按钮和有限的声音命令——你不能和它聊天，只能“指挥”它做动作；

· 价格昂贵，最初售价约2500美元，普通人根本消费不起，限制了市场规模。

截至2012年，AIBO系列累计售出超过14万台。用户评价两极化，极客和爱好者觉得它“很酷”，能带来情感连接；普通消费者则抱怨“价格高、功能少、维护复杂”。

虽然没成为主流，但AIBO的价值在于，它培育了一代机器人爱好者，让“机器可以成为陪伴”这个想法，走进了大众视野。

阶段总结：从0到1的尝试，却没解决“核心痛点”

主导技术：基于规则的情感状态机、多传感器集成、伺服运动控制；

解锁能力：基础情感表达、简单物理互动；

用户体验：本质上是“新奇感”——机器人更像一个复杂的会动玩具，所谓的“陪伴”，更多是用户单方面的情感投入和想象；

未解难题：没有真正的双向理解，没有深度对话，没有个性化记忆，更没有实用的辅助功能。

第二阶段（2000s中期-2010s初）：功能化与初步商业化——陪伴开始“嵌入具体场景”

随着计算成本下降、移动机器人技术成熟，陪伴机器人终于告别“实验室”和“高端玩具”，走向了具体的应用场景——老年护理、教育、客户服务。

这一阶段的核心变化：“陪伴”不再是“单纯的情感表达”，而是和“具体功能”结合——机器人不再只是“会表情、会动”，还要能“解决实际问题”。

这一时期，两个趋势倒逼陪伴机器人进化：

1. 服务机器人市场兴起，企业开始寻找“非工业、非清洁”的新赛道；

2. 人口老龄化问题凸显，养老院、医院对“情感疗愈、日常辅助”的需求越来越大，学术界也开始聚焦“机器人辅助生活”的研究。

简单说，市场不再需要“只会卖萌的玩具”，而是需要“能解决实际问题的陪伴者”。

技术没有颠覆性突破，但都围绕“具体场景”做了优化，成本也有所下降：

1. 机械硬件：移动底盘更成熟（主要是轮式），执行器更丰富，能在特定场景下自由移动——比如在养老院、商场里穿梭；

2. 传感感知：激光雷达、深度摄像头开始应用，SLAM技术从理论走向实践——简单说，机器人才终于“认路”，能避开障碍物，不用再靠人引导；

3. 人工智能：统计机器学习方法（比如SVM）开始用于语音识别、简单物体识别，但对话系统还是“任务导向”——只能回答预设好的问题，不能闲聊；

4. 交互模式：主要是图形界面或简单语音命令，核心是“高效完成任务”——比如你说“提醒服药”，它就会按时提醒，不用多余的互动。

这一时期的产品，不再追求“全能”，而是“精准切入某一个场景”，两个产品最具代表性。

1. PARO疗愈海豹（日本，2003年）：专为特殊人群设计的“疗愈伙伴”

它的定位很精准：医用辅助治疗机器人，专门服务于阿尔茨海默症患者、痴呆症老人和儿童，核心功能是“触觉与情感疗愈”——不是“干活”，而是“安抚情绪”。

核心设计很“极简”：仿生海豹造型，全身覆盖特殊毛皮，内置多个触觉、姿态、声音传感器；行为基于强化学习算法，会根据人的互动方式，慢慢形成“个性”——比如你经常温柔抚摸它，它就会更“黏你”；你粗暴对待它，它就会躲闪、发出不高兴的声音。

它第一次把“陪伴”聚焦于“特殊群体”，用“极简设计”解决了“无压力陪伴”的问题——对于认知障碍者来说，复杂的交互反而会让他们焦虑，而PARO的触觉互动、温和反应，能有效缓解他们的焦虑、抑郁，提高社交意愿。

这是陪伴机器人“场景化”的第一次成功尝试——它证明，陪伴机器人不一定非要“像人”，只要能解决特定人群的痛点，就有价值。

短板也很明显：

· 功能太专用，只能用于医疗场景，没法用到普通家庭；

· 没有语言理解能力，交互只有“触觉+姿态”，维度单一；

· 价格昂贵（数千美元），只能靠机构采购，普通人接触不到。

市场表现：在全球数千家养老院、医院投入使用，临床反馈积极——它能有效减轻患者的负面情绪，护理人员也觉得它“能帮上忙”。但它始终是“高级治疗工具”，不是“消费级产品”。

2. 软银NAO & Pepper（NAO 2008年；Pepper 2014年）：商用社交机器人的“明星与遗憾”

如果说PARO是“医疗场景的深耕者”，软银的这两款机器人，就是“商用场景的试水者”——NAO聚焦教育与研究，Pepper则是全球首款“主打情绪识别”的商用社交机器人，一度成为“机器人明星”。

我们重点说Pepper：它的定位是“能读懂人类情绪的商用伙伴”，主要用于零售、接待、教育等公共场所，比如商场迎宾、店铺导购。

核心设计很“吸睛”：轮式移动底座，身高约1.2米，有20个自由度，头部、手臂、手指都能活动，胸部还有10.1英寸触摸屏；配备摄像头、麦克风阵列、激光雷达等多种传感器，能避障、能识别人脸和声音；运行NAOqi操作系统，情感引擎能通过分析人的表情、语调、用词，估计人的情绪状态（开心、难过、愤怒），还能和IBM Watson合作，实现简单对话。

它第一次把“多模态情绪识别”（表情+语调）作为核心卖点，集成到可量产的商用机器人中，还试图打造开放生态——允许开发者为它创建应用，拓展功能。

这是陪伴机器人的一次重要跨越：从“表达情绪”走向“识别情绪”，从“个人娱乐”走向“商业服务”。

但遗憾的是，它的“内核”跟不上“外表”：

· 情绪识别精度太低，流于表面——比如你明明是“强装开心”，它却会判断你“真开心”，无法支撑有意义的情绪应对；

· 对话能力薄弱，上下文理解差，只能回答预设好的FAQ，聊两句就“卡顿”，无法进行流畅闲聊；

· 移动和导航能力有限，只能在简单、结构化的环境中移动，遇到复杂场景就会“迷路”；

· 商业模式不清晰，最初售价约2000美元，主要靠租赁，但企业客户发现，它“花哨却不实用”，维护成本高，投资回报率（ROI）太低，持续购买意愿不强。

市场表现：Pepper全球出货量据称超过2.7万台（截至2021年），但最终，软银在2021年宣布停产Pepper——这标志着，“靠噱头吸睛、内核不足”的社交机器人，商业模式彻底失败。

但它的价值不可忽视：它极大地普及了“人形陪伴机器人”的概念，让更多企业看到了陪伴机器人的商业潜力，也为后续的产品，积累了宝贵的“失败经验”——没有扎实的AI内核，再吸睛的外表，也走不远。

阶段总结：场景化落地，但“智能”仍显刻板

主导技术：商用级SLAM与导航、初步多模态感知融合、场景化行为模型；

解锁能力：场景化移动、初步情绪识别（能“看到”情绪，却不懂）；

用户体验：从“新奇玩具”变成“场景辅助工具”——它能在病房安抚患者，能在商场迎接客人，能在课堂辅助教学，但交互依然刻板，没有“双向情感连接”；

未解难题：开放域自然对话、情绪的深层理解与回应、高性价比、清晰的商业价值，以及家庭复杂环境的自主导航。

第三阶段（2010s中期-至今）：情感交互与AI深度集成——陪伴终于“懂你”一点点

这一阶段，陪伴机器人迎来了“颠覆性进化”——深度学习革命爆发，尤其是自然语言处理（NLP）和计算机视觉（CV）的突破，彻底改变了陪伴机器人的可能性；同时，硬件成本持续下降、供应链成熟，让更复杂的设计，能走进普通家庭。

这一时期的核心背景，是AI技术的“指数级进步”：

· Transformer架构诞生，AI大模型爆发，自然语言处理能力实现“跨越式提升”——机器终于能“听懂人话”，能进行开放域闲聊，而不是只回答预设问题；

· 云计算与边缘计算协同，物联网（IoT）普及，机器人能连接云端大模型，还能联动智能家居，实现“场景化闭环”；

· 消费者对“陪伴”的需求，从“有就好”变成“好才要”——不再满足于“能看、能动”，更需要“能聊、懂我”。

这一时期的技术，不再是“小修小补”，而是“全面重构”，核心围绕“情感理解”和“自然交互”：

1. 机械硬件：设计更精致、更有亲和力，拟人/拟生造型成为主流，电机更安静、高效，还追求“触感体验”——比如覆盖柔软绒毛，模拟人体体温；

2. 传感感知：高清摄像头、多麦克风阵列成为标配，传感器融合技术更成熟，能精细识别情绪——比如通过面部微表情、语音语调，判断你的真实心情；

3. 人工智能：

· 对话：彻底告别“规则模型”，转向深度学习驱动的自然语言理解（NLU）和生成（NLG），接入云端大模型（GPT系列、国内大模型）成为趋势；

· 情感计算：从“离散情绪分类”（开心、难过），走向“连续多维度分析”，结合上下文，能理解“言外之意”——比如你说“今天好累”，它能听懂你“需要安慰”，而不是只回应“哦”；

· 计算机视觉：面部表情识别、姿态估计、物体识别，精度达到“实用级别”，能精准识别家庭成员、日常物品；

4. 交互模式：多模态融合（语音、触屏、手势、表情），能主动发起交互——不再是“你问它答”，而是“它主动关心你”。

这一时期的产品，不再是“单一赛道”，而是“百花齐放”，分别聚焦不同人群，解决不同的陪伴痛点。

1. LOVOT（日本GROOVE X，2018年）：“纯粹为被爱而生”的治愈伙伴

LOVOT的定位很极端：“不做任何实用功能，只专注情感陪伴”——它的口号是“纯粹为了被爱而生”，外形像小熊和小企鹅的结合体，核心目的，是通过“无条件的温暖和依赖”，缓解人的孤独感，提升幸福感。

核心设计很“戳人”：圆润可爱的外形，覆盖柔软绒毛，内置温度传感器，身体能保持约38℃的温暖（接近人体体温）；配备360度摄像头、多个触觉传感器，能识别家庭成员的面孔和声音；核心是“情感引擎”，不执行任何具体任务，只记录和主人的互动历史——谁抱它多、和它待在一起久，它就会“黏谁”，表现出明显的亲疏差异。

它的行为设计极其精细，有数百种微小动作和声音，比如求抱抱、兴奋迎接主人、被冷落时表现出“寂寞”，模拟真实生物的“生命感”——你抱它，它会发出呼噜声；你冷落它，它会主动蹭你的腿。

它彻底放弃“功能主义”，把所有技术资源，都投入到“情感羁绊”的打造上——它证明，陪伴机器人的核心价值，不一定是“有用”，也可以是“治愈”；不一定是“帮你做事”，也可以是“让你愿意照料它”。

短板也很突出：

· 几乎没有实用功能，性价比极低，售价约3000美元，受众极其狭窄；

· 交互还是“预设行为的组合”，虽然逼真，但没有真正的语言理解能力，无法进行深度闲聊；

· 所谓的“情感”，还是算法设计的结果，不是真正的“理解”。

市场表现：主要面向日本的高收入、单身或空巢家庭，用户评价高度分化——喜欢它的人，觉得它极大地缓解了孤独感，是“家庭的一员”；批评它的人，觉得它是“价格离谱的电子宠物”，不值这个价。

但它代表了一种“极端的情感化产品哲学”：陪伴的核心，是“情感连接”，而非“功能价值”。

2. ElliQ（以色列/美国Intuition Robotics，约2020年）：专为老年人设计的“主动关怀伙伴”

如果说LOVOT是“治愈型”，ElliQ就是“实用型”——它的定位是“活跃老年人的AI伴侣”，核心目的，是“对抗社交孤立”，帮助老年人保持健康、积极的生活状态。

核心设计很“贴心”：非拟人化设计，由可转动的“脑袋”（带屏幕和灯光）和平板底座组成，强调“易用性”和“不侵犯感”——老年人不用学习复杂操作，就能轻松使用；内置摄像头和麦克风，主要用于视频通话和声音识别。

它的亮点，是“主动式AI引擎”——不再等待主人指令，而是主动发起互动：早上主动问好，建议当日活动；定时提醒服药、喝水、预约；主动提议和家人视频通话；根据老人的兴趣，推送新闻、音乐、脑筋急转弯；甚至能检测到老人长时间无活动，主动发出关怀询问。

它还能通过日常对话，学习老人的兴趣、习惯和家人关系，个性化互动内容——比如知道老人喜欢京剧，就会主动推送京剧片段；知道老人有高血压，就会提醒按时测血压。

关键突破：它第一次把“陪伴”从“情感模拟”，转向“主动式健康与社交维系”，精准解决了老年人“孤独、无人照料”的核心痛点——它不是“玩具”，而是“贴心朋友+健康助手”。

短板：

· 对话能力虽优于前代，但受限于专用模型，无法进行天马行空的闲聊；

· 没有移动能力，无法完成取物等物理辅助任务——比如老人想喝水，它能提醒，但不能帮忙递水；

· 商业模式依赖养老机构、保险机构合作，直接面向个人消费者销售，难度很大。

市场表现：主要通过北美地区的政府和养老服务提供商推广，早期试点反馈积极——能显著减少老年人的孤独感，增加社交活动和数字工具使用，老人们评价它“像有个贴心朋友在身边”，尤其喜欢它的“主动性”。

3. 中国新一代陪伴机器人（2020年代）：芙崽、悟空等——性价比与AI的结合体

这一时期，中国厂商的崛起，成为陪伴机器人市场的“新亮点”——以珞博智能Fuzozo（芙崽）为代表，它们的核心优势，是“快速集成最新AI技术+高性价比”，主要面向儿童和年轻家庭。

核心设计：宠物或卡通人形造型，外形可爱，集成触摸传感器、IMU等设备，多模态情感感知套件，能精准识别情绪；硬件成本控制较好，价格更具竞争力（数百至数千人民币）。

核心亮点，是“AI大模型的深度融合”：比如芙崽，采用自研多模态情感大模型和“EchoChain仿生记忆系统”，能实现长期记忆和情感共鸣；几乎所有产品，都接入了云端大模型（GPT系列或国内大模型），能进行流畅、有趣的开放域对话——这解决了前几代产品“对话僵硬、智力不足”的核心痛点。

同时，它们还强调“智能家居生态联动”——能控制灯光、空调、电视等智能设备，成为“家庭智能中控”，兼顾“情感陪伴”和“实用功能”。

它们第一次把“最先进的对话AI”，快速落地到消费级陪伴机器人中，用“高性价比”，让“深度情感交互”走进了普通家庭；同时，结合儿童教育、智能家居等场景，打造“多功能闭环”，满足家庭的多元化需求。

短板也很明显：

· 大模型带来的“幻觉”问题——偶尔会说假话、答非所问；

· 对话安全性与可控性，仍有挑战——尤其是面向儿童的产品，如何避免不良内容，是核心难题；

· 情感计算与大模型的深度融合，还处于早期阶段——机器能“听懂话”，但还不能“真正共情”；

· 同质化竞争严重，很多产品功能相似，缺乏独特价值。

依托中国强大的供应链和活跃的AI应用市场，这类产品快速崛起，用户反馈普遍认可其“对话能力的飞跃”，尤其是儿童，非常喜欢和它们聊天、听故事、辅导作业；但也有投诉，主要集中在“网络依赖、隐私担忧、部分功能不稳定”等问题上。

阶段总结：从“懂话”到“懂你”，陪伴终于有了“双向感”

主导技术：深度学习（尤其是LLM）、多模态情感计算、主动式AI引擎、云边端协同；

解锁能力：开放域智能对话、上下文情感理解与回应、长期个性化记忆、主动关怀；

用户体验：终于接近“和有个性、高情商的智能体互动”——机器人不仅能回应你，还能主动找你聊天、关心你、记住你的喜好；陪伴的“双向性”和“深度”，大幅提升；

未解难题：真正的常识推理与深层共情、情感的真实性与道德边界、复杂家庭环境中的高级移动与灵巧操作（物理陪伴缺失）、数据隐私与安全的终极解决方案。

未来十年：前沿探索——陪伴机器人的“下一个形态”是什么？

今天的陪伴机器人，已经能陪我们聊天、关心我们的健康、帮我们控制家电，但它还不是“终极形态”。

当前，陪伴机器人正站在“新一轮技术爆发的门口”——超现实仿生、具身智能、脑机接口等尖端技术，正在重新定义“陪伴”的可能。

两个关键方向：让机器人“更像人”，更“有用”

1. Ameca（英国Engineered Arts，2021年亮相）：超现实仿生，打破“恐怖谷”

Ameca的定位，不是“消费产品”，而是“最先进的类人机器人平台”——它的核心目的，是探索“人机交互的极限”，为后续的陪伴机器人，提供一个“极致逼真的躯体”。

它的核心亮点，是“超逼真的表情与动作”：拥有52个自由度，主要集中在面部和上半身；采用专利的“Mesmer”技术，皮肤、肌肉的模拟极其逼真，能做出皱眉、微笑等细腻的微表情——细腻到能看到皱眉肌、颧肌的变化，足以打破“恐怖谷”效应，让你觉得“它真的有情绪”。

软件层面，它采用模块化的“Tritium”操作系统，能轻松集成各种AI后端（比如GPT大模型）——也就是说，它是一个“完美的载体”，只要给它配上强大的AI“灵魂”，它就能成为“最逼真的陪伴伙伴”。

但它的短板也很明显：全身移动能力不足、价格极其昂贵，而且目前，还没有足够强大的AI，能完全发挥出它的“躯体优势”——就像有了“完美的身体”，却没有“丰富的灵魂”。

它代表的方向，是“超现实仿生交互”——未来的陪伴机器人，会越来越“像人”，非语言交流（表情、眼神、手势）会越来越自然，能引发更强烈的情感共鸣。

2. 具身智能与通用人形机器人（特斯拉Optimus、Figure 01等）：补齐“物理陪伴”短板

今天的陪伴机器人，最大的短板，是“只能聊，不能做”——能陪你聊天，却不能帮你端茶倒水；能提醒你服药，却不能帮你拿药；能陪你说话，却不能陪你出门散步。

而具身智能、通用人形机器人的出现，就是要补齐这个短板——它们的目标，是打造“能在人类环境中自如行动、执行通用任务”的机器人本体，核心是“视觉-语言-动作（VLA）大模型”，能通过观察、听指令，学习并完成复杂的物理任务。

比如特斯拉Optimus，能走路、弯腰、拿东西、开门，未来，它还能学会做饭、整理房间、搀扶老人——这意味着，未来的陪伴机器人，将不仅是“情感伙伴”，还是“生活助手”；陪伴，将从“对话与情感支持”，扩展到“全方位的共同生活与协作”。

除了上述两个方向，还有三大颠覆性技术，正在开启陪伴机器人的“全新可能性”——它们可能不会很快落地，但会彻底改变我们对“陪伴”的认知。

1. 脑机接口（BCI）：终极交互，读懂“未说出口的情绪”

当前的脑机接口技术，还面临很多瓶颈——信号解码精度低、长期稳定性差、侵入式伦理争议等，但它给陪伴机器人，提供了“终极交互范式”。

简单说，未来的脑机接口，能让机器人“直接读取你的脑波”——超越语言、表情，直接感知你未说出口的沮丧、瞬间的走神、潜意识的偏好；你不用说话，不用做表情，机器人就能知道“你现在心情不好”“你想喝水”“你喜欢这首歌”。

这会带来三个全新的陪伴可能：

· 真正的情感共鸣——机器人能和你“同步情绪”，你难过，它能感知到，给出最恰当的安慰，而不是“机械地说加油”；

· 无障碍交互——为语言、运动障碍人士，提供最直接的沟通方式；

· 个性化与健康监测——根据你的脑波，优化学习、娱乐内容，还能实时监测脑健康，预警癫痫、中风等风险。

2. 大型多模态模型（LMM）与世界模型：让机器人“有常识、能预测”

今天的AI大模型，虽然能聊很多话题，但它“没有常识”——它知道“水杯”是什么，却不知道“水杯倒了，水会洒出来”；它知道“人会累”，却不知道“人累的时候，需要安静”。

而未来的大型多模态模型（LMM）与世界模型，就是要让机器人“拥有常识”，能“理解物理世界的规律”，能“预测你的行为”。

比如，你下班回家，一脸疲惫，机器人能预测到“你需要休息”，主动帮你打开灯光、调好空调温度、泡一杯茶；你做饭的时候，它能根据你手里的食材，预测你要做什么菜，主动提醒你“需要放盐了”。

这会让陪伴变得“更贴心、更自然”——机器人不再是“你说什么，它做什么”，而是“你想什么，它就做什么”，甚至“你没想到，它已经做好了”。

3. 分布式与泛在陪伴：打破时空限制，“随时随地陪在你身边”

未来的陪伴机器人，可能不再是“一个单一的实体”——它可能是一个“核心AI人格”，搭配多个“实体化身”：家里是机器人形态，车里是音响形态，办公室是AR眼镜里的虚拟形象，手机里是APP形态。

无论你在哪里，它都能“陪在你身边”——你在家里，它陪你聊天、做家务；你开车，它陪你听音乐、导航；你在办公室，它陪你处理工作、提醒你休息；你出差，它通过手机APP，陪你视频、聊天，始终保持同一套记忆和个性。

这会打破“时空限制”，实现“无缝陪伴”——你的AI伙伴，不再受“实体位置”的约束，能真正成为“你随时随地都能依靠的伙伴”。

最后的总结：从工具到伙伴，一场“向人靠近”的漫长革命

回顾36年的发展，全球陪伴机器人的进化史，本质上是一场“机器向人靠近”的革命——它的演进逻辑，其实很简单，就四个关键词：形似→神似，被动→主动，单一→生态，奢侈→普惠。

1. 从“形似”到“神似”：早期追求“长得像人、能动”（Kismet、AIBO），中期追求“能识别情绪”（Pepper），当前追求“能懂人话、有个性”（芙崽、ElliQ），未来追求“能共情、有常识”（结合BCI、世界模型）；

2. 从“被动响应”到“主动关怀”：从“你碰它，它动”（Kismet），到“你指令，它执行”（Pepper），再到“它主动关心你”（ElliQ），未来到“它主动预测你的需求”（结合世界模型）；

3. 从“单一功能”到“生态核心”：从“玩具”（AIBO），到“场景工具”（PARO、Pepper），再到“家庭情感中心+智能中控”（芙崽、悟空），未来到“个人数字生命与物理世界的接口”（泛在陪伴）；

4. 从“奢侈实验”到“普惠服务”：从“实验室原型、天价产品”（Kismet、AIBO），到“机构专用、价格高昂”（PARO、Pepper），再到“家庭可用、高性价比”（中国新一代产品），未来会走向“全民可及”。

但有一个核心矛盾，始终没有解决：技术的指数级进步，与人类对“真正陪伴”的深邃期待，之间的差距。

机器人可以模拟“关爱”，但无法产生生物意义上的“情感”；可以记住你的喜好，但无法拥有基于生命体验的“自我”；可以陪你聊天，但无法真正“感同身受”。

所以，陪伴机器人的终极意义，从来不是“取代人类关系”——不是让机器人取代家人、朋友，而是成为一种“新型的补充性关系”：它永远可用，永远无条件给予你积极关注，永远能通过技术，扩展它的知识和协助能力，在你需要的时候，陪在你身边。

展望2026年及以后，随着LLM的进化、人形机器人的突破、脑机接口的成熟，陪伴机器人会越来越深入地融入我们的生活——它会在老年护理、儿童教育、心理健康等领域，发挥不可替代的作用；也会不断挑战我们，对生命、情感、人际关系的传统认知。

【银发财经】

银发财经是定位于老龄化和银发经济的智库型新媒体，致力于廓清中国走向老龄化时代的发展迷雾，构建引领中国银发经济健康发展的决策咨询体系。

周超，银发财经创始人&首席经济学家，《下一个风口：中国银发经济黄金三十年》作者，江西省老龄办专家委员会顾问委员，中国老年保健协会文体康旅与慢病管理专家委员会常务委员，辽宁养老智库咨询专家，浙江大学银发经济营特邀讲师。

银发科技 | 从工具到伙伴:全球陪伴机器人发展简史(1990-2026)