行业现状与市场竞争人形机器人行业前市场竞争激烈,部分厂商看似存活实则已陷入困境。2026年赚钱机会方向

1.机器人后市场:包括安装运维、租赁改造升级、二手流通、保险服务等领域,更易切入且能较快产生现金流。

2.特定行业领域

数据领域:数据采集与服务是蓝海,高质量数据是AI在工业和机器人领域应用的关键,数据采集可形成独立生意且越早做越有数据壁垒。

教育领域:如AI加机器人替换传统编程教具,与教培机构合作落地场景。

康养领域:康养护理机器人等在养老、康复场景有需求。

高风险场景:核工业巡检、高危设备检查、极端环境作业等,这类场景人难以进入,机器人是合理切入点。

3.细分垂类机器人:像空中、泳池清洁机器人,巡检维护机器人等,会先跑出一批能赚钱的小而美公司。

行业共识与趋势

投资人视角AI和机器人仍是科技主线,但投资更看重真实场景复购订单,纯概念项目会出局。

本体与集成厂商2026年是数据和成本的分水岭,厂商从卖硬件转向卖服务和数据,部分厂商深耕工业场景数据采集,也有厂商在教育场景快速变现。

核心零部件:关节模组等领域极度内卷,创业公司可尝试高端特种件或特色整机加系统能力,而标准化便宜零部件可能由车厂、家电厂主导。

技术路线:数据采集有动捕手套外骨骼遥操(人力参与,安全可控但成本高)、无人化实机采集(对技术要求高但长期有规模效应)等路径。

创业切入建议

中小团队可避开巨头主导的前市场(如本体、通用大模型等),关注后市场和行业智能化升级,且需结合懂高端制造和AI技术的人才,非纯算法战,需贴近具体场景如学校、商场、养老院等。

具身智能数据集建设近年来在标准化、规模化、质量控制和应用场景拓展等方面取得了一系列关键突破,为具身智能技术的产业化落地奠定了坚实基础。

一、标准化体系建设突破

1.首个行业标准发布:上海机器人产业技术研究院牵头联合19家产学研机构共同制定并发布了《人形机器人数据集数据标注》标准T/SAIAS·025-2025,以及人形机器人数据集分类与编码、质量评价、格式等系列标准。这标志着我国在具身智能数据标准体系建设上迈出关键一步,为行业提供了统一的数据处理与评估框架。

2.认证体系创新:国内首个大规模具身智能标准化数据集平台"浦江X"(穹顶 DOME)引入CR认证体系,从过程质量与内容质量(完整性、一致性、安全性等)双维度进行检测认证,通过符合性评价与等级性分级(L1-L5),实现对数据集的权威认证与分级准入。这种认证机制确保了数据资源的可靠性与行业通用性,解决了数据可信流通的关键难题。

二、规模化数据集建设突破

1.首个百万级真机数据集:智元机器人携手上海人工智能实验室等机构发布的AgiBot World数据集,是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比Open X-Embodiment数据集,其长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准。

2.无本体数据集开源:简智机器人开源的"10Kh RealOmni-Open DataSet"是具身智能行业最大规模无本体数据集,覆盖10大场景任务、超过30项技能,包含超过10,000小时、百万条以上高质量数据。该数据集创造性地采用便携式可穿戴设备实现数据高效采集,不再依赖特定机器人本体,以更加无感的方式直接在真实环境中记录人类的高精度动作轨迹。

3.多样化数据集涌现:国家地方共建人形机器人创新中心发布的RoboMIND 2.0数据集,操作轨迹数据增至30万条,覆盖11个工业、商用、家庭场景,新增1.2万条带触觉操作数据;银河通用发布的DexonomySim灵巧手操作数据集包含超过950万条高质量抓取姿态,覆盖超1万个物体与31种常用抓握类型。

三、数据采集技术突破

1.无本体模仿学习(UMI)技术:鹿明机器人推出的FastUMI Pro数据采集系统将单条数据采集时间从50秒缩短至10秒,效率提升5倍,同时将综合成本降至传统方法的五分之一。该系统实现了数据与机器人本体的解耦,可快速适配市场上数十种不同的机械臂和夹爪,有效打破数据孤岛。

2.多模态数据融合:具身智能数据集不再局限于视觉数据,而是融合了视觉、听觉、触觉、关节角度、力矩参数等多模态信号。例如,箸境智能的具身智能数据集不仅包含机器人"视角"的实时画面,还完整记录了执行过程中各关节的电流、角度、力矩等参数,并附带任务指令。

3.数据质量显著提升:鹿明机器人通过集成高性能传感器和8道工业级数据质量评估体系,使数据有效率从行业普遍的70%提升至95%。这种"高纯度黄金数据"为机器人策略模型的稳定训练与迭代提供了坚实基础。

四、应用场景拓展突破

1.真实场景全覆盖:具身智能数据集建设已从实验室环境转向真实场景。北京人形机器人创新中心打造的具身智能数据训练基地将数据训练场直接搬到产业一线,让机器人在真实场景中采集数据,形成"毕业即实训""生产即训练"的数据飞轮闭环。

2.多行业应用拓展:数据集覆盖场景从传统的工业制造扩展到家政、教育、医疗康养、商超零售等多元领域。"浦江X"平台在北京、上海、杭州、福州、山东等地通过分布式采集接入,构建了覆盖10个重点行业、50+典型任务的标准化数据分布体系。

3.长程任务能力提升:数据集更加注重长程任务的采集与训练,如AgiBot World数据集的长程数据规模显著提升,RealOmni数据集对单任务至少具备万条clips以上累计深度,长程任务比例超过99.2%,有效提升了机器人在复杂环境中的任务执行能力。

五、数据生态建设突破

1.数据交易平台突破:20261月,江苏箸境智能科技有限公司的具身智能数据集在江苏省数据交易所完成交易,实现全国该领域零的突破。这是具身智能数据集首次在数据交易所实现流通,标志着具身智能数据资产化的新路径。

2.开源生态加速形成:多个高质量数据集开源发布,如AgiBot WorldRealOmniDexonomySim等,吸引了全球研究者的广泛参与。AgiBot World数据集已上线魔塔社区、OpenDataLabHuggingfaceGitHub等国内外平台,累计下载量达29K

3.数据-模型-应用闭环:北京人形机器人创新中心开源的RoboMIND 2.0数据集与XR-1具身VLA大模型形成完整闭环,ArtVIP高保真数字资产数据集与真机数据结合使用,可使机器人任务成功率平均提升超25%,实现了从数据到应用的价值闭环。

这些突破不仅解决了具身智能领域长期存在的"数据孤岛、标准缺失、治理缺失"等行业共性难题,还为具身智能技术从实验室走向产业落地提供了关键支撑。随着更多高质量数据集的持续建设和开源共享,具身智能产业将加速迈入"科研-应用-产业"的深度协同与良性循环阶段,为具身智能产业打造可信、开放、共享的发展新生态。

国内机器人训练数据企业的护城河介绍

在国内为机器人提供训练数据的企业中,有多家在不同领域构建了自身的护城河,以下为你介绍主要的几家:

商汤科技

业务布局:在计算机视觉领域积累深厚,为机器人提供基于视觉的训练数据,涵盖场景识别、物体检测等多类数据。

护城河:拥有大规模的标注团队和先进的自动化标注技术,能高效处理海量视觉数据;同时依托其在AI算法领域的优势,可对数据质量进行深度优化,确保数据与算法的适配性,形成数据与技术的协同壁垒。

科大讯飞

业务布局:聚焦于语音交互类训练数据,为服务型机器人、陪伴型机器人等提供语音指令、语义理解等方面的数据支持。

护城河:在语音识别和自然语言处理领域有长期技术积累,拥有海量的语音语料库,且具备强大的方言、多语种数据处理能力,能满足机器人在不同语言环境下的交互需求,这是其在语音类数据领域的核心壁垒。

云从科技

业务布局:围绕机器人的动作感知、行为理解等提供训练数据,例如机器人在复杂环境中的运动规划数据、人机交互动作数据等。

护城河:具备从数据采集、标注到模型训练的全流程能力,拥有自主研发的智能标注平台,可大幅提升数据处理效率;同时在人机协同场景数据的采集上有独特优势,能提供贴近真实应用场景的高价值数据。

数据堂

业务布局:是国内较早专注于人工智能训练数据服务的企业,为机器人行业提供多模态训练数据,包括图像、语音、文本、动作等数据的采集与标注。

护城河:拥有丰富的行业经验和庞大的数据源,与众多机器人厂商、科研机构建立了长期合作关系,数据覆盖场景广泛且具有多样性;此外,其在数据隐私保护和合规性方面做得较为出色,能为客户提供安全可靠的数据服务,这是其在数据服务领域的重要壁垒。

海天瑞声

业务布局:主要提供语音、图像、文本等多模态的训练数据,在机器人的感知、认知类数据供应上占据一定市场份额。

护城河:数据种类丰富且质量较高,拥有严格的质量控制体系,能为机器人算法训练提供精准的数据支撑;同时具备较强的定制化数据服务能力,可根据客户的特定需求采集和标注数据,满足不同机器人产品的个性化需求。

当前A股数据要素和AI领域企业的估值需结合行业特性、发展阶段和增长潜力综合判断,部分企业估值已反映高增长预期,存在阶段性溢价,但尚未达到泡沫水平,需区分对待。

一、估值合理性综合判断

1.行业整体估值水平

AI应用领域普遍估值较高:根据最新市场数据,AI应用(大模型/服务)领域PE-TTM普遍在100-180倍之间,概念炒作标的甚至超过200倍。

与历史对比:当前AI行情与1999年互联网泡沫时期有本质区别,纳斯达克指数当前PE41.64倍,远低于互联网泡沫巅峰时期的110倍,表明整体估值尚未脱离基本面支撑。

机构共识:当前AI产业仍处发展早期,即便存在阶段性估值溢价,其长期成长潜力仍值得期待。

2.重点企业估值分析

高估值但具备合理逻辑的企业

慧辰股份(688500

当前市值46亿元,PE-TTM-131.19倍(因2025年前三季度亏损)。

估值合理性:虽当前亏损,但机构预测2025-2027年净利润将达0.54/0.81/1.17亿元,同比增速201.0%/50.9%/44.0%。公司数据智能业务已进入增长通道,2025年前三季度数据采集及采购费用占营收66.54%,形成数据壁垒,当前估值反映市场对其AI业务爆发的预期。

海天瑞声(688787

当前市值84亿元,PE-TTM高达717.24倍。

估值合理性:作为A股稀缺的AI训练数据解决方案提供商,公司2025年上半年营收同比增长69.54%,归母净利润同比增长813.65%。高估值源于其在数据标注领域的先发优势和稀缺性,但需警惕估值过高带来的波动风险。

同方股份(600100

当前市值312.58亿元,PE70.78倍,PB1.93

估值合理性:公司2025年前三季度净利润3.29亿元,同比增长9.52%,但毛利率26.52%低于行业均值36.17%。估值偏高主要源于"数据要素+人工智能"双轮驱动战略带来的市场预期,但盈利能力一般,估值已部分透支未来增长。

估值存在明显风险的企业

易华录(300212

202622日跌停,预计2025年净利润亏损27.91亿至21.76亿元,净资产为负。

估值风险:已触发退市风险警示,数据湖业务计提大额减值,估值严重高估且存在退市风险,需高度警惕。

科大国创(300520

当前市值19.67亿美元(约136.5亿元人民币),净收入为负。

估值风险:公司仍处于亏损状态,缺乏盈利支撑的估值难以持续,需关注其AI业务能否实现扭亏为盈。

3.估值方法的特殊考量

对于AI和数据要素企业,传统估值方法需调整:

三层估值法:现有业务用PSP/FCF衡量,可见管线用PEG衡量,远期潜力需定性判断。

算力产出弹性(ECO):以产出增长率除以算力投入增长率,若长期大于0.25则表明AI投入有效。

AI企业合理估值锚:应关注"每一美元算力能带来多少租金收入",而非简单市盈率。

二、投资建议与风险提示

1.估值合理的投资方向

优先选择有落地场景的企业:如工业智能、金融科技、智能驾驶等领域的AI应用企业,这些领域已实现可量化的降本增效。

关注数据要素与AI融合企业:如慧辰股份等数据智能领军企业,其数据资源壁垒和行业场景深度结合形成护城河。

警惕"蹭热点"的伪AI企业:通过审视AI业务占比、业绩增长贡献和技术壁垒来筛选。

2.风险提示

技术迭代风险:AI技术发展迅速,若企业未能跟上技术迭代,可能导致产品落后。

商业化进程风险:部分AI应用场景(如AI医疗、AI教育)商业化进程较慢,需警惕业绩不及预期。

估值回调风险:当AI应用领域估值处于性价比低位时,流动性紧缩预期易引发调整。

3.理性投资策略

避免"炒概念"思维:转向务实策略,关注AI技术已产生实际效益的领域。

分散风险:避免单押一只股票,可考虑通过主题ETF等工具降低波动。

关注盈利驱动:在A股从估值驱动转向盈利驱动的阶段,选择AI能带来明确业绩增量的标的。

当前AI产业估值虽有溢价但未到泡沫水平,关键在于区分"AI""AI",聚焦已实现商业化落地、具备数据壁垒和行业场景深度结合的企业。对于普通投资者,建议关注2026年业绩预增且估值合理的AI应用标的,如广告营销、工业AI、财税AI等领域的领先企业,同时警惕估值过高且缺乏盈利支撑的标的。

A股市场中,数据要素与AI技术深度融合的企业正凭借数据积累、行业壁垒和先发优势构建起坚实的护城河,尤其在金融、政务、医疗、工业等垂直领域形成难以复制的竞争优势。

一、数据要素领域的护城河构建者

1.数据智能与AI平台企业

慧辰股份(688500):公司通过"数据要素×""人工智能+"双轮驱动战略,构建了涵盖数据采集、算法研发、模型构建、应用落地的完整业务体系。其数据采集及采购费用占营收比重高达66.54%,形成多维度行业数据库及数据标签库,为AI算法训练提供丰富数据要素储备。公司自主研发的"AI"智能应用平台已接入主流大模型,推出"ChatBI数据分析智能体"等产品,实现从底层AI能力到上层业务应用的全栈赋能,2025年上半年人均创收同比增长29.97%AI增效作用显著。

同方股份(600100):公司整合资源成立同方数科公司,设立"人工智能研究院",形成"数据要素+人工智能"双轮驱动的数字信息产业布局。旗下"华知大模型""L0+专业基础大模型"深入行业场景应用,助力各行业构建数智化基座,其"制度大模型""农业知识大模型"双双入选"北京市人工智能赋能行业发展典型案例集"

科大国创(300520):公司业务涵盖AI+行业应用软件、AI+新能源产品、AI+物流运营,形成数字化应用、数字化产品、数字化运营三大板块。自主研发的"科大国创星云大模型"与数据智能平台相结合,为水利数字孪生、智慧流域等领域提供支持,累计注册软件著作权575项,构建起深厚的技术护城河。

2.数据标注与训练数据领军企业

海天瑞声(688707):作为A股稀缺的专注提供AI训练数据解决方案的领军企业,公司是A股数据标注产业的核心代表。2024年通过在新加坡设立控股公司拓展海外数据交付基地,境外收入同比增长89.53%1.14亿元。公司已与河北保定、湖南长沙等地政府合作成立合资公司,布局数据标注基地全周期运营,预计2025-2027年营收将达3.45/4.83/6.44亿元,持续受益于AI大模型开发迭代和应用落地。

拓尔思(300229):公司拥有规模位列业界前茅的权威高质量公开数据超2000亿,具备数千亿数据量的数据索引、标记、查询、挖掘分析能力。20236月发布"拓天大模型",面向媒体、金融、政务领域推出三大行业垂类大模型,已在头部新闻单位和多家银行客户中成功应用。公司入选"中国AIGC50"榜单,并在《中国大模型发展研究报告(2024)》中位居前列。

3.政务与公共数据服务商

易华录(300212):公司是华录集团旗下唯一的上市公司,也是国内较早开展公共数据授权运营业务的央企国家队。从2017年开始基于华录集团蓝光存储大规模推广应用,6年时间里在全国建设了32个数据湖,先发优势明显。随着数字中国战略的推进,公司数据湖业务有望不断扩展,成为政务大数据领域的核心参与者。

二、AI应用领域的数据护城河构建者

1.金融AI数据服务企业

东华软件(002065):公司在金融行业深耕二十余年,客户覆盖200余家银行和众多金融机构,已打造出东华金融智脑、东华银企汇、东华金云等多款科技服务品牌。通过机器学习、知识图谱和NLP等技术,对金融机构客户信息和外部数据整合,形成用户标签和画像,实现精准营销定位,构建起完整的金融科技服务生态闭环。

宇信科技(300674):公司202310月推出首批金融行业大模型应用产品和解决方案,包括开发助手CodePal、金融数据安全分级分类助手DataSherpa等。研发投入持续攀升,从2018年的1.84亿元到2022年的5亿元,2023年前三季度研发投入3.83亿元,占同期收入12.55%。公司与华为签署鸿蒙生态合作协议,聚焦HarmonyOS NEXT在金融业务场景的原生应用开发。

2.工业与行业AI数据应用企业

云从科技(688327):公司聚焦跨镜追踪Re-ID等技术,依托人机协同操作系统,将感知、认知、决策技术闭环运用于跨场景解决方案。作为首个承建国家人工智能基础资源公共服务平台等三大国家平台的企业,其技术成果应用于全国400家银行网点及54家机场。202512月获华为昇腾"优选级合作伙伴"认证,进一步巩固其在AI数据应用领域的地位。

每日互动(300766):公司第二大股东幻方量化是DeepSeek的直接投资人,形成"数据-算力-应用"全链条绑定。覆盖超4亿日活设备用户行为数据,为DeepSeek模型训练提供低成本数据支持,已在中信证券等机构落地合作模型,上一交易日股价上涨8.5%10日累计上涨32%,市场认可度高。

三、护城河的构建逻辑与投资价值

1.数据护城河的三大核心要素

数据资源壁垒:如海天瑞声的2000亿级数据资源、慧辰股份66.54%的数据投入占比,形成难以复制的数据资产

行业场景深度结合:东华软件覆盖200余家银行、云从科技服务400家银行网点,深耕垂直行业形成场景化护城河

技术与数据闭环:拓尔思"拓天大模型"与行业数据结合,形成"数据训练模型、模型优化数据"的良性循环

2.护城河的验证指标

研发投入占比:宇信科技研发投入占收入12.55%,慧辰股份研发费用虽下降5.7%但通过智能辅助编程提升效率

客户黏性与复购率:东华软件形成完整金融科技生态闭环,客户转换成本高

政策支持与合规性:同方股份信息系统建设获"杰出级(CS5级)"认证,符合国家数据安全要求

3.投资价值与风险提示

这些企业凭借数据积累的先发优势和行业场景的深度结合,在AI浪潮中构建起难以复制的护城河。值得注意的是,数据要素市场正迎来政策催化,20251月国家发改委等4部门发布《关于促进数据标注产业高质量发展的实施意见》,提出到2027年数据标注产业规模年均复合增长率超过20%

然而,投资者也需警惕技术迭代风险和数据合规风险。如检索信息中提到:"技术进步快的行业,成本优势的寿命比较短""竞争对手终将获得领先企业的经验"。因此,持续的研发投入和灵活的商业模式是维持护城河的关键。

AI与数据深度融合的时代,这些企业不仅拥有数据的先发优势,更通过构建"数据-模型-应用"的闭环生态,形成了真正的护城河,值得长期关注。