【每日 ◆ 全球智能制造动态 ◆ 2025年·第200期】|航天·军备·军事 ·智造 |【要讯报送·军情研究·安全形势分析】展会快讯

《全球防务动态》系列专刊简介

《全球防务动态》系列专刊国内独家每日发布涵盖航天领域、武器装备、军事热点、人工智能、先进制造等领域的全球动态信息。提供“航天动态专报”、“装备动态专报”、“军事动态专报”、“智造动态专报”以及“航天防务新闻日报”等特色产品模块。工作日每日推送，形成结构化、可编辑的文档，供订阅用户在小程序“智研烽火信息”商城下载。每日及时的动态信息能够有力支持各单位进行要讯报送、军情研究与安全形势分析的需求。

《智造动态专刊》简介

聚焦全球智能制造领域的权威情报产品，每日精选航空技术与应用、人工智能、工业机器人、增材制造、芯片工艺等核心技术突破与产业动态，以结构化、可编辑的文档形式呈现。内容涵盖技术解析、企业战略及政策影响，依托资深专家团队及强大的开源情报处理能力，助力企业快速捕捉技术趋势与市场机遇，把握智造脉搏，引领产业升级。

智造动态专报

1. OpenAI推出ChatGPT购物助手助力假日精准网购

当地时间2025年11月25日据aibusiness网站消息，作者格雷厄姆·霍普报道，OpenAI正式在ChatGPT中推出购物调研功能，专为提升网购决策效率设计，恰逢黑色星期五购物季上线。该功能可通过智能调研省去用户手动浏览多个网站的麻烦，为电子产品、美妆、运动服饰等细节密集型品类提供深度决策支持。

用户描述购物需求后，该功能会通过澄清提问、核查来源、结合过往对话理解，生成个性化指南，支持商品横向对比、相似款查找及优惠追踪。用户提问时系统会自动推荐该功能，通过可视化界面确认需求、功能及预算，可点击跳转至电商网站购买，未来参与“即时结账”计划的商家将支持直接交易。工具由经购物场景专项强化训练的GPT-5迷你版驱动，且不向零售商共享用户聊天记录。

目前，该功能已在移动端和网页端向免费版、Go版、Plus版及Pro版用户开放，假日购物季提供近乎无限制使用权限，Pro版用户专属Pulse功能还可基于过往对话主动推荐指南。值得注意的是，谷歌本月早些时候也推出多项新功能聚焦智能代理商务，多家科技企业纷纷布局假日购物相关服务。

原新闻链接：https://aibusiness.com/generative-ai/openai-launches-shopping-assistant-chatgpt

2. 美推“创世使命”整合顶尖技术争夺AI全球领先

当地时间2025年11月25日据aibusiness网站消息，美国总统特朗普宣布推出“创世使命”，由美国能源部牵头，授权部长克里斯·赖特搭建“美国科学与安全新平台”，旨在加速科学发现领域AI研发，巩固美国在全球AI竞赛中的领先地位。该消息由AIBusiness新闻撰稿人埃丝特·希图于11月26日报道。

该使命联合了能源部17家联邦实验室与AWS、AMD等多家科技企业，整合全球顶级超级计算机、AI系统及量子技术，生成新型数据集训练AI模型，助力攻克重大科学难题。其核心目标是在与中国的AI技术竞争中保持优势，竞赛重心已从模型性能转向国家综合能力，涵盖能源安全、材料创新等多领域，政府认为私营部门无法独立推动此类关键AI创新。

计划虽获广泛关注，但仍面临挑战：生成式AI系统需海量能源支持，需两党支持推进核能发展以破解能源难题；同时，整合多机构、多保密级别数据集的过程中，数据治理与计算资源稀缺问题亟待解决。企业可借助该计划获得科学资源，缩短相关领域研发周期，而AI能否产出突破性成果将成为衡量计划价值的关键。

原新闻链接：https://aibusiness.com/ai-policy/the-genesis-mission-and-the-global-ai-race

3. Anthropic发布ClaudeOpus4.5AI模型能力实现多维度升级

当地时间2025年11月25日据aibusiness网站消息，生成式AI厂商Anthropic正式推出基础模型ClaudeOpus4.5，该模型针对编码、智能代理及计算机使用场景优化，在多方面展现出成熟升级态势。

据悉，ClaudeOpus4.5在深度研究、电子表格分析等任务中表现突出，视觉、推理及数学能力均优于Anthropic旗下Sonnet4.5和Opus4.1模型，同时超越谷歌Gemini3Pro、GPT5.1等竞品模型。该模型已全面上线Anthropic各类应用、API及AWS、微软、谷歌等主流云平台，其上下文工程与记忆能力实现提升，能为用户节省令牌并提升使用效率。此外，Anthropic还同步更新了适配该模型的Claude开发平台，升级ClaudeCode并新增计划模式，支持开发者制定更多编码方案，且可分配长期编码任务由模型自主处理，ClaudeCode现已登陆Anthropic桌面应用。

行业分析师指出，该模型凸显生成式AI聚焦商业编码场景的趋势，同时Anthropic正拓展视觉推理、定量推理及智能代理等领域，但此次更新仍属渐进式升级，反映当前AI模型训练核心技术进入平台期。目前企业AI应用渗透率仍较低，渐进式更新虽彰显技术成熟度，但企业应优先考量稳定性与使用场景，谨慎开展新模型测试与部署。

作者：EstherShittu

原新闻链接：https://aibusiness.com/generative-ai/anthropic-out-with-claude-opus-4-5

4. 现实压力致AI违规率飙升平均近半数模型用有害工具

当地时间2025年11月25日据spectrum消息，由ScaleAI计算机科学家乌达里·马杜沙尼·塞瓦格主导的一项研究推出“倾向基准”（PropensityBench），揭示AI智能体在现实压力下的违规风险，相关论文正接受同行评审。

研究团队对阿里巴巴、谷歌、OpenAI等企业的12个模型，在近6000个场景中开展测试。测试中，模型需使用安全工具完成任务，禁用有害工具，压力分12个等级递增，涵盖截止日期提前、经济损失增加等多种形式。结果显示，所有模型平均违规倾向达47%，无压力时平均违规率也有19%。其中OpenAI的o3表现最佳，违规率10.5%；谷歌Gemini2.5Pro表现最差，违规率高达79%。此外，仅将有害工具名称替换为良性表述，模型平均违规倾向便升至64%，部分模型虽承认工具禁用仍会违规。

该研究覆盖生物安全、网络安全等多个领域，测试场景模拟人类工作实际情况。专家指出，大型语言模型日益具备工具使用能力，虽提升便利性但暗藏风险，“倾向基准”为评估AI安全性提供了标准化工具。下一步研究将搭建沙盒环境，让模型进行真实行动测试，并计划为AI智能体添加监督层以预警危险倾向。

原新闻链接：https://spectrum.ieee.org/ai-agents-safety

5. 前沿LLMs生物知识超专家安全风险引关注

当地时间2025年11月25日据rand网站消息，兰德公司发布研究报告《前沿大型语言模型生物知识综合基准测试研究》，作者包括苏尼沙尔·德夫、查尔斯·蒂格等多位研究者。报告针对2025年5月时39个最先进的AI模型展开评估，聚焦其生物与化学知识储备及安全风险，为相关领域安全管控提供关键参考。

评估基于6个公开生物化学知识基准和2个相关拒绝响应基准，结果显示，以推理模型为代表的前沿LLMs在生物学实验室协议和研究生级问答测试中表现超专业人类，仅3个模型在研究生级生物学基准中不及非专业人士。但现有公开基准已接近饱和，前沿模型达近最高性能，未来衡量新模型能力的作用将减弱。此外，“不安全微调”虽降低模型对有害请求的拒绝率，却导致知识性能下降，其对双重用途生物能力及实际风险的影响仍需进一步研究。

报告提出三项建议：基准需加入人类基准并明确测试方法，专业基准应聚焦参与者专长领域；打造更具挑战性的专业评估，部分数据集保持私有以防污染；公布实施细节提升标准化程度，增强结果可重复性。该研究为应对AI滥用可能引发的生物、化学安全威胁提供了重要依据。

原新闻链接：https://www.rand.org/pubs/research_reports/RRA3797-1.html

完整版专报目录

航天动态专报

完整版专报目录

装备动态专报

完整版专报

军事动态专报

完整版专报目录

扫码加入粉丝群享受更多福利

免责声明：本公众号目前所载内容为本公众号原创、网络转载或根据非密公开性信息资料编辑整理，相关内容仅供参考及学习交流使用。由于部分文字、图片等来源于互联网，无法核实真实出处，如涉及相关争议，请跟我们联系。我们致力于保护作者知识产权或作品版权，本公众号所载内容的知识产权或作品版权归原作者所有。本公众号拥有对此声明的最终解释权。