《全球防务动态》系列专刊简介


《全球防务动态》系列专刊国内独家每日发布涵盖航天领域、武器装备、军事热点、人工智能、先进制造等领域的全球动态信息。提供航天动态专报装备动态专报军事动态专报智造动态专报以及航天防务新闻日报等特色产品模块工作日每日推送,形成结构化、可编辑的文档,供订阅用户在小程序智研烽火信息商城下载。每日及时的动态信息能够有支持各单位进行报送、军情研究与安全形势分析的需求。



《智造动态专刊》简介


聚焦全球智能制造领域的权威情报产品,每日精选航空技术与应用人工智能、工业机器人、增材制造、芯片工艺等核心技术突破与产业动态,以结构化、可编辑的文档形式呈现。内容涵盖技术解析、企业战略及政策影响,依托资深专家团队及强大的开源情报处理能力,助力企业快速捕捉技术趋势与市场机遇,把握智造脉搏,引领产业升级。


智造动态专报

1. OpenAI推出ChatGPT购物助手助力假日精准网购

当地时间20251125日据aibusiness网站消息,作者格雷厄姆·霍普报道,OpenAI正式在ChatGPT中推出购物调研功能,专为提升网购决策效率设计,恰逢黑色星期五购物季上线。该功能可通过智能调研省去用户手动浏览多个网站的麻烦,为电子产品、美妆、运动服饰等细节密集型品类提供深度决策支持。

用户描述购物需求后,该功能会通过澄清提问、核查来源、结合过往对话理解,生成个性化指南,支持商品横向对比、相似款查找及优惠追踪。用户提问时系统会自动推荐该功能,通过可视化界面确认需求、功能及预算,可点击跳转至电商网站购买,未来参与“即时结账”计划的商家将支持直接交易。工具由经购物场景专项强化训练的GPT-5迷你版驱动,且不向零售商共享用户聊天记录。

目前,该功能已在移动端和网页端向免费版、Go版、Plus版及Pro版用户开放,假日购物季提供近乎无限制使用权限,Pro版用户专属Pulse功能还可基于过往对话主动推荐指南。值得注意的是,谷歌本月早些时候也推出多项新功能聚焦智能代理商务,多家科技企业纷纷布局假日购物相关服务。

原新闻链接:https://aibusiness.com/generative-ai/openai-launches-shopping-assistant-chatgpt

2. 美推“创世使命”整合顶尖技术争夺AI全球领先

当地时间20251125日据aibusiness网站消息,美国总统特朗普宣布推出“创世使命”,由美国能源部牵头,授权部长克里斯·赖特搭建“美国科学与安全新平台”,旨在加速科学发现领域AI研发,巩固美国在全球AI竞赛中的领先地位。该消息由AIBusiness新闻撰稿人埃丝特·希图于1126日报道。

该使命联合了能源部17家联邦实验室与AWSAMD等多家科技企业,整合全球顶级超级计算机、AI系统及量子技术,生成新型数据集训练AI模型,助力攻克重大科学难题。其核心目标是在与中国的AI技术竞争中保持优势,竞赛重心已从模型性能转向国家综合能力,涵盖能源安全、材料创新等多领域,政府认为私营部门无法独立推动此类关键AI创新。

计划虽获广泛关注,但仍面临挑战:生成式AI系统需海量能源支持,需两党支持推进核能发展以破解能源难题;同时,整合多机构、多保密级别数据集的过程中,数据治理与计算资源稀缺问题亟待解决。企业可借助该计划获得科学资源,缩短相关领域研发周期,而AI能否产出突破性成果将成为衡量计划价值的关键。

原新闻链接:https://aibusiness.com/ai-policy/the-genesis-mission-and-the-global-ai-race

3. Anthropic发布ClaudeOpus4.5AI模型能力实现多维度升级

当地时间20251125日据aibusiness网站消息,生成式AI厂商Anthropic正式推出基础模型ClaudeOpus4.5,该模型针对编码、智能代理及计算机使用场景优化,在多方面展现出成熟升级态势。

据悉,ClaudeOpus4.5在深度研究、电子表格分析等任务中表现突出,视觉、推理及数学能力均优于Anthropic旗下Sonnet4.5Opus4.1模型,同时超越谷歌Gemini3ProGPT5.1等竞品模型。该模型已全面上线Anthropic各类应用、APIAWS、微软、谷歌等主流云平台,其上下文工程与记忆能力实现提升,能为用户节省令牌并提升使用效率。此外,Anthropic还同步更新了适配该模型的Claude开发平台,升级ClaudeCode并新增计划模式,支持开发者制定更多编码方案,且可分配长期编码任务由模型自主处理,ClaudeCode现已登陆Anthropic桌面应用。

行业分析师指出,该模型凸显生成式AI聚焦商业编码场景的趋势,同时Anthropic正拓展视觉推理、定量推理及智能代理等领域,但此次更新仍属渐进式升级,反映当前AI模型训练核心技术进入平台期。目前企业AI应用渗透率仍较低,渐进式更新虽彰显技术成熟度,但企业应优先考量稳定性与使用场景,谨慎开展新模型测试与部署。

作者:EstherShittu

原新闻链接:https://aibusiness.com/generative-ai/anthropic-out-with-claude-opus-4-5

4. 现实压力致AI违规率飙升平均近半数模型用有害工具

当地时间20251125日据spectrum消息,由ScaleAI计算机科学家乌达里·马杜沙尼·塞瓦格主导的一项研究推出“倾向基准”(PropensityBench),揭示AI智能体在现实压力下的违规风险,相关论文正接受同行评审。

研究团队对阿里巴巴、谷歌、OpenAI等企业的12个模型,在近6000个场景中开展测试。测试中,模型需使用安全工具完成任务,禁用有害工具,压力分12个等级递增,涵盖截止日期提前、经济损失增加等多种形式。结果显示,所有模型平均违规倾向达47%,无压力时平均违规率也有19%。其中OpenAIo3表现最佳,违规率10.5%;谷歌Gemini2.5Pro表现最差,违规率高达79%。此外,仅将有害工具名称替换为良性表述,模型平均违规倾向便升至64%,部分模型虽承认工具禁用仍会违规。

该研究覆盖生物安全、网络安全等多个领域,测试场景模拟人类工作实际情况。专家指出,大型语言模型日益具备工具使用能力,虽提升便利性但暗藏风险,“倾向基准”为评估AI安全性提供了标准化工具。下一步研究将搭建沙盒环境,让模型进行真实行动测试,并计划为AI智能体添加监督层以预警危险倾向。

原新闻链接:https://spectrum.ieee.org/ai-agents-safety

5. 前沿LLMs生物知识超专家安全风险引关注

当地时间20251125日据rand网站消息,兰德公司发布研究报告《前沿大型语言模型生物知识综合基准测试研究》,作者包括苏尼沙尔·德夫、查尔斯·蒂格等多位研究者。报告针对20255月时39个最先进的AI模型展开评估,聚焦其生物与化学知识储备及安全风险,为相关领域安全管控提供关键参考。

评估基于6个公开生物化学知识基准和2个相关拒绝响应基准,结果显示,以推理模型为代表的前沿LLMs在生物学实验室协议和研究生级问答测试中表现超专业人类,仅3个模型在研究生级生物学基准中不及非专业人士。但现有公开基准已接近饱和,前沿模型达近最高性能,未来衡量新模型能力的作用将减弱。此外,“不安全微调”虽降低模型对有害请求的拒绝率,却导致知识性能下降,其对双重用途生物能力及实际风险的影响仍需进一步研究。

报告提出三项建议:基准需加入人类基准并明确测试方法,专业基准应聚焦参与者专长领域;打造更具挑战性的专业评估,部分数据集保持私有以防污染;公布实施细节提升标准化程度,增强结果可重复性。该研究为应对AI滥用可能引发的生物、化学安全威胁提供了重要依据。

原新闻链接:https://www.rand.org/pubs/research_reports/RRA3797-1.html





完整版专报目录



航天动态专报

完整版专报目录


装备动态专报

完整版专报


军事动态专报


完整版专报目录


扫码加入粉丝群享受更多福利


免责声明:本公众号目前所载内容为本公众号原创、网络转载或根据非密公开性信息资料编辑整理,相关内容仅供参考及学习交流使用。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请跟我们联系。我们致力于保护作者知识产权或作品版权,本公众号所载内容的知识产权或作品版权归原作者所有。本公众号拥有对此声明的最终解释权。