来源:AI 科技大本营(ID:rgznai100)
作者:王启隆
“女士们、先生们,欢迎来到英伟达。你现在身处我们的数字孪生世界中。此处所有内容均由人工智能生成。”
穿着标志性皮衣的英伟达 CEO 黄仁勋踌躇满志。刚刚,这位身价千亿的科技巨子在人称“科技界春晚”的 CES 2025(国际消费类电子产品展览会)完成了开幕演讲,老黄这次不仅发布了让全体玩家沸腾的 RTX 50 系列显卡,更展示了令人瞠目结舌的英伟达未来 AI 技术蓝图。
搭载最新 Blackwell 架构的 RTX 5090 配备了 920 亿个晶体管,能够实现 3352 AI TOPS 的算力、380 RT TFLOPS 的光线追踪性能和 125 Shader TFLOPS 的着色器性能,内存带宽高达 1.8 TB/s。配合最新的 DLSS 4 技术,图形性能相比 4090 提升了整整一倍。
目前国行售价仅公布了 RTX 5090D,起售价 16499 元。从今年 3 月开始,搭载 50 系列显卡的笔记本电脑也将陆续上市,海外售价如下图,对国行来说仅供参考:
不过,这次最受争议的显卡不止是 5090,还有系列的“中杯”显卡 5070。请看全网吵翻天的这张图:5070 “碰瓷” 4090!这相当于只需三分之一的价格,就能享受当今顶级显卡的算力,真正的下克上。
黄仁勋对这张 PPT 的具体解释是,搭载全新 DLSS 4 技术的入门级 RTX 5070,凭借每帧生成 3 帧的强大算力,能在实际游戏体验上媲美上代旗舰 4090。
他强调:“这在没有 AI 的情况下是不可能实现的。GeForce 让我们进入了 AI 时代,现在 AI 又将重新定义 GeForce。” 在他看来,就像 20 年前的可编程着色器彻底改变了计算机图形学,AI 正在掀起新一轮技术变革。
实际效果也很夸张,开不开 DLSS 有着 10 倍的帧数差距:
去年《黑神话:悟空》发售的时候,DLSS 的问题就引起了争议:AI 加持过的画面,还是游戏正常的画面吗?黄仁勋这次演讲相当于把类似问题回应了一遍:“每当英伟达宣称某款显卡性能翻倍,人们总会问:「这是真实的提升还是 AI 加持的结果?」,但这个问题本身就是一种过时的思维。在 AI 时代,计算本身的定义正在发生改变。”
他以 DLSS 4 为例解释这种范式转变。传统的图形渲染需要 GPU 计算每一个像素,但 DLSS 采用了完全不同的思路:先用光线追踪计算关键像素,再用 AI 生成中间帧。这种方法不仅节省了大量计算资源,更重要的是开创了一种全新的计算模式。
“想象一下大语言模型是如何工作的,”黄仁勋说,“你给它一个提示,它通过对每个 token 进行大量计算来生成答案。但在实际应用中,AI 不仅需要生成答案,更需要不断思考和推理。这需要一种全新的计算方式。”
这就引出了老黄接下来在演讲里提出的三条全新的 Scaling Law:
首先是经典的“预训练扩展”(pre-training scaling),也就是由 OpenAI 提出的,大家都熟知的那条 Scaling Law,老黄认为这条法则还是会继续生效。 在旧版法则的基础上,新增了两条新的法则。首先是“后训练扩展”(post-training scaling),即通过强化学习和人类反馈来优化模型。就像 DLSS 通过不断分析游戏画面来提升生成质量一样。 其次是“测试时扩展”(test-time scaling)。在实际使用时,AI 会根据任务复杂度动态分配计算资源。老黄原话是:“就像人类在思考问题时会投入不同程度的注意力,未来的 AI 也能智能地调配计算力。”
基于这三条定律,英伟达推出了全新的 Blackwell 架构。它不仅在单纯的计算性能上实现了突破,更重要的是能够支持 AI 的思考和推理过程。与上一代相比,Blackwell 每瓦性能提升了 4 倍,每美元性能提升了 3 倍。
说到此处,老黄也是整起了活儿,直接 cos 美队,把晶圆当成盾牌举了起来,倒是展现了新一代架构的规模:
这就是 Blackwell 架构最新的互联技术 NVLink72 系统,它集成了 72 块 Blackwell GPU,算力高达 1.4 ExaFLOPS,配备 14TB 内存和 1.2PB/s 带宽,内含 130 万亿个晶体管。整个系统重达 1.5 吨,包含 60 万个零件,相当于 20 辆汽车的零件总和。“全世界的互联网流量都能通过这些芯片进行处理,”黄仁勋说,“而这套系统已经在全球 45 家工厂投产,这就是 AI 的普及程度,看看整个行业正以多快的速度拥抱新的计算模式。”
除了半身大的“盾牌”,老黄还在演讲时举起了另一个巴掌小的设备。
“这个项目最初叫 DGX,但后来我们决定叫它 Project DIGITS,它代表着深度学习 GPU 智能训练系统(Deep Learning GPU Intelligence Training System)。”
这款被英伟达官方称为“世界最小 AI 超级计算机”的设备,搭载了传说中神秘的 GB10 芯片。联发科参与设计的这颗芯片整合了最新一代 CUDA 核心、第五代 Tensor Cores 和采用 Arm 架构的 20 个高能效 CPU 核心,在 FP4 精度下可提供高达 1 PFLOPS 的 AI 性能。
“每位数据科学家、AI 研究人员和学生的办公桌上都应该有一台这样的个人 AI 超级计算机,”黄仁勋说,“因为 AI 将成为每个行业、每个应用的主流。”
搭载 128GB 统一内存和 4TB NVMe 存储的 Project DIGITS,仅需一个普通电源插座就能运行高达 2000 亿参数的大模型。
如果把两台设备连接在一起,则更可以处理 4050 亿参数级别的 AI 任务。4050 这个数字比较刻意,直接点名了 Llama 3.1 模型。
总之,未来一个普通开发者就能在办公桌上完成过去只有大型数据中心才能进行的 AI 研发。
“我们希望让每个人都能参与并塑造人工智能时代,”黄仁勋说。Project DIGITS 预计将于今年 5 月上市,起售价为 3000 美元(约 21978元)。它支持从 HuggingFace 到 PyTorch 等主流 AI 开发框架,可用于模型微调和日常开发。
接下来就是重磅部分,英伟达的 AI 蓝图。
这个名字要是直译起来则相当霸气:“英伟达宇宙世界基础模型”。但这里的“Cosmos”是它的正式名字,即英伟达今天发布的全球首个世界基础模型 Cosmos。
“就像大语言模型让 AI 学会交谈,Cosmos 将让 AI 学会行动。”
这个经过 2000 万小时视频训练的 AI 系统,不仅能理解物理规律,还能预测物体运动。更重要的是,Cosmos 采用开源商业许可,让任何企业都能基于这一平台开发自己的物理 AI 应用。
为适应不同场景需求,Cosmos 提供了三种规格的模型:
Nano 系列针对边缘设备优化,实现超低延迟;
Super 系列面向主流应用,开箱即用;
Ultra 系列追求最高精度,支持深度定制;
通过与英伟达之前的物理仿真平台 Omniverse 深度整合,Cosmos 还能将物理仿真与 AI 生成无缝结合。“这就像给机器人创造了一个数字孪生的训练场,”黄仁勋解释说,“它们可以在虚拟世界中不断练习和改进,然后再把学到的技能应用到现实世界。”
目前已有包括丰田、Uber 在内的多家巨头开始使用 Cosmos。在现场,黄仁勋还宣布丰田将基于英伟达芯片和操作系统开发下一代新能源汽车。
然后是上面的这张图比较有意思,最上方是“英伟达 AI 蓝图”,里面其实是各种各样不停切换的 AI Agents。基于此,英伟达发布了一系列关键工具。首先是基于 Meta Llama 的 Nemotron 模型系列。这套模型分为三个层次:针对边缘设备优化的 Nano 系列,开箱即用的 Super 系列,以及可用作“教师模型”的 Ultra 系列。每个层次都针对不同场景进行了优化。
值得一提的是 NIM 微服务生态。英伟达联合 Black Forest Labs、Meta 等顶级开发者,针对 RTX AI PC 优化了一系列微服务,可在 Windows 11 PC 上快速部署。此外,基于 NIM 的 AI 蓝图还为开发者提供了丰富的预设工作流,比如 PDF 转播客、3D 引导生成式 AI 等。
基于此又出了一套 Cosmos Nemotron 视觉语言模型。它通过英伟达的 NIM 微服务支持开发者构建能分析和响应图像及视频的智能体,应用于多个领域。这也是 Cosmos 平台走向开源的重要一步。
“Ultra 系列不仅可以评估其他模型生成的答案,还能作为知识蒸馏的基础模型。”黄仁勋说,“我们希望为企业提供完整的 AI 开发工具链。”
另一个重要发布是 Isaac GR00T 平台。这是一套专门面向人形机器人的开发工具。工程师可以戴上 Vision Pro,在虚拟环境中示范动作。系统会将这些示范动作自动扩展成海量训练数据。
在黄仁勋看来,未来最有前景的是三类机器人:信息工作者(AI 助手)、自动驾驶汽车和人形机器人。这三者的共同点是不需要重新改造现有环境,就能部署在我们为人类建造的世界中。
“这就是机器人革命的关键,”黄仁勋说,“不是要求世界适应机器人,而是让机器人来适应我们的世界。AI Agent 可以在办公软件中工作,自动驾驶汽车可以利用现有的道路系统,人形机器人则可以使用为人类设计的工具和设施。”
每一类机器人都需要三种计算机的配合:DGX 用于训练AI模型,Omniverse 创建数字孪生用于测试优化,AGX/Thor 芯片则部署在实体设备中。这个“三机战略”体现了英伟达对产业链的深刻理解。
“我们需要在虚拟世界中进行大量测试,”黄仁勋在现场展示新一代车规级芯片 Thor 时说道,“一辆自动驾驶汽车可能需要行驶数百万英里才能遇到足够多的边缘场景。但在 Omniverse 中,我们可以快速生成和验证这些场景。”
“过去训练机器人需要大量的物理实验,”黄仁勋解释说,“每个动作都可能损坏设备。有了 Isaac Groot,我们可以在数字孪生环境中完成 95% 的训练。”
然后就是今天最震撼的一幕:颇有英伟达真正率领人形机器人大军的感觉。
最后,黄仁勋做出了大胆预测:“自动驾驶革命已经到来,这很可能成为首个市值超万亿美元的机器人产业。而这仅仅是个开始,Cosmos 将为整个机器人行业带来类似 Llama 的突破。”
30 年前,英伟达还只是做世嘉游戏卡起家的小公司。“我在丹尼斯餐厅当洗碗工时学到的勤奋、谦逊和好客精神,帮助我度过了英伟达早期的种种困难。”黄仁勋回忆道。
如今,AI 浪潮让英伟达成为全球第二大上市公司(可能过几天就不止第二了),估值达 3.66 万亿美元。但在黄仁勋看来,这才刚刚开始。
“ChatGPT 用了 6 年时间从 AlexNet 发展而来,”他说,“而在机器人领域,我们已经具备了所有必要的技术。”
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https://wx.zsxq.com/group/454854145828
截止到12月25日 ”未来知识库”精选的100部前沿科技趋势报告
2024 美国众议院人工智能报告:指导原则、前瞻性建议和政策提案
未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇
Deepmind:AI 加速科学创新发现的黄金时代报告
Continental 大陆集团:2024 未来出行趋势调研报告
埃森哲:未来生活趋势 2025
国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景
哈尔滨工业大学:2024 具身大模型关键技术与应用报告
爱思唯尔(Elsevier):洞察 2024:科研人员对人工智能的态度报告
李飞飞、谢赛宁新作「空间智能」 等探索多模态大模型性能
欧洲议会:2024 欧盟人工智能伦理指南:背景和实施
通往人工超智能的道路:超级对齐的全面综述
清华大学:理解世界还是预测未来?世界模型综合综述
Transformer 发明人最新论文:利用基础模型自动搜索人工生命
兰德公司:新兴技术监督框架发展的现状和未来趋势的技术监督报告
麦肯锡全球研究院:2024 年全球前沿动态(数据)图表呈现
兰德公司:新兴技术领域的全球态势综述
前瞻:2025 年人形机器人产业发展蓝皮书 - 人形机器人量产及商业化关键挑战
美国国家标准技术研究院(NIST):2024 年度美国制造业统计数据报告(英文版)
罗戈研究:2024 决策智能:值得关注的决策革命研究报告
美国航空航天专家委员会:2024 十字路口的 NASA 研究报告
中国电子技术标准化研究院 2024 扩展现实 XR 产业和标准化研究报告
GenAI 引领全球科技变革关注 AI 应用的持续探索
国家低空经济融创中心中国上市及新三板挂牌公司低空经济发展报告
2025 年计算机行业年度策略从 Infra 到 AgentAI 创新的无尽前沿
多模态可解释人工智能综述:过去、现在与未来
【斯坦福博士论文】探索自监督学习中对比学习的理论基础
《机器智能体的混合认知模型》最新 128 页
Open AI 管理 AI 智能体的实践
未来生命研究院 FLI2024 年 AI 安全指数报告 英文版
兰德公司 2024 人工智能项目失败的五大根本原因及其成功之道 - 避免 AI 的反模式 英文版
Linux 基金会 2024 去中心化与人工智能报告 英文版
脑机接口报告脑机接口机器人中的人机交换
联合国贸发会议 2024 年全球科技创新合作促发展研究报告 英文版
Linux 基金会 2024 年世界开源大会报告塑造人工智能安全和数字公共产品合作的未来 英文版
Gartner2025 年重要战略技术趋势报告 英文版
Fastdata 极数 2024 全球人工智能简史
中电科:低空航行系统白皮书,拥抱低空经济
迈向科学发现的生成式人工智能研究报告:进展、机遇与挑战
哈佛博士论文:构建深度学习的理论基础:实证研究方法
Science 论文:面对 “镜像生物” 的风险
镜面细菌技术报告:可行性和风险
Neurocomputing 不受限制地超越人类智能的人工智能可能性
166 页 - 麦肯锡:中国与世界 - 理解变化中的经济联系(完整版)
未来生命研究所:《2024 人工智能安全指数报告》
德勤:2025 技术趋势报告 空间计算、人工智能、IT 升级。
2024 世界智能产业大脑演化趋势报告(12 月上)公开版
联邦学习中的成员推断攻击与防御:综述
兰德公司 2024 人工智能和机器学习在太空领域感知中的应用 - 基于两项人工智能案例英文版
Wavestone2024 年法国工业 4.0 晴雨表市场趋势与经验反馈 英文版
Salesforce2024 年制造业趋势报告 - 来自全球 800 多位行业决策者对运营和数字化转型的洞察 英文版
MicrosoftAzure2024 推动应用创新的九大 AI 趋势报告
DeepMind:Gemini,一个高性能多模态模型家族分析报告
模仿、探索和自我提升:慢思维推理系统的复现报告
自我发现:大型语言模型自我组成推理结构
2025 年 101 项将 (或不会) 塑造未来的技术趋势白皮书
《自然杂志》2024 年 10 大科学人物推荐报告
量子位智库:2024 年度 AI 十大趋势报告
华为:鸿蒙 2030 愿景白皮书(更新版)
电子行业专题报告:2025 年万物 AI 面临的十大待解难题 - 241209
中国信通院《人工智能发展报告(2024 年)》
美国安全与新兴技术中心:《追踪美国人工智能并购案》报告
Nature 研究报告:AI 革命的数据正在枯竭,研究人员该怎么办?
NeurIPS 2024 论文:智能体不够聪明怎么办?让它像学徒一样持续学习
LangChain 人工智能代理(AI agent)现状报告
普华永道:2024 半导体行业状况报告发展趋势与驱动因素
觅途咨询:2024 全球人形机器人企业画像与能力评估报告
美国化学会 (ACS):2024 年纳米材料领域新兴趋势与研发进展报告
GWEC:2024 年全球风能报告英文版
Chainalysis:2024 年加密货币地理报告加密货币采用的区域趋势分析
2024 光刻机产业竞争格局国产替代空间及产业链相关公司分析报告
世界经济论坛:智能时代,各国对未来制造业和供应链的准备程度
兰德:《保护人工智能模型权重:防止盗窃和滥用前沿模型》-128 页报告
经合组织 成年人是否具备在不断变化的世界中生存所需的技能 199 页报告
医学应用中的可解释人工智能:综述
复旦最新《智能体模拟社会》综述
《全球导航卫星系统(GNSS)软件定义无线电:历史、当前发展和标准化工作》最新综述
《基础研究,致命影响:军事人工智能研究资助》报告
欧洲科学的未来 - 100 亿地平线研究计划
Nature:欧盟正在形成一项科学大型计划
Nature 欧洲科学的未来
欧盟科学 —— 下一个 1000 亿欧元
欧盟向世界呼吁 加入我们价值 1000 亿欧元的研究计划
DARPA 主动社会工程防御计划(ASED)《防止删除信息和捕捉有害行为者(PIRANHA)》技术报告
兰德《人工智能和机器学习用于太空域感知》72 页报告
构建通用机器人生成范式:基础设施、扩展性与策略学习(CMU 博士论文)
世界贸易组织 2024 智能贸易报告 AI 和贸易活动如何双向塑造 英文版
人工智能行业应用建设发展参考架构
波士顿咨询 2024 年欧洲天使投资状况报告 英文版
2024 美国制造业计划战略规划
【新书】大规模语言模型的隐私与安全
人工智能行业海外市场寻找 2025 爆款 AI 应用 - 241204
美国环保署 EPA2024 年版汽车趋势报告英文版
经济学人智库 EIU2025 年行业展望报告 6 大行业的挑战机遇与发展趋势 英文版
华为 2024 迈向智能世界系列工业网络全连接研究报告
华为迈向智能世界白皮书 2024 - 计算
华为迈向智能世界白皮书 2024 - 全光网络
华为迈向智能世界白皮书 2024 - 数据通信
华为迈向智能世界白皮书 2024 - 无线网络
安全牛 AI 时代深度伪造和合成媒体的安全威胁与对策 2024 版
2024 人形机器人在工业领域发展机遇行业壁垒及国产替代空间分析报告
《2024 年 AI 现状分析报告》2-1-3 页.zip
万物智能演化理论,智能科学基础理论的新探索 - newv2
世界经济论坛 智能时代的食物和水系统研究报告
生成式 AI 时代的深伪媒体生成与检测:综述与展望
科尔尼 2024 年全球人工智能评估 AIA 报告追求更高层次的成熟度规模化和影响力英文版
计算机行业专题报告 AI 操作系统时代已至 - 241201
Nature 人工智能距离人类水平智能有多近?
Nature 开放的人工智能系统实际上是封闭的
斯坦福《统计学与信息论》讲义,668 页 pdf
国家信息中心华为城市一张网 2.0 研究报告 2024 年
国际清算银行 2024 生成式 AI 的崛起对美国劳动力市场的影响分析报告 渗透度替代效应及对不平等状况英文版
大模型如何判决?从生成到判决:大型语言模型作为裁判的机遇与挑战
毕马威 2024 年全球半导体行业展望报告
MR 行业专题报告 AIMR 空间计算定义新一代超级个人终端 - 241119
DeepMind 36 页 AI4Science 报告:全球实验室被「AI 科学家」指数级接管
《人工智能和机器学习对网络安全的影响》最新 273 页
2024 量子计算与人工智能无声的革命报告
未来今日研究所:2024 技术趋势报告 - 广义计算篇
科睿唯安中国科学院 2024 研究前沿热度指数报告
文本到图像合成:十年回顾
《以人为中心的大型语言模型(LLM)研究综述》
经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版
波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告 英文版
理解世界还是预测未来?世界模型的综合综述
英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施
花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告
国际可再生能源署 IRENA2024 年全球气候行动报告
Cell: 物理学和化学 、人工智能知识领域的融合
智次方 2025 中国 5G 产业全景图谱报告
上下滑动查看更多