AI 时代,软件已死?以后需要什么功能,让 Agent 现场生成就行,还要什么软件公司?
6月1日,黄仁勋在中国台北 GTC 甩出一张图,狠狠打碎了这个流行谎言。
这张图表上,GitHub 的代码提交量呈现出恐怖的指数级增长:2023 年 3 亿次,2024 年 4 亿次,2025 年 5 亿次。而 2026 年仅上半年,14 亿次。

几乎是前一年全年的三倍。
演讲看下来,Vera Rubin 架构的升级、因为 Agent(智能体)需求而加入的 256 个 Vera CPU,这些都是常规操作,影响的也只是 AMD 和 Intel 的 B 端市场。真正让笔者印象深刻的是,NVIDIA 开始进入 Windows PC 系统,联手微软支持 ARM CPU。这件事对未来的影响最为深远。
因为黄仁勋在这两个小时里,同时拆掉了 Windows 生态的三堵旧墙:x86 架构对 PC 芯片的垄断、操作系统 40 年不变的交互范式、以及 “AI 会消灭软件”的流行恐慌。
三堵墙,一场演讲,逐个击破。
01. 第一堵墙:x86 的 40 年护城河RTX Spark 给所有 ARM 芯片厂打了个样
黄仁勋在台上掏出了一块芯片,叫 RTX Spark。

20 核 ARM CPU,联发科联合设计。Blackwell 架构 GPU,6144 个 CUDA 核心。128GB 统一内存。台积电 3nm 工艺,700 亿晶体管。一颗芯片,1 PFLOPS 的 AI 算力。
这些参数的意义浓缩成一句话:这是第一颗能完整运行 NVIDIA CUDA 软件栈的 ARM Windows 芯片。
过去,大量行业软件只支持 x86 架构的 CPU。Autodesk 全家桶(AutoCAD、Inventor)至今无法在 ARM 设备上原生安装,SolidWorks 只支持 x86/x64,MATLAB 和工程仿真软件 ABAQUS 同样如此。专业领域的 CAD、EDA(电子设计自动化)、科学计算、视频编辑,整个专业软件生态都绑在 Intel 和 AMD 的 x86 指令集上。这道护城河守了 40 年。
虽然 Windows 11 的 Prism 模拟层已经能翻译大部分 x86 应用,日常使用中 93% 的应用已有原生 ARM 版本。但涉及内核驱动、反作弊系统、硬件加密狗的专业软件,模拟层无能为力。这也是为什么买了高通 Snapdragon X 笔记本的工程师,经常还得备一台 x86 机器。
现在,黄仁勋要彻底解决这个问题。
RTX Spark 发布当天,微软宣布了搭载该芯片的 Surface Laptop Ultra。Dell、HP、ASUS、Lenovo、MSI 全部跟进,预计秋季上市超过 30 款笔记本和 10 款桌面设备。Adobe 正在为 RTX Spark 重写 Photoshop 和 Premiere Pro 的原生 ARM 版本。
高通联手 Windows 是探路,NVIDIA 这次和 Windows 合作,基本等于盖章认证:未来的 Windows AI PC,ARM 架构才是主流。
这件事对国内芯片厂商意味着什么?
RTX Spark 相当于给所有 ARM CPU 厂商打了个样:联发科的 ARM CPU 技术配合 NVIDIA 的 GPU,照样能跑 Windows 全家桶。其他厂商虽然没法集成 NVIDIA 的 GPU,但好在端侧 AI 推理对 NVIDIA GPU 的依赖度并不高,NPU(神经网络处理单元)就够用了。
国内的此芯科技已经在做这件事。他们的 P1 处理器基于 Arm V9.2 架构,直接瞄准 Windows on Arm 生态,2026 年 3 月刚完成近 10 亿元 B 轮融资。更值得关注的是,此芯科技联合微软、Arm、Linaro 发起了 Project ARP 计划,推动 ARM PC 参考平台的标准化。
瑞芯微的下一代旗舰 RK3688 也在路上。4-5nm 工艺,12 核,16-32 TOPS NPU 算力,虽然主攻 AIoT 场景,但技术路径同样是 ARM。
x86 坐山吃老本的好日子,可能要到头了。
如果 NVIDIA 证明了 ARM 更适合跑个人 AI 操作系统,那么未来的 PC 市场,将出现 ARM 版的新龙头公司,类似现在的 Intel 和 AMD 的地位。
当然,Agent 对 CPU 的确定性需求,已经让 AMD 和 Intel 的股价大涨。但 Agent 适配的操作系统,ARM 还是 x86 会成为主流,犹未可知。英伟达押注的是 ARM。
02. 第二堵墙:操作系统的 40 年范式LLM 是现代版的 DirectX
黄仁勋在演讲中做了一个类比,笔者认为这是整场演讲最有价值的一句话。
他说:40 年前,Windows 做了几件事。系统 BIOS、开放芯片组、驱动程序运行时加载、还有一个多媒体抽象层叫 DirectX。这几件事让 PC 从企业工具变成了个人电脑。
40 年后,操作系统的新一层,是 LLM(大语言模型)。
这个类比值得拆开讲。
DirectX 当年解决了什么问题
1995 年之前,PC 游戏开发是一场噩梦。每张显卡有自己的指令集,每个声卡有自己的驱动协议。开发者要为几十种硬件组合分别写代码。绝大多数游戏开发者因此拒绝 Windows,坚守 DOS,因为 DOS 允许直接访问硬件。
微软的解法是 DirectX:一套统一的 API(应用程序接口),把图形、声音、输入设备全部抽象成标准接口。开发者只需要面对 DirectX,不需要关心底层是什么显卡。
DirectX 不是一个应用程序,它是操作系统的一部分。它把"硬件能力"翻译成了"开发者可以调用的标准能力"。
1996 年 DOOM95 发布,成为第一款 DirectX 游戏。1997 年 id Software 把 Quake II 移植到 Windows。从那以后,PC 游戏再也没有回到 DOS。
LLM 正在扮演同样的角色
今天的 AI 处在一个类似 1995 年的位置。
每个模型有自己的 API 格式、自己的上下文窗口、自己的工具调用协议。开发者要为 Claude、GPT、Gemini、DeepSeek 分别适配。这很像当年每张显卡都有自己指令集的混乱时期。
黄仁勋的判断是:LLM 会成为操作系统的标准层。就像 DirectX 把“图形渲染能力”变成了操作系统的标准能力一样,LLM 会把“理解、推理、规划、工具调用”变成操作系统的标准能力。
说人话就是:未来买电脑,开机就有一个本地模型。它不是你装的一个 APP,而是操作系统自带的基础设施。

这不是预测,已经在发生了。
微软的 Copilot+ PC 要求每台设备内置 NPU 和本地模型。NVIDIA 这次发布的 OpenShell 是一个开源的 Agent 运行时,基于微软新的安全原语构建,给每个 Agent 创建独立沙盒,在系统层面执行隐私和权限策略。Red Hat、Canonical、微软全部接入。
RTX Spark 的 128GB 统一内存,可以本地运行 1200 亿参数的模型,支持 100 万 token 上下文。演讲中那个建筑设计 Agent 的演示,用 Rhino 建模、Blender 渲染、Flux 2 生成效果图,全程跑在本地。
过渡阶段与终局
笔者判断,这个演变会分两步走。
过渡阶段(现在 – 未来 2-3 年):Windows + 本地模型。操作系统还是 Windows,但内置一个本地 LLM 作为底层服务。就像 Windows 内置了 DirectX 一样,未来的 Windows 会内置一个推理引擎。DeepSeek、Gemma、Nemotron 这些开源模型会成为“预装”选项。你依然打开 APP、点击、输入,但 AI 在后台持续辅助。
终局(3-5 年后):全新的 Agent 化操作系统。你不再“启动 Photoshop → 打开文件 → 选择滤镜 → 导出”。你说:“把这张照片修成电影色调,裁成 16:9,加上水印,发到公众号后台。”Agent 自己调用 Photoshop、裁剪工具、上传接口,完成整个链路。
过去 40 年,操作系统管理的是硬件资源:CPU 时间片、内存分配、文件系统。未来,操作系统管理的是 AI 的记忆、工具权限和安全边界。
这对软件公司意味着什么
很多人的直觉是:如果 AI 能直接完成任务,那软件工具还有什么用?
黄仁勋在演讲中反复回应这个问题。他的原话是:“很多人说,Agent 来了,软件公司要倒闭了。我说恰恰相反。因为 Agent 越多,世界就不再受限于人的数量,Agent 会比人类使用更多的工具。”
这个逻辑其实不难理解。DirectX 出现后,游戏公司倒闭了吗?恰恰相反,DirectX 统一了接口,降低了开发门槛,游戏产业因此爆发,从 1995 年的小众市场,成长为今天规模超过电影和音乐总和的娱乐产业。
同样的逻辑,LLM 成为操作系统标准层之后,Agent 需要调用工具来完成任务。工具越标准化、越易于被 Agent 调用,使用量就越大。 Adobe 已经在重写 Photoshop 和 Premiere 的架构,不仅为了适配 ARM,更是为了通过 MCP Server(模型上下文协议服务)让 Agent 能直接调用。
软件工具的价值不会消失,但价值的衡量标准会变。从"人用起来顺不顺手"变成"Agent 调用起来快不快、准不准"。
这是一个巨大的重新洗牌的机会。过去 GUI(图形界面)做得好的软件占优,未来 CLI 和 API 做得好的软件 占优。任何软件厂商,只要能让自己的工具被 Agent 高效调用,都会迎来增长。
03. 第三堵墙:软件产业的增长上限AI 不是来消灭软件的,是来引爆软件的
黄仁勋亮出 GitHub 数据的时候,台下很安静。
2023 年,3 亿次代码提交。2024 年,4 亿次。2025 年,5 亿次。2026 年上半年,14 亿次。
他接着说了一句话:“AI 会减少工作岗位?Complete nonsense。”
这不是客套。他给出了一个很硬的经济学论证:全球约 3000 万软件工程师,创造约 3 万亿美元的 GDP。现在,同样这批人,借助 AI 工具产出了将近 3 倍的代码量。等效于 3 万亿美元的薪资创造了 9 万亿美元的产出。
ROI 翻了三倍,雇主的理性选择不是裁员,而是加码招聘。
这不只是黄仁勋的观点。摩根士丹利的研究报告得出了相同结论:“与市场担忧相反,AI 不会取代开发者,而是会提升生产力并带来更多招聘。”美国劳工统计局预测,2024 到 2034 年软件开发岗位将增长 15%,AI 被明确列为需求驱动因素。
GitHub 的数据只是冰山一角。
OpenRouter 的 token 调用量讲的是同一个故事:2025 年底周处理量约 5 万亿 token,到 2026 年 5 月已飙升至每周 25 万亿 token,半年翻了 5 倍。其中最大的驱动力就是编程类 workload。Agentic 工作流把单次请求的 token 消耗从几千拉到了 10 万甚至 100 万。
软件不是在被 AI 消灭,而是在被 AI 催化出更大的需求。
B 端:Agent 接管重复流程
黄仁勋在演讲中演示了一个案例:NVIDIA 和 Cadence 联合打造的芯片设计 Agent。
传统的芯片验证流程:写 RTL(寄存器传输级)代码、编写测试用例、跑仿真、debug、回归测试。数千名工程师,每年数十亿计算小时,一个验证周期动辄数周。
ChipStack AI Super Agent 接管后:Codex 做编排,Nemotron 模型做推理,自动调用 Cadence 的 Xcelium 仿真器和 JasperGold 形式化验证工具。跑几百次仿真,自动发现 bug,自动修复。
验证周期从 5 周压缩到不到 1 天。40 倍加速。
黄仁勋说,NVIDIA 有数千名芯片设计师,他们打算“雇佣”数十万个 Cadence 超级 Agent 来协同工作。注意用词,不是“替换”工程师,而是给每个工程师配几十个 AI 同事。
这个模式会扩展到每一个有复杂流程的 B 端行业。CrowdStrike 用 Agent 做安全运维,ServiceNow 用 Agent 做 IT 服务管理,SAP 用 Agent 做企业资源规划。每一个企业软件公司都会成为 Agent 公司。
C 端:个性化软件的爆发
B 端是流程自动化提效,C 端的变化方向不同,它在创造全新需求。
当一个人可以用自然语言描述需求,Agent 自动生成代码、调用工具、输出结果,“做软件”的门槛降到了接近零。黄仁勋在演讲中演示的那些例子就是证据:一段 prompt 生成一个 GIF 动画,一张照片生成一个 3D 打印文件,一段描述生成一栋房子的建筑设计方案。
“如果 1 块钱做个 APP 的时代到来,那么整个世界的商业体系会发生什么变化?”
答案是:软件的总量会爆炸。不是更少的人写更少的软件,而是更多的人(甚至非程序员)创造更多的软件。全自动化生产线需要定制软件,个体商户需要定制软件,每个人的工作流都可能需要一个只属于自己的工具。
经济学上有个概念叫 Jevons 悖论,当某种生产要素变得更高效、更便宜时,总消耗量不会减少,反而会增加。蒸汽机效率提高后,煤炭消耗反而增长了。ATM 普及后,银行柜员反而变多了。AI 让软件开发变便宜之后,软件的总量只会更多。
3 万亿美元的程序员薪资,现在产出了 9 万亿美元的价值。这不是效率提升的故事,这是一个全新产业规模的诞生。
last. 三堵墙倒了,然后呢旧护城河拆掉的地方,新机会就在那里
黄仁勋用两个小时拆了三堵墙,但他其实只做了一件事:把旧世界的封闭环节逐一打开。
x86 垄断了 PC CPU 40 年,先有 Mac 倒戈 ARM,现在英伟达又带着 Windows 迈向 ARM 阵营。操作系统的图形交互 40 年没变过,现在 LLM 和 Agent 正在塑造新的对话交互逻辑。“AI 消灭软件”的恐慌流传了半年,GitHub 用数据证明软件产业不仅没有萎缩,反而进入了历史上最大的扩张期。
三个判断,留给各位参考:
一,ARM 芯片进入桌面市场不可逆。 关注国产 ARM 芯片在政企、教育市场的落地窗口。
二,未来的操作系统,可能不再是 Windows 和 macOS 这样的复杂图形界面。 操作过程会大幅简化,图形界面的重心会从“操作流程”转向“输入和输出”。从软件到操作系统,中美两国都有机会。现在相当于 80 年代初,Windows 和 Mac 的图形界面还没诞生的时期。
三,软件服务的逻辑变了。 以前是做一个功能强大、交互复杂的软件,用户再花大量时间学习怎么用。未来是软件把工作流做好,甚至把上游数据输入的 API、下游对接的厂商都串通,用户只需要购买服务、描述需求,就能把整条工作链跑起来。无需额外的学习成本,付钱就能得到更好的结果。
上一个 40 年,Windows 和 Mac 定义了个人电脑。下一个 40 年的操作系统,还没有名字。