NVIDIA RTX Spark：英伟达重新定义AI PC，128G统一内存本地跑120B模型

在 NVIDIA GTC Taipei 2026 上，英伟达发布了 RTX Spark -- 一款让 Windows PC 首次具备统一内存架构的消费级 AI 芯片。它意味着你可以在一台 14mm 厚的笔记本上，本地运行 120B 参数的大模型。

英伟达称这是"个人电脑诞生 40 年以来的一次重新定义"。

RTX Spark 芯片

RTX Spark 芯片实物

RTX Spark 是什么

RTX Spark 源自去年面向开发者的 DGX Spark，这次被正式升级为英伟达全新的消费级产品线。底层采用与 DGX Spark 相同的 GB10 芯片，核心参数：

AI 算力：最高 1 PFLOP（FP4 精度）
CPU 核心：20 个
GPU 核心：6144 个
统一内存：128GB LPDDR5X

RTX Spark 参数

旗舰版参数：1 PFLOP AI性能，128GB统一内存

为什么统一内存对跑大模型至关重要

传统 PC 的内存困境

传统 PC 的 CPU 有自己的系统内存（RAM），GPU 有自己的显存（VRAM），两者通过 PCIe 通道连接。问题是：

GPU 读自己的显存，带宽约 1 TB/s
PCIe 通道带宽只有约 32 GB/s，差了 30 倍

当你想在本地跑一个量化后的 70B 模型（需要几十 GB 内存）时，即使你的系统内存有 64GB，GPU 真正能高速使用的只有 16GB 显存。模型太大就要频繁通过 PCIe 搬运数据，速度严重受限。

统一内存：CPU和GPU共享同一个内存池，消除数据搬运瓶颈

统一内存的解法

RTX Spark 把 CPU 和 GPU 的内存变成一个 128GB 的共享池。GPU 可以直接使用这个大池子里的绝大部分容量，不再被传统显卡 16GB、24GB、32GB 显存限制。

这意味着你可以直接在本地跑 120B 参数的大模型，不需要云端推理，延迟极低，数据完全本地化。

为什么不直接买 Mac

Mac 确实也有 128GB 统一内存的版本，但 RTX Spark 有一个 Mac 无法替代的杀手锏：CUDA 生态。

CUDA 不只是显卡驱动，它是一整套经过近 20 年积累的 GPU 计算生态。绝大多数 AI 框架、推理引擎、训练工具都是基于 CUDA 开发的。在 Mac 上跑这些工具，兼容性和性能都要打折扣。

RTX Spark = 统一内存 + 完整 CUDA 生态，这在消费级设备上是第一次。

合作硬件形态

英伟达展示了多家合作厂商基于 RTX Spark 打造的设备：

超薄笔记本

厚度仅 14mm
未插电状态下可渲染 90GB 的 3D 场景
可编辑 12K 分辨率视频

RTX Spark 合作设备

搭载RTX Spark的超薄笔记本和迷你主机

迷你主机

类似 Mac Mini 的小型盒子
功耗低，适合作为家庭 AI 服务器

Windows 的 AI 原生支持

微软将与英伟达合作全面重构 Windows 系统，让搭载 RTX Spark 的电脑原生支持本地 Agent 运行。这意味着：

Agent 可以直接调用本地 GPU 算力
不需要联网就能执行复杂 AI 任务
数据和隐私完全在本地保护

应用场景

本地大模型推理：在笔记本上直接运行 120B 模型，无需云端 API
本地模型微调：利用 128GB 统一内存对模型进行个性化微调
3D 渲染和视频编辑：90GB 3D 场景渲染、12K 视频编辑
隐私敏感场景：医疗、金融、法律等领域的数据不出本地
开发测试：在本地快速迭代 Agent 应用，不依赖云服务

预计影响

RTX Spark 的发布大概率会带来几个变化：

Windows 换机潮：搭载 RTX Spark 的设备预计 2027 年上市，可能引发大规模换机
本地 AI 普及：大模型不再只能跑在云端，普通开发者也能在本地部署和调试
Mac vs Windows 新竞争：Windows 阵营首次在 AI 本地推理能力上有了与 Mac 对抗的硬件基础
CUDA 生态进一步巩固：统一内存 + CUDA 的组合，让英伟达在消费级 AI 硬件上的护城河更深

常见问题

Q：什么时候能买到？ A：合作厂商的设备预计 2027 年陆续上市，具体时间待厂商公布。

Q：价格大概多少？ A：目前官方未公布 RTX Spark 芯片的单独售价，但参考 DGX Spark 的定位，搭载设备预计在高端轻薄本价位段。

Q：能跑哪些模型？ A：128GB 统一内存可以直接跑 120B 参数的模型，通过量化还可以跑更大的模型。主流开源模型如 Llama、Qwen、DeepSeek 系列都可以本地运行。

Q：需要联网吗？ A：本地推理和微调不需要联网。只有在下载模型和同步数据时需要网络。