英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代


英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代
在 NVIDIA GTC Taipei 2026 上,英伟达发布了 RTX Spark -- 一款让 Windows PC 首次具备统一内存架构的消费级 AI 芯片。它意味着你可以在一台 14mm 厚的笔记本上,本地运行 120B 参数的大模型。
英伟达称这是"个人电脑诞生 40 年以来的一次重新定义"。

RTX Spark 芯片实物
RTX Spark 源自去年面向开发者的 DGX Spark,这次被正式升级为英伟达全新的消费级产品线。底层采用与 DGX Spark 相同的 GB10 芯片,核心参数:

旗舰版参数:1 PFLOP AI性能,128GB统一内存
传统 PC 的 CPU 有自己的系统内存(RAM),GPU 有自己的显存(VRAM),两者通过 PCIe 通道连接。问题是:
当你想在本地跑一个量化后的 70B 模型(需要几十 GB 内存)时,即使你的系统内存有 64GB,GPU 真正能高速使用的只有 16GB 显存。模型太大就要频繁通过 PCIe 搬运数据,速度严重受限。
统一内存:CPU和GPU共享同一个内存池,消除数据搬运瓶颈
RTX Spark 把 CPU 和 GPU 的内存变成一个 128GB 的共享池。GPU 可以直接使用这个大池子里的绝大部分容量,不再被传统显卡 16GB、24GB、32GB 显存限制。
这意味着你可以直接在本地跑 120B 参数的大模型,不需要云端推理,延迟极低,数据完全本地化。
Mac 确实也有 128GB 统一内存的版本,但 RTX Spark 有一个 Mac 无法替代的杀手锏:CUDA 生态。
CUDA 不只是显卡驱动,它是一整套经过近 20 年积累的 GPU 计算生态。绝大多数 AI 框架、推理引擎、训练工具都是基于 CUDA 开发的。在 Mac 上跑这些工具,兼容性和性能都要打折扣。
RTX Spark = 统一内存 + 完整 CUDA 生态,这在消费级设备上是第一次。
英伟达展示了多家合作厂商基于 RTX Spark 打造的设备:
超薄笔记本

搭载RTX Spark的超薄笔记本和迷你主机
迷你主机
微软将与英伟达合作全面重构 Windows 系统,让搭载 RTX Spark 的电脑原生支持本地 Agent 运行。这意味着:
RTX Spark 的发布大概率会带来几个变化:
Q:什么时候能买到? A:合作厂商的设备预计 2027 年陆续上市,具体时间待厂商公布。
Q:价格大概多少? A:目前官方未公布 RTX Spark 芯片的单独售价,但参考 DGX Spark 的定位,搭载设备预计在高端轻薄本价位段。
Q:能跑哪些模型? A:128GB 统一内存可以直接跑 120B 参数的模型,通过量化还可以跑更大的模型。主流开源模型如 Llama、Qwen、DeepSeek 系列都可以本地运行。
Q:需要联网吗? A:本地推理和微调不需要联网。只有在下载模型和同步数据时需要网络。

NVIDIA联合清华开源多智能体世界模型,双人训练直接泛化到四人,支持零样本多人场景实时推演

阶跃星辰发布Step 3.7 Flash,400 tokens/秒推理速度,11B激活参数实现Claude Opus 4.6的97%性能,开源可本地部署

全球AI Lab排名第9的Agnes AI宣布无限期免费开放文本、图片、视频三款核心模型API,开发者零成本调用全模态能力