toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,194个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型

2026/06/01
·toolin小编

英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代

NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型
NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型
2026/06/01

NVIDIA RTX Spark:英伟达重新定义AI PC,128G统一内存本地跑120B模型

英伟达发布RTX Spark消费级AI芯片,128GB统一内存、1 PFLOP算力,可在14mm笔记本上本地运行120B大模型,Windows生态迎来AI PC时代

RTX Spark 是什么为什么统一内存对跑大模型至关重要传统 PC 的内存困境统一内存的解法为什么不直接买 Mac合作硬件形态Windows 的 AI 原生支持应用场景预计影响常见问题
AI产品

在 NVIDIA GTC Taipei 2026 上,英伟达发布了 RTX Spark -- 一款让 Windows PC 首次具备统一内存架构的消费级 AI 芯片。它意味着你可以在一台 14mm 厚的笔记本上,本地运行 120B 参数的大模型。

英伟达称这是"个人电脑诞生 40 年以来的一次重新定义"。

RTX Spark 芯片

RTX Spark 芯片实物

RTX Spark 是什么

RTX Spark 源自去年面向开发者的 DGX Spark,这次被正式升级为英伟达全新的消费级产品线。底层采用与 DGX Spark 相同的 GB10 芯片,核心参数:

  • AI 算力:最高 1 PFLOP(FP4 精度)
  • CPU 核心:20 个
  • GPU 核心:6144 个
  • 统一内存:128GB LPDDR5X

RTX Spark 参数

旗舰版参数:1 PFLOP AI性能,128GB统一内存

为什么统一内存对跑大模型至关重要

传统 PC 的内存困境

传统 PC 的 CPU 有自己的系统内存(RAM),GPU 有自己的显存(VRAM),两者通过 PCIe 通道连接。问题是:

  • GPU 读自己的显存,带宽约 1 TB/s
  • PCIe 通道带宽只有约 32 GB/s,差了 30 倍

当你想在本地跑一个量化后的 70B 模型(需要几十 GB 内存)时,即使你的系统内存有 64GB,GPU 真正能高速使用的只有 16GB 显存。模型太大就要频繁通过 PCIe 搬运数据,速度严重受限。

统一内存:CPU和GPU共享同一个内存池,消除数据搬运瓶颈

统一内存的解法

RTX Spark 把 CPU 和 GPU 的内存变成一个 128GB 的共享池。GPU 可以直接使用这个大池子里的绝大部分容量,不再被传统显卡 16GB、24GB、32GB 显存限制。

这意味着你可以直接在本地跑 120B 参数的大模型,不需要云端推理,延迟极低,数据完全本地化。

为什么不直接买 Mac

Mac 确实也有 128GB 统一内存的版本,但 RTX Spark 有一个 Mac 无法替代的杀手锏:CUDA 生态。

CUDA 不只是显卡驱动,它是一整套经过近 20 年积累的 GPU 计算生态。绝大多数 AI 框架、推理引擎、训练工具都是基于 CUDA 开发的。在 Mac 上跑这些工具,兼容性和性能都要打折扣。

RTX Spark = 统一内存 + 完整 CUDA 生态,这在消费级设备上是第一次。

合作硬件形态

英伟达展示了多家合作厂商基于 RTX Spark 打造的设备:

超薄笔记本

  • 厚度仅 14mm
  • 未插电状态下可渲染 90GB 的 3D 场景
  • 可编辑 12K 分辨率视频

RTX Spark 合作设备

搭载RTX Spark的超薄笔记本和迷你主机

迷你主机

  • 类似 Mac Mini 的小型盒子
  • 功耗低,适合作为家庭 AI 服务器

Windows 的 AI 原生支持

微软将与英伟达合作全面重构 Windows 系统,让搭载 RTX Spark 的电脑原生支持本地 Agent 运行。这意味着:

  • Agent 可以直接调用本地 GPU 算力
  • 不需要联网就能执行复杂 AI 任务
  • 数据和隐私完全在本地保护

应用场景

  • 本地大模型推理:在笔记本上直接运行 120B 模型,无需云端 API
  • 本地模型微调:利用 128GB 统一内存对模型进行个性化微调
  • 3D 渲染和视频编辑:90GB 3D 场景渲染、12K 视频编辑
  • 隐私敏感场景:医疗、金融、法律等领域的数据不出本地
  • 开发测试:在本地快速迭代 Agent 应用,不依赖云服务

预计影响

RTX Spark 的发布大概率会带来几个变化:

  1. Windows 换机潮:搭载 RTX Spark 的设备预计 2027 年上市,可能引发大规模换机
  2. 本地 AI 普及:大模型不再只能跑在云端,普通开发者也能在本地部署和调试
  3. Mac vs Windows 新竞争:Windows 阵营首次在 AI 本地推理能力上有了与 Mac 对抗的硬件基础
  4. CUDA 生态进一步巩固:统一内存 + CUDA 的组合,让英伟达在消费级 AI 硬件上的护城河更深

常见问题

Q:什么时候能买到? A:合作厂商的设备预计 2027 年陆续上市,具体时间待厂商公布。

Q:价格大概多少? A:目前官方未公布 RTX Spark 芯片的单独售价,但参考 DGX Spark 的定位,搭载设备预计在高端轻薄本价位段。

Q:能跑哪些模型? A:128GB 统一内存可以直接跑 120B 参数的模型,通过量化还可以跑更大的模型。主流开源模型如 Llama、Qwen、DeepSeek 系列都可以本地运行。

Q:需要联网吗? A:本地推理和微调不需要联网。只有在下载模型和同步数据时需要网络。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
RTX Spark 是什么为什么统一内存对跑大模型至关重要传统 PC 的内存困境统一内存的解法为什么不直接买 Mac合作硬件形态Windows 的 AI 原生支持应用场景预计影响常见问题

相关文章

Gamma-World:开源多智能体世界模型
AI产品

Gamma-World:开源多智能体世界模型

NVIDIA联合清华开源多智能体世界模型,双人训练直接泛化到四人,支持零样本多人场景实时推演

avatar for toolin小编
toolin小编
2天前
Step 3.7 Flash实测:400TPS极速推理,Agent任务成本仅为Claude的1/9
AI产品

Step 3.7 Flash实测:400TPS极速推理,Agent任务成本仅为Claude的1/9

阶跃星辰发布Step 3.7 Flash,400 tokens/秒推理速度,11B激活参数实现Claude Opus 4.6的97%性能,开源可本地部署

avatar for toolin小编
toolin小编
1天前
Agnes AI 全模态API免费开放:文本+图片+视频一站式调用
AI产品

Agnes AI 全模态API免费开放:文本+图片+视频一站式调用

全球AI Lab排名第9的Agnes AI宣布无限期免费开放文本、图片、视频三款核心模型API,开发者零成本调用全模态能力

avatar for toolin小编
toolin小编
1天前