谷歌发布 Gemini 3.5 Flash,编程和 Agent 能力全面超越 3.1 Pro,输出速度是其他前沿模型 4 倍,成本仅为 Claude Sonnet 六折。


谷歌发布 Gemini 3.5 Flash,编程和 Agent 能力全面超越 3.1 Pro,输出速度是其他前沿模型 4 倍,成本仅为 Claude Sonnet 六折。
谷歌在 I/O 2026 大会上发布了 Gemini 3.5 Flash,这是一款主打编程和 Agent 能力的新模型。它不仅超越了自家上一代旗舰 3.1 Pro,还在速度和成本上给出了极具竞争力的数据。如果你在做 AI 编程或构建 Agent 工作流,这个模型值得重点关注。
Gemini 3.5 Flash 的定位是"轻量高速版",但这次直接把上一代旗舰 3.1 Pro 超了。关键数据如下:

Google CEO Sundar Pichai 特别强调了 GDPval 基准的提升,该基准衡量的是"具有真实经济价值的任务",意味着模型在实际工作场景中的表现有了质的飞跃。
速度方面,3.5 Flash 的输出速度达到每秒 289 token,是其他前沿模型的 4 倍。在 Antigravity 2.0 中经过专门优化后,速度甚至可以达到 12 倍。

价格对比(每百万 token):
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 |
| Gemini 3.1 Pro(上代旗舰) | $2.00 | $12.00 |
| Claude Sonnet 4.6 | $3.00 | $15.00 |
输出成本仅为 Claude Sonnet 的六折。Pichai 还算了一笔大账:头部企业如果将 80% 的负载从其他前沿模型迁移到 3.5 Flash,每年可节省超过 10 亿美元。

与 3.5 Flash 同步发布的 Antigravity 2.0,是谷歌对 Claude Code 和 Codex 的正面回应。它从"编程环境"升级为"多 Agent 编排平台",提供三层使用方式:
1. 独立桌面应用:图形界面,可以同时编排多个 Agent 并行工作 -- 一个写网站代码,一个生成品牌素材,第三个规划产品架构。
2. Antigravity CLI:命令行接口,给偏好终端操作的开发者。
3. Antigravity SDK:把 Google 内部产品使用的同一套 Agent Harness 以 SDK 形式开放,让开发者部署在自己的基础设施上。

Antigravity 2.0 的核心能力包括:
Google 在现场演示了一个极端案例:用 93 个子 Agent 并行工作 12 小时,从零构建了一个能运行的操作系统内核,总成本不到 1000 美元 API credits。

Gemini 3.5 Flash 今日已全面开放,覆盖以下渠道:
Antigravity 2.0 作为独立桌面应用也已面向全球用户开放。
注意:更强大的 Gemini 3.5 Pro 预计下月推出,目前仍在内部打磨中。

腾讯内测AI桌面助手Marvis,支持自然语言操控文件管理、系统设置、跨端操作,提供隐私模式完全本地运行。

Claude Mythos Preview 帮助 Firefox 团队一个月修复 423 个安全漏洞,含 180 个高危漏洞和多个沙箱逃逸,含藏了 20 年的老 Bug。

谷歌发布 Gemini Spark,一款运行在云端的个人 AI Agent,关掉电脑也能继续执行任务,已接入 Gmail、Docs、Calendar 等全家桶。