Gemini 3.5 Flash：速度提升4倍，代码能力超越上代旗舰

谷歌在 I/O 2026 大会上发布了 Gemini 3.5 Flash，这是一款主打编程和 Agent 能力的新模型。它不仅超越了自家上一代旗舰 3.1 Pro，还在速度和成本上给出了极具竞争力的数据。如果你在做 AI 编程或构建 Agent 工作流，这个模型值得重点关注。

核心基准测试：超越上代旗舰

Gemini 3.5 Flash 的定位是"轻量高速版"，但这次直接把上一代旗舰 3.1 Pro 超了。关键数据如下：

代码（Terminal-Bench 2.1）：76.2%
Agent 任务（GDPval-AA）：1656 Elo
工具调用（MCP Atlas）：83.6%
多模态理解（MMMU Pro）：81.2%，全球第一
CharXiv Reasoning：84.2%

Gemini 3.5 Flash 基准测试成绩

Google CEO Sundar Pichai 特别强调了 GDPval 基准的提升，该基准衡量的是"具有真实经济价值的任务"，意味着模型在实际工作场景中的表现有了质的飞跃。

速度与价格：性价比的算账

速度方面，3.5 Flash 的输出速度达到每秒 289 token，是其他前沿模型的 4 倍。在 Antigravity 2.0 中经过专门优化后，速度甚至可以达到 12 倍。

Gemini 3.5 Flash 速度对比

价格对比（每百万 token）：

模型	输入价格	输出价格
Gemini 3.5 Flash	$1.50	$9.00
Gemini 3.1 Pro（上代旗舰）	$2.00	$12.00
Claude Sonnet 4.6	$3.00	$15.00

输出成本仅为 Claude Sonnet 的六折。Pichai 还算了一笔大账：头部企业如果将 80% 的负载从其他前沿模型迁移到 3.5 Flash，每年可节省超过 10 亿美元。

性价比分析

Antigravity 2.0：谷歌版 Claude Code

与 3.5 Flash 同步发布的 Antigravity 2.0，是谷歌对 Claude Code 和 Codex 的正面回应。它从"编程环境"升级为"多 Agent 编排平台"，提供三层使用方式：

1. 独立桌面应用：图形界面，可以同时编排多个 Agent 并行工作 -- 一个写网站代码，一个生成品牌素材，第三个规划产品架构。

2. Antigravity CLI：命令行接口，给偏好终端操作的开发者。

3. Antigravity SDK：把 Google 内部产品使用的同一套 Agent Harness 以 SDK 形式开放，让开发者部署在自己的基础设施上。

Antigravity 2.0 三种使用方式

Antigravity 2.0 的核心能力包括：

Dynamic Subagents：派生子 Agent 并行执行任务
Scheduled Tasks：后台定时自动化
AgentKit 2.0 SDK：自定义 Agent 行为，部署到第三方基础设施

Google 在现场演示了一个极端案例：用 93 个子 Agent 并行工作 12 小时，从零构建了一个能运行的操作系统内核，总成本不到 1000 美元 API credits。

Antigravity 2.0 桌面应用界面

怎么用

Gemini 3.5 Flash 今日已全面开放，覆盖以下渠道：

Gemini App：直接在对话中使用
Google AI Studio：开发者调试和测试
API：通过 Vertex AI 和 Google AI API 调用
Google Search：AI Mode 默认模型已切换为 3.5 Flash

Antigravity 2.0 作为独立桌面应用也已面向全球用户开放。

注意：更强大的 Gemini 3.5 Pro 预计下月推出，目前仍在内部打磨中。

适用场景

AI 编程：需要快速、低成本代码生成的开发者
Agent 开发：构建多 Agent 协同工作流的团队
企业迁移：正在使用其他前沿模型且成本压力大的企业
多模态任务：需要同时处理文本、图像、视频的任务

核心基准测试：超越上代旗舰

Gemini 3.5 Flash 的定位是"轻量高速版"，但这次直接把上一代旗舰 3.1 Pro 超了。关键数据如下：

代码（Terminal-Bench 2.1）：76.2%
Agent 任务（GDPval-AA）：1656 Elo
工具调用（MCP Atlas）：83.6%
多模态理解（MMMU Pro）：81.2%，全球第一
CharXiv Reasoning：84.2%

Gemini 3.5 Flash 基准测试成绩

Google CEO Sundar Pichai 特别强调了 GDPval 基准的提升，该基准衡量的是"具有真实经济价值的任务"，意味着模型在实际工作场景中的表现有了质的飞跃。

速度与价格：性价比的算账

速度方面，3.5 Flash 的输出速度达到每秒 289 token，是其他前沿模型的 4 倍。在 Antigravity 2.0 中经过专门优化后，速度甚至可以达到 12 倍。

Gemini 3.5 Flash 速度对比

价格对比（每百万 token）：

模型	输入价格	输出价格
Gemini 3.5 Flash	$1.50	$9.00
Gemini 3.1 Pro（上代旗舰）	$2.00	$12.00
Claude Sonnet 4.6	$3.00	$15.00

输出成本仅为 Claude Sonnet 的六折。Pichai 还算了一笔大账：头部企业如果将 80% 的负载从其他前沿模型迁移到 3.5 Flash，每年可节省超过 10 亿美元。

性价比分析

Antigravity 2.0：谷歌版 Claude Code

与 3.5 Flash 同步发布的 Antigravity 2.0，是谷歌对 Claude Code 和 Codex 的正面回应。它从"编程环境"升级为"多 Agent 编排平台"，提供三层使用方式：

1. 独立桌面应用：图形界面，可以同时编排多个 Agent 并行工作 -- 一个写网站代码，一个生成品牌素材，第三个规划产品架构。

2. Antigravity CLI：命令行接口，给偏好终端操作的开发者。

3. Antigravity SDK：把 Google 内部产品使用的同一套 Agent Harness 以 SDK 形式开放，让开发者部署在自己的基础设施上。

Antigravity 2.0 三种使用方式

Antigravity 2.0 的核心能力包括：

Dynamic Subagents：派生子 Agent 并行执行任务
Scheduled Tasks：后台定时自动化
AgentKit 2.0 SDK：自定义 Agent 行为，部署到第三方基础设施

Google 在现场演示了一个极端案例：用 93 个子 Agent 并行工作 12 小时，从零构建了一个能运行的操作系统内核，总成本不到 1000 美元 API credits。

Antigravity 2.0 桌面应用界面

怎么用

Gemini 3.5 Flash 今日已全面开放，覆盖以下渠道：

Gemini App：直接在对话中使用
Google AI Studio：开发者调试和测试
API：通过 Vertex AI 和 Google AI API 调用
Google Search：AI Mode 默认模型已切换为 3.5 Flash

Antigravity 2.0 作为独立桌面应用也已面向全球用户开放。

注意：更强大的 Gemini 3.5 Pro 预计下月推出，目前仍在内部打磨中。

适用场景

AI 编程：需要快速、低成本代码生成的开发者
Agent 开发：构建多 Agent 协同工作流的团队
企业迁移：正在使用其他前沿模型且成本压力大的企业
多模态任务：需要同时处理文本、图像、视频的任务

全部

AI教程

AI产品

AI资源

Gemini 3.5 Flash：速度提升4倍，代码能力超越上代旗舰

Gemini 3.5 Flash：速度提升4倍，代码能力超越上代旗舰

核心基准测试：超越上代旗舰

速度与价格：性价比的算账

Antigravity 2.0：谷歌版 Claude Code

怎么用

适用场景

作者

分类

相关文章

Codex 开源模式：一行配置接入本地模型

Codex 三种电脑操作模式使用指南

Claude Science：科研界的 Claude Code，附免费开源平替

Gemini 3.5 Flash：速度提升4倍，代码能力超越上代旗舰

Gemini 3.5 Flash：速度提升4倍，代码能力超越上代旗舰

核心基准测试：超越上代旗舰

速度与价格：性价比的算账

Antigravity 2.0：谷歌版 Claude Code

怎么用

适用场景

作者

分类

相关文章

Codex 开源模式：一行配置接入本地模型

Codex 三种电脑操作模式使用指南

Claude Science：科研界的 Claude Code，附免费开源平替