谷歌Gemini 3.2 Flash静默上线,编码能力飙升:单次生成2200行Three.js项目、手搓Windows 98,Flash级模型超越自家旗舰Pro。


谷歌Gemini 3.2 Flash静默上线,编码能力飙升:单次生成2200行Three.js项目、手搓Windows 98,Flash级模型超越自家旗舰Pro。
谷歌I/O大会还没开,Gemini 3.2 Flash就被开发者抓了个正着。这个"Flash"级别的轻量模型,在编码能力上直接超越了自家旗舰Pro——单次提示生成2200行代码、手搓可交互的Windows 98,把过去400-500行的输出天花板捅了个窟窿。
在Gemini网页端选择 Fast模式 + Canvas,就有概率命中Gemini 3.2 Flash。也有开发者发现,选择Thinking+Canvas模式同样能触发。
最先发现异常的是一个Reddit网友:Gemini Canvas上生成的代码风格,和Google AI Studio里同一个模型跑出来的结果完全不同。前者输出了大量高质量UI设计SVG,后者还是朴素风格。同一个prompt,两种结果——后台在偷偷换模型。
Google Cloud Console后端也暴露了端倪:一个名为 gemini-3.2-flash-lite-live-preview 的模型条目赫然出现。

在物理模拟测试中,Gemini 3.2 Flash展现出强悍的编码实力:气球透明光影、撞击反馈、水花粒子特效,单次提示就全部拉满。
最让人惊叹的是,仅凭一个简单的提示,Gemini 3.2 Flash就能生成2200行代码。过去的Flash模型输出很难突破400-500行,现在轻松破千。一个Flash级别的模型,在创意编程任务上把自家旗舰Pro按在地上摩擦。
有人在LM Arena上盲测3.2 Pro版本,徒手搓出了一个原汁原味的Windows 98。拖拽、缩放窗口只是基本操作,里面内置了一个真能联网的浏览器。工具菜单里的经典游戏、计算器、画图、Word、记事本全部支持真实交互。像素级还原的任务栏和启动登录体验,代码完备度极高。
Gemini 3.2 Flash的表现来自谷歌DeepMind的模型蒸馏与稀疏化技术。他们把LLM的精髓压缩至轻量化版本,打破了"模型变小、性能雪崩"的行业魔咒。
业内有传言:基准测试表明,Gemini 3.2 Flash在核心代码与推理任务上,已逼近GPT-5.5约92%的性能。推理成本骤降15-20倍,多数查询的响应延迟压缩至200毫秒以内。
在Gemini应用端,还灰度上线了"思考层级"功能,允许用户选择不同的推理深度。这意味着你可以根据任务复杂度来决定让模型"想多深"。
Gemini App正在全面铺开第三方应用集成:
已接入GitHub、OpenStax、Spotify、WhatsApp,Canva、Instacart、OpenTable即将上线。
除了Gemini 3.2 Flash,谷歌I/O大会即将公布的产品线包括:
OpenAI正在筹备GPT-5.6,Anthropic下一代模型蓄势待发。Gemini 3.2 Flash的泄露表明谷歌在"模型蒸馏"路线上取得了实质性进展——用更低的成本提供接近旗舰的性能。对开发者来说,这意味着更便宜的API调用、更快的响应速度、更长的上下文窗口。
在Gemini网页端(gemini.google.com)选择Fast模式+Canvas即可触发。Google AI Studio和Cloud Console也将陆续开放API访问。