Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。


Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。
Google发布了Gemini 3.5 Live Translate,把实时同传从"等你说完再翻"推进到"边听边说"。支持70多种语言实时互译,延迟仅几秒,还能保留你的语速和语调。
传统翻译工具的工作方式像对讲机:你说完一句,它憋着等你说完,再翻给对方。一来一回,节奏全断。
Gemini 3.5 Live Translate改变了这个模式。它边听边译,话音未落,译音先到。模型在"多等一会儿翻得更准"和"立刻开口跟住说话人"之间逐字逐句地拿捏,最终输出连贯、没有卡顿,全程只落后说话人几秒。

该模型基于Gemini 3 Pro打造,能处理最长128K token的音频上下文,评测重点盯着三个指标:翻译质量、延迟、语音自然度。
三条产品线同时铺开,覆盖不同用户群体:
Google Translate的安卓和iOS版已全球上线。
打开App左下角的"实时翻译",接上任意一副耳机就能用。安卓还有个"聆听模式":把手机像打电话一样贴到耳边,译音直接从听筒里钻进来,旁人听不到。

本月起Google Meet进入私测阶段。以前只支持5种语言,现在一口气干到70+,单场会议能撑起2000多种语言组合。
通过Gemini Live API和Google AI Studio公测,今天就能上手。Agora、Fishjam、LiveKit等平台已经接入,把实时媒体流的基础设施全包圆了。

语音翻译是Google跑得最久的机器学习项目之一,而这一次,它终于跑进了耳机。 -- Jeff Dean, Google DeepMind首席科学家
目前只接受音频输入。遇到重口音、快速来回切语言、好几个人抢着说、或者长时间停顿,声音复刻还可能不稳。
东南亚打车平台Grab已经在试用。司机说本地话,乘客听到的是自己的母语。Grab用户每月要打超过1000万次语音电话,这不是发布会Demo,是真实业务场景。
适合你的场景:跨语言会议、海外旅行沟通、多语客服、在线课堂、视频配音、多语直播。

月之暗面发布并开源Kimi K2.7 Code编程模型,1.1万亿参数、256K上下文,长程任务过度思考问题大幅改善,高速版6倍速度2倍价格。

美团旗下GN06团队发布AI浏览器Tabbit 1.0,基础功能永久免费,专业版9.9元/周,支持多模型同时运行、脚本妙招和Agent任务管理。

一招搞定Codex和Claude Code双持:左边GPT规划,右边Claude干活,互为fallback,两家的拒答边界互不干扰。