toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,273个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

谷歌Gemini实时翻译:70+语言边听边译

2026/06/12
·toolin小编

Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。

谷歌Gemini实时翻译:70+语言边听边译
谷歌Gemini实时翻译:70+语言边听边译
2026/06/12

谷歌Gemini实时翻译:70+语言边听边译

Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。

Gemini 3.5 Live Translate 是什么核心能力怎么用普通用户:Google Translate企业用户:Google Meet开发者:Gemini Live API已知限制实际场景获取方式
AI产品

Google发布了Gemini 3.5 Live Translate,把实时同传从"等你说完再翻"推进到"边听边说"。支持70多种语言实时互译,延迟仅几秒,还能保留你的语速和语调。

Gemini 3.5 Live Translate 是什么

传统翻译工具的工作方式像对讲机:你说完一句,它憋着等你说完,再翻给对方。一来一回,节奏全断。

Gemini 3.5 Live Translate改变了这个模式。它边听边译,话音未落,译音先到。模型在"多等一会儿翻得更准"和"立刻开口跟住说话人"之间逐字逐句地拿捏,最终输出连贯、没有卡顿,全程只落后说话人几秒。

核心能力

  • 边听边译:不再等你说完才开始翻译,实时输出译文
  • 保留语音特征:翻译后的声音保留你的语速、音高和语调,不是冷冰冰的机器音
  • 70+语言支持:全自动识别,中途换语言也能跟上
  • 抗噪能力:菜市场、机场、马路边都能用

Gemini 3.5 Live Translate演示

该模型基于Gemini 3 Pro打造,能处理最长128K token的音频上下文,评测重点盯着三个指标:翻译质量、延迟、语音自然度。

怎么用

三条产品线同时铺开,覆盖不同用户群体:

普通用户:Google Translate

Google Translate的安卓和iOS版已全球上线。

打开App左下角的"实时翻译",接上任意一副耳机就能用。安卓还有个"聆听模式":把手机像打电话一样贴到耳边,译音直接从听筒里钻进来,旁人听不到。

Google Translate实时翻译界面

企业用户:Google Meet

本月起Google Meet进入私测阶段。以前只支持5种语言,现在一口气干到70+,单场会议能撑起2000多种语言组合。

开发者:Gemini Live API

通过Gemini Live API和Google AI Studio公测,今天就能上手。Agora、Fishjam、LiveKit等平台已经接入,把实时媒体流的基础设施全包圆了。

开发者接入方式

语音翻译是Google跑得最久的机器学习项目之一,而这一次,它终于跑进了耳机。 -- Jeff Dean, Google DeepMind首席科学家

已知限制

目前只接受音频输入。遇到重口音、快速来回切语言、好几个人抢着说、或者长时间停顿,声音复刻还可能不稳。

实际场景

东南亚打车平台Grab已经在试用。司机说本地话,乘客听到的是自己的母语。Grab用户每月要打超过1000万次语音电话,这不是发布会Demo,是真实业务场景。

适合你的场景:跨语言会议、海外旅行沟通、多语客服、在线课堂、视频配音、多语直播。

获取方式

  • Google Translate:安卓/iOS App,左下角"实时翻译"
  • Google Meet:本月私测
  • Gemini Live API:Google AI Studio公测
  • 模型卡:Gemini 3.5 Audio Model Card
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Gemini 3.5 Live Translate 是什么核心能力怎么用普通用户:Google Translate企业用户:Google Meet开发者:Gemini Live API已知限制实际场景获取方式

相关文章

Kimi K2.7 Code发布:Token消耗直降30%
AI产品

Kimi K2.7 Code发布:Token消耗直降30%

月之暗面发布并开源Kimi K2.7 Code编程模型,1.1万亿参数、256K上下文,长程任务过度思考问题大幅改善,高速版6倍速度2倍价格。

avatar for toolin小编
toolin小编
1天前
Tabbit AI浏览器:Agent时代的浏览器长什么样
AI产品

Tabbit AI浏览器:Agent时代的浏览器长什么样

美团旗下GN06团队发布AI浏览器Tabbit 1.0,基础功能永久免费,专业版9.9元/周,支持多模型同时运行、脚本妙招和Agent任务管理。

avatar for toolin小编
toolin小编
1天前
在Codex里同时跑Claude Code的设置方法
AI教程

在Codex里同时跑Claude Code的设置方法

一招搞定Codex和Claude Code双持:左边GPT规划,右边Claude干活,互为fallback,两家的拒答边界互不干扰。

avatar for toolin小编
toolin小编
1天前