
Higgs Audio V2
Boson AI开源的表现力音频生成模型
English
免费
AI语音合成
0收藏
18浏览


Boson AI开源的表现力音频生成模型

Higgs Audio V2 是由 Boson AI 开发的开源音频基础模型,基于超过1000万小时的音频数据预训练。该模型无需后训练或微调即可实现高表现力的音频生成,在情感表达和多说话人对话生成方面达到业界领先水平。
主要功能
应用场景
在内容创作领域,创作者可以利用其生成播客、有声书或视频旁白;在多媒体制作中,可快速生成多角色对话音频;在语音克隆场景中,开发者可基于少量参考音频实现个性化语音合成。
独特优势
Higgs Audio V2 采用创新的 DualFFN 架构,建立在 Llama-3.2-3B 之上,总参数量达 5.8B。音频质量从 16kHz 升级至 24kHz,在说话人相似度和整体自然度方面表现优异。作为首个真正在情感表达上具备"意识"的开源模型,它在语调、时机和语气把控方面表现出色。
完全免费使用
暂无包含此工具的工具集
创建第一个工具集