音频大模型
Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持多种语言,并具备即时语音克隆的能力
Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持...
CogSound是智谱科技推出的一款音效生成模型,旨在为AI生成的视频提供与画面内容相匹配的音效
CogSound是智谱科技推出的一款音效生成模型,旨在为AI生成的视频提供与画面...
Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能(AI)工具,旨在通过文本提示生成高质量的视频和音频内容
Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能(AI)...