音频大模型

音频大模型-全球

Amazon Nova Sonic是一款全新的基础模型，旨在为人工智能应用程序提供自然、类似人类的语音对话体验

Amazon Nova Sonic是一款全新的基础模型，旨在为人工智能应用程序提...

音频大模型-中国

Speech-02 是一种先进的语音合成模型，旨在提高语音生成的质量和效率

Speech-02 是一种先进的语音合成模型，旨在提高语音生成的质量和效率。特...

音频大模型-全球

Octave TTS 是由 Hume AI 开发的一种新型文本到语音（TTS）模型，旨在生成具有情感和个性化的 AI 语音

Octave TTS 是由 Hume AI 开发的一种新型文本到语音（TTS）模...

音频大模型-中国

Step-Audio是由阶跃星辰团队开发的首个产品级开源语音交互模型

Step-Audio是由阶跃星辰团队开发的首个产品级开源语音交互模型。主要特点...

音频大模型-全球

Zonos是一个开源的文本到语音（TTS）模型，提供高质量、自然的语音生成，支持多种语言，并具备即时语音克隆的能力

Zonos是一个开源的文本到语音（TTS）模型，提供高质量、自然的语音生成，支持...

音频大模型-全球

PlayDialog是一个先进的AI语音模型，旨在提供流畅且富有表现力的对话体验

PlayDialog是一个先进的AI语音模型，旨在提供流畅且富有表现力的对话体验...

音频大模型-中国

CogSound是智谱科技推出的一款音效生成模型，旨在为AI生成的视频提供与画面内容相匹配的音效

CogSound是智谱科技推出的一款音效生成模型，旨在为AI生成的视频提供与画面...

音频大模型-中国

GLM-4-Voice是由智谱AI推出的一款端到端语音模型，旨在实现中英文的实时语音对话

GLM-4-Voice是由智谱AI推出的一款端到端语音模型，旨在实现中英文的实时...

视频大模型-全球音频大模型-全球

Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能（AI）工具，旨在通过文本提示生成高质量的视频和音频内容

Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能（AI）...