音频大模型-全球 Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持多种语言,并具备即时语音克隆的能力 Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持...
语言大模型-全球 Mistral Small 3是由法国初创公司Mistral AI推出的一款新型开源语言模型,具有240亿个参数 Mistral Small 3是由法国初创公司Mistral AI推出的一款新型...
多模态模型-中国 Janus-Pro是DeepSeek团队最近发布的一款多模态AI模型,旨在实现统一的多模态理解与生成 Janus-Pro是DeepSeek团队最近发布的一款多模态AI模型,旨在实现统...
视觉模型-中国 Qwen2.5-VL是阿里通义千问团队推出的最新旗舰视觉语言模型,具有显著的技术进步和多种应用能力 Qwen2.5-VL是阿里通义千问团队推出的最新旗舰视觉语言模型,具有显著的技术...
语言大模型-中国 Qwen2.5-1M是阿里云通义千问团队于2025年1月发布的一款开源大型语言模型,旨在处理长达100万Tokens的上下文 Qwen2.5-1M是阿里云通义千问团队于2025年1月发布的一款开源大型语言模...
AI 3D-全球 Hunyuan3D 2.0 是腾讯推出的一款先进的大规模3D资产生成系统,旨在生成高分辨率的纹理化3D模型 Hunyuan3D 2.0 是腾讯推出的一款先进的大规模3D资产生成系统,旨在生...
多模态模型-中国 视觉模型-中国 Kimi K1.5是由月之暗面推出的一款新一代多模态推理模型,具备强大的推理和多模态处理能力 Kimi K1.5是由月之暗面推出的一款新一代多模态推理模型,具备强大的推理和多...
语言大模型-中国 DeepSeek-R1是DeepSeek公司最新发布的推理模型,具有多个版本和参数配置,旨在与OpenAI的o1模型竞争 DeepSeek-R1是DeepSeek公司最新发布的推理模型,具有多个版本和参...
视频大模型-全球 Ray 2是Luma AI推出的最新视频生成模型,具备多项先进功能,旨在通过文本和图像输入快速生成高质量、逼真的视频 Ray 2是Luma AI推出的最新视频生成模型,具备多项先进功能,旨在通过文本...
语言大模型-中国 讯飞星火深度推理模型X1是科大讯飞于2025年1月15日发布的全国产算力平台上唯一的深度推理大模型 讯飞星火深度推理模型X1是科大讯飞于2025年1月15日发布的全国产算力平台上唯...
多模态模型-中国 视觉模型-中国 MiniMax-01系列是Hailuo AI推出的一系列开源大型语言模型和视觉多模态模型 MiniMax-01系列是Hailuo AI推出的一系列开源大型语言模型和视觉多...
多模态模型-中国 MiniCPM-o是一个最新的端侧多模态大模型系列,旨在处理图像、视频、文本和音频等多种输入,并生成高质量的文本和语音输出 MiniCPM-o是一个最新的端侧多模态大模型系列,旨在处理图像、视频、文本和音...