语言大模型-全球 Jamba 1.6是由AI21 Labs推出的一款新型开放模型,旨在为私营企业提供高效的AI解决方案 Jamba 1.6是由AI21 Labs推出的一款新型开放模型,旨在为私营企业提...
视频大模型-中国 HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架,旨在将静态图像转换为动态视频内容 HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架,旨在将...
多模态模型-全球 视觉模型-全球 Aya Vision是Cohere For AI推出的一系列先进视觉语言模型(VLMs),旨在解决多模态AI系统中的多语言性能挑战 Aya Vision是Cohere For AI推出的一系列先进视觉语言模型(V...
视频大模型-中国 Wan2.1是阿里云最近发布的开源视频生成模型,具有显著的性能优势,能够在个人电脑上运行,支持多种视频生成任务 Wan2.1是阿里云最近发布的开源视频生成模型,具有显著的性能优势,能够在个人电...
视频大模型-中国 Step-Video-T2V 是阶跃星辰开源视频生成模型,具有 300 亿个参数,能够生成最长达 204 帧的视频 Step-Video-T2V 是阶跃星辰开源视频生成模型,具有 300 亿个参数...
音频大模型-全球 Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持多种语言,并具备即时语音克隆的能力 Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持...
语言大模型-全球 Mistral Small 3是由法国初创公司Mistral AI推出的一款新型开源语言模型,具有240亿个参数 Mistral Small 3是由法国初创公司Mistral AI推出的一款新型...
多模态模型-中国 Janus-Pro是DeepSeek团队最近发布的一款多模态AI模型,旨在实现统一的多模态理解与生成 Janus-Pro是DeepSeek团队最近发布的一款多模态AI模型,旨在实现统...
视觉模型-中国 Qwen2.5-VL是阿里通义千问团队推出的最新旗舰视觉语言模型,具有显著的技术进步和多种应用能力 Qwen2.5-VL是阿里通义千问团队推出的最新旗舰视觉语言模型,具有显著的技术...
语言大模型-中国 Qwen2.5-1M是阿里云通义千问团队于2025年1月发布的一款开源大型语言模型,旨在处理长达100万Tokens的上下文 Qwen2.5-1M是阿里云通义千问团队于2025年1月发布的一款开源大型语言模...