语言大模型-全球 Cogito v1 Preview是由Deep Cogito开发的混合推理模型,可以直接回答问题(标准LLM模式),也可以在回答之前进行自我反思(推理模式) Cogito v1 Preview是由Deep Cogito开发的混合推理模型,...
多模态模型-全球 Meta发布最新的开源人工智能模型Llama 4,包括两个主要版本:Scout和Maverick,均采用了创新的混合专家(MoE)架构,能够高效处理文本、图像、视频和音频等多种数据类型 Meta发布最新的开源人工智能模型Llama 4,包括两个主要版本:Scout和...
多模态模型-中国 Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型,旨在实现全面的感知能力,能够处理文本、图像、音频和视频等多种输入形式 Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型,旨在实现全面的...
多模态模型-中国 视觉模型-中国 Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型,具有32亿参数,在图像理解、数学推理和文本生成等任务中表现出色 Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型,具有32亿参...
视频大模型-中国 Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型,能够基于文本描述和图像输入生成最长102帧的视频 Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型,能够基于...
语言大模型-全球 EXAONE Deep是由LG AI Research推出的一系列推理增强语言模型,旨在提升在数学、科学和编程等领域的推理能力 EXAONE Deep是由LG AI Research推出的一系列推理增强语言模...
多模态模型-全球 Mistral Small 3.1 是由法国初创公司 Mistral AI 发布的一款开源多模态人工智能模型,具有240亿参数,支持文本和图像的处理 Mistral Small 3.1 是由法国初创公司 Mistral AI 发布...
语言大模型-全球 Command A 是一种大型语言模型,具有1110亿个参数,专为需要快速、安全和高质量AI解决方案的企业优化 Command A 是一种大型语言模型,具有1110亿个参数,专为需要快速、安全...
多模态模型-全球 Gemma 3是谷歌发布的最新开放语言模型,具有多模态能力,能够处理文本和图像,支持超过140种语言 Gemma 3是谷歌发布的最新开放语言模型,具有多模态能力,能够处理文本和图像,...
语言大模型-全球 Jamba 1.6是由AI21 Labs推出的一款新型开放模型,旨在为私营企业提供高效的AI解决方案 Jamba 1.6是由AI21 Labs推出的一款新型开放模型,旨在为私营企业提...
视频大模型-中国 HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架,旨在将静态图像转换为动态视频内容 HunyuanVideo-I2V是腾讯开源的一种先进的图像到视频生成框架,旨在将...