视觉模型-中国 QVQ-Max是阿里巴巴推出的视觉推理模型,基于Qwen2-VL-72B构建,旨在提升人工智能在视觉理解和复杂问题解决方面的能力 QVQ-Max是阿里巴巴推出的视觉推理模型,基于Qwen2-VL-72B构建,旨...
多模态模型-中国 Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型,旨在实现全面的感知能力,能够处理文本、图像、音频和视频等多种输入形式 Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型,旨在实现全面的...
图像大模型-全球 Ideogram 3.0是AI文本到图像生成模型,在多个方面进行了显著改进,旨在提升用户的创作体验和图像生成质量 Ideogram 3.0是AI文本到图像生成模型,在多个方面进行了显著改进,旨在...
多模态模型-全球 视觉模型-全球 Gemini 2.5 Pro是谷歌推出的人工智能模型,被称为其“最智能的模型”,专为处理复杂任务而设计,在推理能力、编码性能和多模态输入方面表现出色 Gemini 2.5 Pro是谷歌推出的人工智能模型,被称为其“最智能的模型”,...
AI编程-中国 秒哒是百度推出的首个对话式无代码应用开发平台,旨在通过自然语言交互和智能体协作,降低应用开发的门槛,使非程序员用户也能快速构建复杂应用 秒哒是百度推出的首个对话式无代码应用开发平台,旨在通过自然语言交互和智能体协作,...
多模态模型-中国 视觉模型-中国 Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型,具有32亿参数,在图像理解、数学推理和文本生成等任务中表现出色 Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型,具有32亿参...
AI绘画工具-全球 图像大模型-全球 Reve Image是由Reve公司推出的一款图像生成AI模型,旨在结合美学与排版的优势,展现出卓越的图像生成能力 Reve Image是由Reve公司推出的一款图像生成AI模型,旨在结合美学与排...
视频大模型-中国 Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型,能够基于文本描述和图像输入生成最长102帧的视频 Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型,能够基于...
语言大模型-全球 EXAONE Deep是由LG AI Research推出的一系列推理增强语言模型,旨在提升在数学、科学和编程等领域的推理能力 EXAONE Deep是由LG AI Research推出的一系列推理增强语言模...
多模态模型-全球 Mistral Small 3.1 是由法国初创公司 Mistral AI 发布的一款开源多模态人工智能模型,具有240亿参数,支持文本和图像的处理 Mistral Small 3.1 是由法国初创公司 Mistral AI 发布...
语言大模型-中国 ERNIE X1 是百度推出的首个自主运用工具的深度思考模型,具备更强的理解、规划、反思和进化能力 ERNIE X1 是百度推出的首个自主运用工具的深度思考模型,具备更强的理解、规...