沃图AIGC

视觉模型-中国

QVQ-Max是阿里巴巴推出的视觉推理模型，基于Qwen2-VL-72B构建，旨在提升人工智能在视觉理解和复杂问题解决方面的能力

QVQ-Max是阿里巴巴推出的视觉推理模型，基于Qwen2-VL-72B构建，旨...

多模态模型-中国

Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型，旨在实现全面的感知能力，能够处理文本、图像、音频和视频等多种输入形式

Qwen2.5-Omni是阿里巴巴发布的端到端多模态人工智能模型，旨在实现全面的...

图像大模型-全球

Ideogram 3.0是AI文本到图像生成模型，在多个方面进行了显著改进，旨在提升用户的创作体验和图像生成质量

Ideogram 3.0是AI文本到图像生成模型，在多个方面进行了显著改进，旨在...

多模态模型-全球视觉模型-全球

Gemini 2.5 Pro是谷歌推出的人工智能模型，被称为其“最智能的模型”，专为处理复杂任务而设计，在推理能力、编码性能和多模态输入方面表现出色

Gemini 2.5 Pro是谷歌推出的人工智能模型，被称为其“最智能的模型”，...

AI编程-中国

秒哒是百度推出的首个对话式无代码应用开发平台，旨在通过自然语言交互和智能体协作，降低应用开发的门槛，使非程序员用户也能快速构建复杂应用

秒哒是百度推出的首个对话式无代码应用开发平台，旨在通过自然语言交互和智能体协作，...

多模态模型-中国视觉模型-中国

Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型，具有32亿参数，在图像理解、数学推理和文本生成等任务中表现出色

Qwen2.5-VL-32B是阿里巴巴发布的一款多模态视觉语言模型，具有32亿参...

AI绘画工具-全球图像大模型-全球

Reve Image是由Reve公司推出的一款图像生成AI模型，旨在结合美学与排版的优势，展现出卓越的图像生成能力

Reve Image是由Reve公司推出的一款图像生成AI模型，旨在结合美学与排...

多模态模型-全球

Reka Flash 3是一个新发布的多模态语言模型，具有21亿参数，专为高效推理和生成而设计

Reka Flash 3是一个新发布的多模态语言模型，具有21亿参数，专为高效推...

视频大模型-中国

Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型，能够基于文本描述和图像输入生成最长102帧的视频

Step-Video-TI2V 是一种先进的文本驱动图像到视频生成模型，能够基于...

语言大模型-全球

EXAONE Deep是由LG AI Research推出的一系列推理增强语言模型，旨在提升在数学、科学和编程等领域的推理能力

EXAONE Deep是由LG AI Research推出的一系列推理增强语言模...

多模态模型-全球

Mistral Small 3.1 是由法国初创公司 Mistral AI 发布的一款开源多模态人工智能模型，具有240亿参数，支持文本和图像的处理

Mistral Small 3.1 是由法国初创公司 Mistral AI 发布...

语言大模型-中国

ERNIE X1 是百度推出的首个自主运用工具的深度思考模型，具备更强的理解、规划、反思和进化能力

ERNIE X1 是百度推出的首个自主运用工具的深度思考模型，具备更强的理解、规...