语言大模型
OLMo 2是由艾伦人工智能研究所(AI2)推出的一款新型开放语言模型,旨在推动人工智能研究的透明性和可访问性
OLMo 2是由艾伦人工智能研究所(AI2)推出的一款新型开放语言模型,旨在推动...
Tülu 3是由艾伦人工智能研究所(AI2)推出的一系列开源后训练模型,旨在推动语言模型的透明性和开放性
Tülu 3是由艾伦人工智能研究所(AI2)推出的一系列开源后训练模型,旨在推动...
Marco-o1是由阿里巴巴的MarcoPolo团队开发的一个大型推理模型,旨在解决开放式和复杂问题
Marco-o1是由阿里巴巴的MarcoPolo团队开发的一个大型推理模型,旨在...
DeepSeek-R1-Lite-Preview是由DeepSeek公司推出的一款新型AI推理模型,旨在提供更强大的推理能力和透明的思维过程
DeepSeek-R1-Lite-Preview是由DeepSeek公司推出的一...
Pixtral Large是由Mistral AI推出的一款先进的多模态模型,具有1240亿个参数
Pixtral Large是由Mistral AI推出的一款先进的多模态模型,具...
Fireworks f1 是由 Fireworks AI 推出的一个复合 AI 模型,专门设计用于复杂推理任务
Fireworks f1 是由 Fireworks AI 推出的一个复合 AI ...
Qwen2.5-Turbo是阿里巴巴开发的一款先进的大型语言模型,最近进行了显著的更新,特别是在上下文处理能力和推理速度方面
Qwen2.5-Turbo是阿里巴巴开发的一款先进的大型语言模型,最近进行了显著...
Qwen2.5-Coder是阿里巴巴旗下Qwen系列的最新开源模型,专注于代码生成、推理和修复等任务
Qwen2.5-Coder是阿里巴巴旗下Qwen系列的最新开源模型,专注于代码生...
Hunyuan-Large是腾讯最近开源的一款大规模混合专家(Mixture of Experts, MoE)模型,具有3890亿个参数和520亿个激活参数
Hunyuan-Large是腾讯最近开源的一款大规模混合专家(Mixture o...