Qwen25-Max发布功能逾越DeepSeek V3

发布时间：2025-02-27 04:58:29作者：雷火电竞网页分类：公司动态浏览：961次

近来，超大规划的 MoE 模型（混合专家模型）通义千问 Qwen2.5-Max 正式上线，通义千问团队运用逾越 20 万亿 token 的预练习数据及精心设计的后练习计划进行练习。

通义千问团队表明，“今日，咱们很快乐能给大家伙儿一起来共享 Qwen2.5-Max 现在所获得的效果。你们能够在Qwen Chat 直接体会，或是经过阿里云百炼渠道调用 API 服务。”

一起，通义千问还将 Qwen2.5-Max 与业界抢先的模型（无论是闭源仍是开源）在一系列广受重视的基准测验进步行了比照评价。这些基准测验包含测验大学水往常识的 MMLU-Pro、评价编程才能的 LiveCodeBench，全面评价归纳才能的 LiveBench，以及近似人类偏好的 Arena-Hard。评价成果涵盖了基座模型和指令模型的功能得分。

首要，通义千问直接比照了指令模型的功能体现。指令模型即咱们往常运用的能够直接对话的模型。通义千问将 Qwen2.5-Max 与业界抢先的模型（包含 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet）的功能成果进行了比照。