GITHUB HUGGING FACE MODELSCOPE DEMO DISCORD

简介

四月初,我们发布了 CodeQwen1.5, 得到了社区广泛的关注与喜爱。自那以后,我们一直在继续努力提升代码模型。今天,我们很高兴地宣布新一代的开放代码模型 Qwen2.5-Coder 的发布。并正式将 CodeQwen 的命名改为 Qwen-Coder,我们认为 Coder 更加拟人、灵动,期待其可以在未来真正与人类结对编程。Qwen2.5-Coder 是我们 Qwen2.5 开源家族的一员,共包括三个尺寸的模型:1.5B、 7B 和 32B(在路上)。

本次更新的两大核心包括代码训练数据的进一步 scaling,以及探索在提升代码能力的同时保持数学和通用能力。

  1. 码无止境:Qwen2.5-Coder 基于强大的 Qwen2.5 初始化,扩增了更大规模的代码训练数据持续训练,包括源代码、文本代码混合数据、合成数据等共计 5.5T tokens。使得 Qwen2.5-Coder 在代码生成、代码推理、代码修复等任务上都有了显著提升。
  2. 学无止境:我们希望 Qwen2.5-Coder 在提升代码能力的同时,也能保持在数学、通用能力等方面的优势。因此,我们在 Qwen2.5-Coder 中加入了更多的数学、通用能力数据,为未来的真实应用提供更为全面的基座。

Qwen2.5-Coder: Base Models

Qwen2.5-Coder 最多 128K tokens 上下文,支持 92 种编程语言,并在多个代码相关的评估任务中都取得了显著的提升,包括代码生成、多编程语言代码生成、代码补全、代码修复等。值得注意的是,本次开源的 7B 版本 Qwen2.5-Coder,甚至打败了更大尺寸的 DeepSeek-Coder-V2-Lite 和 Codestral-20B,成为当前最强大的基础代码模型之一。除了代码任务外,Qwen2.5-Coder 也具备极具竞争力的数学能力。面向通用任务,我们评估了 MMLU 和 ARC,结果表明 Qwen2.5-Coder 很好的保持了 Qwen2.5 的通用能力。

Qwen2.5-Coder-Instruct: Instruction-Tuned Models

我们在 Qwen2.5-Coder 的基础上,通过指令微调,得到了 Qwen2.5-Coder-Instruct。Qwen2.5-Coder-Instruct 除了进一步提升了多个任务上的性能外,还在更多的评估中体现出了卓越的泛化性。

特别的,Qwen2.5-Coder-Instruct 在几个方面表现非常突出:

  1. 卓越的多编程语言能力:为了更广泛的评估多编程语言能力,我们使用 McEval 在 Qwen2.5-Coder-Instruct 上进行了更多的测试,共设计 40 多种编程语言。结果表明 Qwen2.5-Coder-Instruct 在多种编程语言任务上表现非常出色,包括一些小众语言。
  1. 代码推理:我们认为代码推理能力和通用推理能力是密切相关的,我们选择 CRUXEval 作为评估基准,结果表明 Qwen2.5-Coder-Instruct 在代码推理任务上表现非常出色。更有趣的是,我们发现随着代码推理能力的提升,模型的复杂指令遵循也得到了增强,这鼓舞我们继续探索代码对于通用能力的增益。
  1. 数学能力:数学和代码经常被一起讨论,数学是代码的基础学科,代码是数学的重要工具。我们发现 Qwen2.5-Coder-Instruct 在代码和数学任务上都表现出色,是一个名副其实的理科生。
ModelMathGSM8KGaoKao2023enOlympiadBenchCollegeMathAIME24
DeepSeek-Coder-V2-Lite-Instruct6187.656.126.439.86.7
Qwen2.5-Coder-7B-Instruct66.886.760.529.843.510
  1. 基础能力:我们还在通用能力上进行了评估,结果表明 Qwen2.5-Coder-Instruct 在通用能力上也保持了 Qwen2.5 的优势。
ModelAMC23MMLUMMLU-ProIFEvalCEvalGPQA
DeepSeek-Coder-V2-Lite-Instruct40.442.560.638.660.127.6
Qwen2.5-Coder-7B-Instruct42.545.668.758.661.435.6

模型许可

Qwen2.5-Coder 采用Apache 2.0的许可。我们希望本次开放程度的提升能够加速 Qwen2.5-Coder 在代码智能方面的应用。

What’s Next for Qwen2.5-Coder?

我们正在筹备 32B 版本的 Qwen2.5-Coder,期待可以直接向闭源模型发起挑战,很快就会和大家见面,敬请期待! 除此之外,我们还在积极探索以代码为中心的强大推理模型,探索代码智能的边界。

Citation

@article{qwen2,
  title={Qwen2 Technical Report},
  year={2024}
}