#大模型# 【性能表现接近专有模型，科学家推出开源代码大模型OpenCoder与构建指南】自 2021 年，OpenAI 推出了 #CodeX# 以来，大语言模型（Large Language Model，LLM）的发展已经给代码生成工作带来了巨大的变革。作为 LLM 的一个重要分支，代码大模型（Code LLMs）不仅可以自动生成代码，还能够

#大模型# 【性能表现接近专有模型，科学家推出开源代码大模型OpenCoder与构建指南】

自 2021 年，OpenAI 推出了 #CodeX# 以来，大语言模型（Large Language Model，LLM）的发展已经给代码生成工作带来了巨大的变革。

作为 LLM 的一个重要分支，代码大模型（Code LLMs）不仅可以自动生成代码，还能够辅助代码审查、错误调试、代码补全等任务，从而大幅减少开发者在重复性劳动上的时间投入，让他们得以专注于创造本身。

不过，在面向代码的 LLMs 中，开源模型依然与最先进的专有模型存在较大差距，其主要原因在于这些专有模型的训练数据集通常为私有数据，限制了研究界在强基线模型构建和深入理解方面的能力。

为了弥补这一不足，来自墨尔本大学、#复旦大学# 等高校的研究人员，联合无限光年推出了完全开放的代码大模型 OpenCoder。

将开源代码 LLM 的性能提升至专有模型水平，同时也发布了完整的模型构建过程，旨在为代码 AI 研究的透明化和可重复性提供基础。

戳链接查看详情：http://t.cn/A6nj2uSs