#大模型# 【性能表现接近专有模型,科学家推出开源代码大模型OpenCoder与构建指南】
自 2021 年,OpenAI 推出了 #CodeX# 以来,大语言模型(Large Language Model,LLM)的发展已经给代码生成工作带来了巨大的变革。
作为 LLM 的一个重要分支,代码大模型(Code LLMs)不仅可以自动生成代码,还能够辅助代码审查、错误调试、代码补全等任务,从而大幅减少开发者在重复性劳动上的时间投入,让他们得以专注于创造本身。
不过,在面向代码的 LLMs 中,开源模型依然与最先进的专有模型存在较大差距,其主要原因在于这些专有模型的训练数据集通常为私有数据,限制了研究界在强基线模型构建和深入理解方面的能力。
为了弥补这一不足,来自墨尔本大学、#复旦大学# 等高校的研究人员,联合无限光年推出了完全开放的代码大模型 OpenCoder。
将开源代码 LLM 的性能提升至专有模型水平,同时也发布了完整的模型构建过程,旨在为代码 AI 研究的透明化和可重复性提供基础。
戳链接查看详情:http://t.cn/A6nj2uSs
