【对话中国信通院魏凯：#AI下半场大模型要少说话多做事#】今年2月DeepSeek爆火，震惊国内外。实际上，在此之前，中国信息通信研究院（下称：中国信通院）的大模型评测团队就观察到国内模型性能迅速提升的势头，他们当中就包括中国信通院人工智能研究所所长魏凯。魏凯说：“2024年一年，国内包括Deep

【对话中国信通院魏凯：#AI下半场大模型要少说话多做事#】今年2月DeepSeek爆火，震惊国内外。实际上，在此之前，中国信息通信研究院（下称：中国信通院）的大模型评测团队就观察到国内模型性能迅速提升的势头，他们当中就包括中国信通院人工智能研究所所长魏凯。

魏凯说：“2024年一年，国内包括DeepSeek在内的多个大模型团队，一直从多角度努力，不断提升模型性能，基本上每个月都能看到新的进展。在我们的测试中，DeepSeek在2024年4月的模型性能排名还比较靠后，8月的版本已经是TOP10里的玩家了，到了10月的版本已经是前几名了，12月发布的DeepSeek-V3成为当时基础能力第一名的模型，而且是开源的，非常了不起。”

中国信通院是工业和信息化部直属科研事业单位，在人工智能领域承担决策支撑、新技术研究、标准研制、检验检测、咨询服务和国际合作等任务。2023年，魏凯带领团队推出“方升”大模型基准测试体系，依托“人工智能关键技术与应用评测部重点实验室”，制定测试标准，建设测试平台和数据集，定期对国内外大模型进行测试，目前已经构建了近700万条测试数据集。 http://t.cn/A6DOTgll