中国企业家杂志
25-07-01 11:32 微博认证:《中国企业家》杂志社有限责任公司官方微博

【对话中国信通院魏凯:#AI下半场大模型要少说话多做事#】 今年2月DeepSeek爆火,震惊国内外。实际上,在此之前,中国信息通信研究院(下称:中国信通院)的大模型评测团队就观察到国内模型性能迅速提升的势头,他们当中就包括中国信通院人工智能研究所所长魏凯。

魏凯说:“2024年一年,国内包括DeepSeek在内的多个大模型团队,一直从多角度努力,不断提升模型性能,基本上每个月都能看到新的进展。在我们的测试中,DeepSeek在2024年4月的模型性能排名还比较靠后,8月的版本已经是TOP10里的玩家了,到了10月的版本已经是前几名了,12月发布的DeepSeek-V3成为当时基础能力第一名的模型,而且是开源的,非常了不起。”

中国信通院是工业和信息化部直属科研事业单位,在人工智能领域承担决策支撑、新技术研究、标准研制、检验检测、咨询服务和国际合作等任务。2023年,魏凯带领团队推出“方升”大模型基准测试体系,依托“人工智能关键技术与应用评测部重点实验室”,制定测试标准,建设测试平台和数据集,定期对国内外大模型进行测试,目前已经构建了近700万条测试数据集。 http://t.cn/A6DOTgll