去年早些时候,我与丘成桐先生交谈。丘先生问到到目前大语言模型的数学能力,包括各门数学知识以及各种数学技能。我说我可以帮助找人验证一下。这份最新的120页报告:http://t.cn/AXhz9XEC 的第一作者是我在伯克利时合作过的数学系学生张钺:奥数金牌、北大数学系第一名、阿里巴巴数学竞赛前两届的冠军、在伯克利数学系破纪录地用两年完成了博士学位,AI startup Hyperbolic的创始人。在这项工作里,他联合了一群世界顶尖的数学天才们,提出了全新的专业验证方法。彻底突破目前普遍靠做题、刷分的模式。从而能揭示目前大模型做对、做错数学问题的本质原因。对人工智能的各项研究,学术界必须提出更加严格、专业的标准!
发布于 中国香港
