大家都知道最近大模型做数学题好像都达到了奥林匹克数学金牌水平。那它们的数学水平真的如何呢?我们最新的120页报告:http://t.cn/AXhz9XEC 提出了如何进行专业的评价框架GAUSS。这是一群主要来自国际顶尖大学(伯克利、加州理工、斯坦福、华盛顿大学等)数学系的博士(大部分是曾经的奥数金牌得主)对最新的GPT5等模型各方面的数学能力进行的全面、专业、客观的验证。如果我最近发布的新书是关于解释目前AI系统的数学原理;那么这个报告反过来验证目前AI系统可能对数学的学习与研究有什么影响。希望国内外的数学界也积极参与到这项意义重大的任务中来!Math for AI and AI for Math!
发布于 中国香港
