午夜#学术新闻#
MIT CSAIL 昨天最新公布的一个项目,叫 MathNet。它是目前世界上最大的奥林匹克水平数学题库,向公众开放使用。
http://t.cn/AXxKcvng
收录超过 30000 道题目与解答,来自 47 个国家、17 种语言、143 场竞赛,比之前最大的同类数据集大五倍。
所有题目均来自各国国际数学奥林匹克(IMO)和国家竞赛的官方题册,而不是论坛或社区投稿。
包含文字题与图形题,覆盖四十年的竞赛历史。
解答由专家撰写,常常有多种解法,质量远高于社区资源。
多语言、多文化,避免只偏向英语或中文的训练数据。
为全球准备奥数或国家竞赛的学生提供一个集中、可搜索的高质量题库
GPT‑5 在 MathNet 的 6400 道基准题上平均正确率约 69.3%,仍有三分之一无法解决。
遇到带图形的题目时,所有模型表现显著下降,显示视觉推理仍是弱点。
在蒙古语等小语种题目上,部分开源模型甚至得分为零。
发布于 黑龙江
