物理芝士数学酱 26-04-23 23:59
微博认证:科学科普博主 微博原创视频博主

午夜#学术新闻#

MIT CSAIL 昨天最新公布的一个项目,叫 MathNet。它是目前世界上最大的奥林匹克水平数学题库,向公众开放使用。

http://t.cn/AXxKcvng
收录超过 30000 道题目与解答,来自 47 个国家、17 种语言、143 场竞赛,比之前最大的同类数据集大五倍。

所有题目均来自各国国际数学奥林匹克(IMO)和国家竞赛的官方题册,而不是论坛或社区投稿。

包含文字题与图形题,覆盖四十年的竞赛历史。

解答由专家撰写,常常有多种解法,质量远高于社区资源。

多语言、多文化,避免只偏向英语或中文的训练数据。

为全球准备奥数或国家竞赛的学生提供一个集中、可搜索的高质量题库

GPT‑5 在 MathNet 的 6400 道基准题上平均正确率约 69.3%,仍有三分之一无法解决。

遇到带图形的题目时,所有模型表现显著下降,显示视觉推理仍是弱点。

在蒙古语等小语种题目上,部分开源模型甚至得分为零。

发布于 黑龙江