蚁工厂
26-06-13 16:51 微博认证:科技博主

LLM Benchmark Dashboard(基于个人私有题目的大模型长期跟踪测评项目)
已经更新了智谱刚发布的GLM-5.2(max)的跑分,介于GPT-5.4 (high)和GPT-5.5 (high)之间。。[哆啦A梦吃惊]
地址:llm2014.github.io/llm_benchmark/ (数据类型选代码v3)
可能这次值得期待?
#AI创造营# ​

发布于 山东