根据“🏆 LMSYS Chatbot Arena Leaderboard”的排名,现在Claude 3 Opus是第三,还是略低于GPT-4最新的版本,但超过了Gemini和GPT-4的早期版本,跟大家测试的结果比较接近。
注:"LMSYS Chatbot Arena是一个众包开放平台,专门对大语言模型(LLMs)的评估和测试。评测的时候针对用户的问题随机显示两个LLM的生成结果,用户是不知道是哪个LLM生成的,用户需要在两个生成结果里面选一个自己觉得好的。相对客观公正。
http://t.cn/A6Wmw3xu
发布于 美国
