宝玉xp 24-03-08 08:26
微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

根据“🏆 LMSYS Chatbot Arena Leaderboard”的排名,现在Claude 3 Opus是第三,还是略低于GPT-4最新的版本,但超过了Gemini和GPT-4的早期版本,跟大家测试的结果比较接近。

注:"LMSYS Chatbot Arena是一个众包开放平台,专门对大语言模型(LLMs)的评估和测试。评测的时候针对用户的问题随机显示两个LLM的生成结果,用户是不知道是哪个LLM生成的,用户需要在两个生成结果里面选一个自己觉得好的。相对客观公正。

http://t.cn/A6Wmw3xu

发布于 美国