karminski-牙医 26-01-12 07:33
微博认证:AI博主

nova-2-lite-v1 这么猛的吗?

看到个新的 benchmark 项目 lintbench, 来测试大模型对 Markdown 格式的检查水平, 排行榜第一的是 claude-opus-4.5, 这个倒是意料之中. 但是第二名是 nova-2-lite-v1 这个就有点出乎意料了, 这个是 Amazon 去年12月份刚发布的商业模型, 定价大概比国产大模型贵50%. 2.5USD/M token. 有时间我给大家测一下. 感觉完全没什么水花但是水平意外的高?

另外作者没有公布测试数据和测试方式. 所以暂时排行榜仅供参考. 顺便我把全部排行榜截图了, 放在了p2.

#ai生活指南# #ai创造营#

发布于 日本