挨踢牛魔王 26-02-06 15:37
微博认证:科技博主

claude opus 4.6发布了,提升还是很大。
这个说明,大模型后面的潜力还很大,远远没有被挖掘干净。

我比较关心他们的编码和智能体的能力。

比较惊人的是他们那个工具调用,在不同的评测集上达到了91.9%和99.3%。
就是说工具调用,基本不会出错了。

256K上下文上的检索达到了93%,很准了。
而在1M上下文上,也达到了76%。

他们还说,花了2万美元的token写了一个C语言编译器,而且跑通了。
编译器是一个难度很高的项目,被称为程序员“三大浪漫”。
连这种项目都能搞定,看来写底层代码的程序员以后也得用上AI了。

博客:www.anthropic.com/news/claude-opus-4-6

发布于 江苏