Claude Opus 4.6发布

claude opus 4.6发布了，提升还是很大。
这个说明，大模型后面的潜力还很大，远远没有被挖掘干净。

我比较关心他们的编码和智能体的能力。

比较惊人的是他们那个工具调用，在不同的评测集上达到了91.9%和99.3%。
就是说工具调用，基本不会出错了。

256K上下文上的检索达到了93%，很准了。
而在1M上下文上，也达到了76%。

他们还说，花了2万美元的token写了一个C语言编译器，而且跑通了。
编译器是一个难度很高的项目，被称为程序员“三大浪漫”。
连这种项目都能搞定，看来写底层代码的程序员以后也得用上AI了。

博客：www.anthropic.com/news/claude-opus-4-6

发布于江苏