这件事他说对了一半,另一半藏着自己的立场。
先把对的那半说清楚。把 Llama 这类公开权重的模型叫「开源」,确实不准确。传统开源软件的核心是四样东西:源代码可见、可修改、可重新分发、可参与贡献。现在这些 AI 模型,你拿到的只是一个权重文件,训练数据你看不到,训练代码你看不到,你也没法往主分支提个 PR。从这个角度看,叫「开放权重」确实比「开源」严谨得多,业界这几年也已经在往这个叫法靠。
但有意思的是他的下半句,「AI 开源是伪命题」这个定性,认真琢磨就有点问题。他把传统开源的定义当作唯一标尺,然后用这把尺子一量,宣布你这不叫开源。可问题在于,神经网络的「源代码」到底是什么?是模型架构?是权重矩阵?是训练数据?还是训练代码?这本身就是一个没有定论的问题,连学术界都没吵清楚,他直接给定死了。
更微妙的是立场问题。Anthropic 是全封闭路线的旗帜,Claude 别说权重,连系统提示词都恨不得藏起来。他这时候出来说开放权重不配叫开源,客观上就是把「开放」这件事本身的合法性往下踩了一脚。他的逻辑链条其实是这样走的:你们那不叫开源,你们那是伪命题,所以真正的开源做不到,所以封闭才是诚实的。每一步推理都没毛病,但起点和终点全是利益。
还有一层他没提。开放权重模型能做的事情,封闭模型就是做不到:本地部署、离线运行、微调、蒸馏、权重级别的可解释性研究。你管它叫开放权重也好,叫半开源也好,它的实用性就摆在那里。名字可以争,价值争不走。
所以,我的看法很简单,他说的「术语不准确」,对;他暗示「所以开放没意义」,站不住。用术语之争去消解一条技术路线的合法性,这手笔放在公关层面挺漂亮,放在学理层面就不够坦诚了。
#科技先锋官##How I AI#
发布于 山东
