高飞 26-03-30 11:33
微博认证:至顶科技创始人 AI博主

#模型时代# 宝丽来为什么用了十年才重新造出来?|知识每年衰变50%,一个物理学家的知识三定律

再发一期不那么”技术“的播客笔记。主角César Hidalgo是图卢兹经济学院教授,主持集体学习中心 Center for Collective Learning,在MIT领导同名实验室九年,2018年获复杂系统研究领域的拉格朗日奖。2025年11月他的新书《The Infinite Alphabet》由企鹅兰登书屋出版,为知识的增长、扩散和价值估算建立了一套类似物理定律的分析框架。这期Machine Learning Street Talk播客于2025年12月28日发布,围绕这本书展开了近90分钟的对话。

先说一个书里讲到的故事。2008年宝丽来宣布停产即时胶片,荷兰恩斯赫德的最后一座工厂即将关门。维也纳有位叫Florian Kaps的前生物学家,当时经营着全球最大的宝丽来胶片网店,听到消息后飞到荷兰,花310万美元买下了工厂全部生产设备,签了厂房十年租约,创办了The Impossible Project,然后把原来最熟练的工人请了回来。设备在,厂房在,人也在,所有人都觉得重新开工只是时间问题。

结果完全不是那么回事。宝丽来的即时胶片由大约20种组分构成,配方沿用将近40年,但其中关键化学原料已经停产,供应链断了,原始配方无法复刻。Hidalgo在维也纳采访过Kaps,问他雇回来的人水平如何。回答是:"No, no, no. We had the A team. It was the star team." 顶尖团队,顶级设备,完整图纸,照样不行。2010年第一批胶片上市,色彩严重偏移,出来的是一种橘棕色调,感光度批次间差异巨大,化学药剂从封口处渗漏,照片几周内褪色到几乎看不见。花了好几年才稳定到"能用"的程度,大约十年后才接近宝丽来1970年代的品质。

这个故事让我想到最近关于登月的讨论。Artemis II最快今年春天发射,人类时隔半个多世纪重返月球轨道。NASA花了超过900亿美元,至今没把人送回月球表面。Saturn V火箭的图纸还在,计算机比阿波罗时代强了两万倍。但造火箭的工厂拆了,模具回收了,技师全部退休了。50年没有登月级别的工程实践,知识就衰变了。宝丽来和登月,量级不同,规律一样。Hidalgo引用的数据显示,组织知识的年衰变率约50%。不使用,就会失去。

一、知识不是可以随意复制的文件

1、非竞争性加上非同质性

Paul Romer的内生增长理论拿过2018年诺贝尔经济学奖,核心观点是知识具有non-rival特性,也就是非竞争性,我教你一首歌自己还是会唱,所以知识可以无损复制,是人均经济增长唯一的解释变量。Hidalgo认为Romer的框架正确但不够:在那个框架里知识像水一样往桶里灌,不分种类。他的书聚焦知识的第二个属性non-fungible,非同质性。知识由无数独特的"字母"组成,一张永远在扩展的字母表。一个国家拥有哪些字母、如何组合,决定了经济潜力。

2、书本没有知识,团队才有

Hidalgo的判断是:书只是思想的存档记录,知识只有在被人或团队"激活"时才能工作。制造一架大型客机所需的知识,没有任何个体能完整持有,它分布在人、机器、手册、经验和社会关系构成的网络中。

他用温度史打了个比方。人类花了两千年才搞懂温度:最初以为冷热是两种物质的混合,后来以为热是一种液体。直到Joule观察到钻炮管可以产出无穷无尽的热量,才明白热是物质粒子运动的属性,本身不是物质。知识也一样,依附于人和团队存在,但自身不是一个可以独立搬运的东西。

卡内基梅隆大学的Linda Argote提出过一个组织学习模型:组织是连接人、工具和概念的网络,学习不仅来自个人学习,也来自网络的重新配置。Tim和Robert搭档效果差,换成Charles,组织就学到了新东西。这种网络权重调整的逻辑,和深度学习调参在结构上有相似性。

3、侦探小说的三层知识

Hidalgo用侦探小说类比知识的层次。第一层是事实性知识:墙上有个弹孔,昨晚七点有通电话,这类知识传播成本极低。第二层是概念性知识:侦探把线索串成完整故事,解释动机和因果。第三层是程序性知识:把血迹送去DNA实验室测序,实验室掌握的就是程序性知识。经济学关心的主要是第三种,面包师知道怎么做面包,汽车修理工知道怎么修发动机,清洁泳池的工人知道怎么对付客户家的恶犬。这些经验型知识不来自科学方法的验证,但它们让世界正常运转。

二、知识的时间定律:从学习曲线到摩尔曲线

1、个体和组织的学习曲线

1916年前后,心理学家Leon Thurstone用匹兹堡商学院的打字学习数据画出了第一条精确的学习曲线:速度对累积练习量呈类似平方根的函数,开头进步飞快,然后增速递减。1936年航空工程师Theodore Wright在飞机制造成本中发现同样的幂律关系。1965年经济学家Leonard Rapping用二战自由轮船 Liberty Ships 的数据证明,造船工时的下降纯粹来自经验积累,跟技术升级和资本投入无关。

2、架构创新与破坏性创新

哈佛商学院教授Rebecca Henderson提出的架构创新 architectural innovation 概念解释了一个反直觉的现象:看似微小的改动可以杀死巨头。Barnes & Noble把书运到几千家门店,"直接寄给消费者"听起来只差一步,但Amazon的配送中心看起来更像机场行李分拣系统,两个组织之间的知识距离因为这一个"小改动"变得极为遥远。

哈佛商学院教授Clayton Christensen的破坏性创新理论则解释了产业层面的指数增长。单条学习曲线终会趋平,但多代技术的更替让整体趋势呈指数。摩尔定律是多条S曲线的包络线。新技术刚出现时比现有技术差,晶体管收音机音质不如电子管,数码相机色彩不如化学胶片,但新技术天花板更高,两条曲线交叉的窗口就是颠覆发生的时刻。

斯坦福经济学家Nick Bloom指出,维持这种指数增长需要越来越大的团队。第一个晶体管是三个人做的:Brattain和Bardeen做出点接触晶体管,Shockley趁圣诞假期自己设计了替代方案。到Fairchild时代,1958年和1959年接连推出mesa晶体管、平面工艺和集成电路。Texas Instruments的Jack Kilby利用入职后暑假公司没人的空档,独自做出了集成电路。今天设计一颗芯片需要庞大的工程协作体系。如果协调能力跟不上,指数曲线最终可能趋平。

三、知识衰变与知识扩散

1、衰变速度远超直觉

自由轮船的数据显示知识月衰减3%到6%,年化约50%。宝丽来的技术积累极深,创始人Edwin Land从偏光膜起家,转向即时摄影后做到Ansel Adams这样的顶级摄影师专门使用宝丽来相机。但1990年代没能转向数码,此后逐步走向破产和关厂。Kaps买下的只是最后的组装工厂,上游供应链已经不存在了。知识衰变的对象不仅是人脑中的经验,还有整个协作网络和供应体系。

日本伊势神宫每20年重建一次,表面维护的是建筑,实际维护的是建造技术,每次重建都在训练下一代工匠。欧洲保护原始结构,伊势保存知识本身。

2、空间扩散受双重约束

知识扩散受地理距离和知识本身的几何结构双重约束。1975年美军撤出西贡后,大量越南人被近乎随机地安置到美国各地。经济学家Parsons和Vézina发现,1995年禁运解除后,当年接收了更多越南移民的州与越南的贸易量更大。人走到哪里,知识就扩散到哪里。

Hidalgo用猴子和森林来解释第二重约束。每个产业是一棵树,衬衫和女式衬衫紧邻,天然气在远处。国家是住在树上的猴子,经济发展就是跳到新树上。经济地理学把这叫相关性原则 principle of relatedness。二战后意大利被禁止制造飞机,飞机工程师D'Ascanio设计了Vespa踏板摩托。日本川西航空、德国亨克尔也从航空转向了轻型车辆。不同国家的公司被迫退出航空后全都跳到了同一个邻近区域,因为摩托车和飞机在产品空间中是邻居。

移民是打破这种近距离约束的关键载体。本地创业者擅长短距离跳跃,移民则更擅长帮经济体进入不相关领域。美国1970年代以后的诺贝尔奖得主中约60%到70%出生于国外或有移民经历。

四、知识的载体与知识的价值

1、知识需要"最低运载量"

威尔士企业家John Hughes 50多岁时获得在俄罗斯帝国乌克兰地区开发煤铁的特许权,装了数艘船载着一百多名工人和全套设备出发。三年后产出生铁,后来建起苏联最主要的钢铁产区之一。这座城市最初叫Yuzovka,就是Hughes的俄语音译,今天叫顿涅茨克。Hughes明白一个人的知识不够,需要数艘船的团队才能把能力从英格兰搬到乌克兰。

Samuel Slater则展示了知识扩散的另一面。他出生在英格兰Belper,14岁进入Strutt的水力纺棉工厂当学徒,升为监工。21岁时判断英国市场饱和而美国还没掌握这项技术,趁夜逃出Belper,在伦敦假扮农民登上开往纽约的船,66天后抵达。在曼哈顿一家工厂干了四天就辞职,没有水力驱动,机器不行。后来听说罗德岛Pawtucket有人在尝试水力纺棉但做不出足够结实的纱线,便前往,大约一年内建成了美国第一座成功的水力纺棉厂,启动了美国工业革命。此前Pawtucket的人根据苏格兰人的口述试图仿造,完全失败。必须有亲身在Arkwright和Strutt身边工作过的人到场才行,当时英国法律禁止将纺织技术带出国,Slater冒的是叛国罪的风险。

2、无限字母表:用复杂性预测未来

如果知识是一张无限扩展的字母表,评估经济潜力就变成了数字母。Hidalgo从出口数据构建"国家×产品"矩阵,归一化后提取一个向量,作为国家拥有多少种"字母"的排序指标。关键发现:这个指标能预测经济增长。按当前模型,中国增速向4%回归,下一波火箭是印度、印尼和菲律宾。

科威特收入极高但复杂性偏低,石油枯竭后收入会回落到人均GDP七千到一万两千美元。利比里亚贫穷但复杂性也低,收入和复杂性处于均衡。印度收入低但复杂性和土耳其差不多,按模型应向土耳其的收入水平靠拢。

五、制度与知识:中国故事

经济发展的两大流派争论"知识还是制度"。Hidalgo认为两者都重要,但因果可以互换。1970年代物理学家陈春先在北京造出中国第一座核聚变反应堆,用的是托卡马克技术,一种用强磁场约束高温等离子体的装置。他去美国考察后发现核聚变部件不是大工厂造的,而是教授创业的小公司。回国后他推动"教授创业"。

Hidalgo在播客中谈到中国时说:"China is not a country. China is a planet." 西方习惯以国家为单位思考,但中国的内部多样性相当于整个美洲加上西欧。

核心归纳

对政策制定者来说最重要的警告是:知识衰变极快、传播极难、无法用砸钱替代。布雷顿森林体系之后西方机构误以为"给钱就能发展",是因为战后欧洲知识存量完好,解除资金约束自然就恢复了。把同一套模型搬到知识存量薄弱的地区,效果截然不同。Yachay、Neom这类从零开始的"知识城"项目屡屡失败,原因也一样:它们违反了知识增长和扩散的基本规律,相当于不理解重力就去造火箭。

Q1: 为什么"写下来"不等于保存了知识?
知识的载体是人和团队的经验网络。宝丽来保留了全部设备、雇回了顶尖操作员,停产后知识依然大量流失,重建耗时十年。IBM曾有员工担心公开源码会让竞争对手获取全部知识,但代码只是存档记录,知识存在于编写和维护代码的团队生态中。

Q2: 一个国家的经济未来怎么预测?
看经济复杂性,也就是出口结构和产业分布中蕴含了多少种能力"字母"。字母数量超出当前收入预期的国家有增长动力。模型当前指向印度、印尼、菲律宾为下一波增长引擎。

Q3: 大语言模型拥有知识吗?
Hidalgo认为这个问题问错了。知识是集体现象,LLM是否有知识不重要,重要的是它是否提升了人类的集体学习能力。他搬到法国后用LLM了解当地税法,见会计师时能问出更好的问题。"Is it because the LLM has knowledge? Is it because I have knowledge? Or is it because we are wiser when we are together?"

发布于 韩国