Ontology(本体)是今天企业 AI 最热的词之一。但第一个看见这件事的人,是万维网之父。这是关于这个词、和它真正源头的故事。
二十多年前,万维网之父蒂姆·伯纳斯-李(Tim Berners-Lee)提出过一个超前的设想,叫“语义网”(Semantic Web)。
他的愿景很简单:互联网不该只是把网页连起来,还该让机器理解网页里那些事物之间的意义和关系——不只是看到“张三”“合同”“客户”几个词,而是真懂张三是谁、这份合同属于哪个客户、这些关系意味着什么。
用今天的话说,他早在二十多年前,就看到了“本体”(Ontology)的必要性。
这个方向是对的。我和他本人聊过两次,恰好相隔整整四年,完整看到了这个想法从“被遗忘”到“被重新发现”的全过程。
第一次:2022 年 7 月,伦敦,一顿早餐
那时 ChatGPT 还没问世。我问他:为什么他发明的语义网(Semantic Web)、和支撑语义网的描述语言 RDF,始终没能像万维网那样普及?
他放下咖啡,沉默了一下。
“不是方向错了,是表达方式出了问题,”他说,“当年要让机器读懂这些关系,我们只有 RDF——你得把每一个概念、每一段关系,都翻译成严格的机器规则。一句你随口能讲清的话‘456 号合同属于瑞通,账期九十天,超过一百万要过合规’,到了 RDF 里,要拆成一堆三元规则,每个概念单独标注。”
“可现实世界从来不干净,”我接话,“一个客户三个叫法,一份合同五个版本,同一个词在两个部门意思都不一样。形式化最怕模糊和例外,而真实企业里全是模糊和例外。”
他坦率地点头:“所以它对数据洁净度、对人的专业性要求太高。漏一个例外,整套就崩。建一套要六到十八个月,做出来业务的人看不懂、也改不动。”
我说:“那它就卡死在一条线上了——一张本体地图能不能活,标准只有一条:懂业务的人,能不能自己读它、画它、改它。RDF 没迈过这道坎。”
他说:“但更让我难受的,是技术背后那场‘冷战’。”
这我特别了解,因为这场“冷战”我有从头经历。我说:“那几十年,AI 内部一边信专家规则,一边信机器学习。后来机器学习赢了,而且赢得太彻底。”
他点头:“彻底到,它在泼掉‘规则太僵硬’这盆脏水的时候,把水里那个孩子,也一起泼了出去。”
“那个孩子,叫‘让机器掌握结构化知识’,”我说,“它本身从来没错,错的只是实现方式太硬。如果当年做机器学习的人没把它一起泼掉,而是接住、当地基,那么‘机器学习 + 结构化知识’这场必然的和解,本可以早来整整一代人。可‘冷战’让两边都变得盲目。”
桌上安静了一会儿。我心里有些复杂:当年我站队站得那样坚定,他会不会怪我。可他从来不是这场战争里的对手——他是从互联网那一端走来的,想的是怎么让机器读懂网页背后的意义,他也从没否定过机器学习;只是他那个关于“意义”的想法,恰好被卷进了这场路线之争的余波里。好在他的万维网,已经把他的名字永远刻进了历史。
早餐快结束时,他望着窗外说:“也许语义网需要等待一种更自然的实现方式。而那种方式,也许还没有到来。”
我当时没想到,这句话四年后会有答案。
第二次:2026 年 6 月,伦敦,再见
四年过去,大模型改变了世界。这次见他,我想讲清一件事。
“语义网的需求从来没错,”我说,“过去卡住它的不是方向,是‘输入’——机器不懂人话,只能逼人去迁就机器。今天,大模型第一次能听懂人本来就在说的语言。于是那张地图,终于可以用自然语言来画了。”
“是的,”他说,“当年做 RDF,技术理解不了自然语言,只能发明规则。今天用大模型和自然语言来画这张图,是对的方向。”
“其实这一刻,是吵了几十年的两条路线第一次真正握手,”我说,“机器学习负责听懂人话,结构化本体负责把意义固定下来。神经网络的柔和符号系统的刚,本该早早合流。”
“它来了,”他笑了笑,“只是来得晚了一些。”
然后他停顿了一下:
“重要的不是谁先想到,而是这件事终于能被做成了。”
这个词,到底从哪来
说到这里,得点一段历史。
“本体”这个词能传遍今天的企业 AI 圈,靠的并不是伯纳斯-李,而是 Palantir——是它把企业本体做成了产品、做成了生意,让 Ontology 成了人人挂在嘴边的词。从这个意义上说,Palantir 是企业本体当之无愧的鼻祖,我们这些后来者,都是它的学习者。
而伯纳斯-李,是这个想法最早的源头。他看见“让机器理解意义”这件事,比所有人都早了二十年。
那这一代的不同,又在哪里?最能看出区别的,是“画图”这一端。Palantir 那张本体地图,今天主要还是靠派驻的工程师,和客户一起、用形式化的方式搭出来的;而这一代想做的,是让最懂业务的人,用自己的大白话,就能把这张图亲手画出来、读明白、随时改一个字。
“输入得容易”,恰恰是我和伯纳斯-李那天早餐谈的核心,也是语义网当年倒下的地方。
历史给一个词命名的,往往是把它做成产品的那一个,而不是最早想到它的那一个。有人把今天这个方向叫 Ontology 2.0,也有人叫 Natural Language Ontology。
若没有当年那场“冷战”,它本该顺理成章地接在 RDF 后面,叫 RDF 2.0、再到 RDF 3.0。但历史走了另一条路,于是今天这个真正的突破,最终站在了 Palantir 打下的词汇地基上,叫 Ontology 2.0。
这个名字是历史偶然的结果,却也将成为 AI 时代最重要的技术词汇之一。
而那位二十多年前第一个看见这件事的人,此刻正坐在伦敦的某个地方,平静地说:
重要的是,这件事终于能被做成了。
