Google 发布了 OKF:给 AI Agent 的知识库统一格式标准
AI Agent 最大的瓶颈不是模型能力,是上下文。它不知道你的表结构是什么意思,不知道"周活"怎么算,不知道哪个 API 已经废弃了——这些知识散落在 wiki、代码注释、文档系统、老员工脑子里。
Google 最近发布了 OKF(Open Knowledge Format),想解决这个问题。
1. 它是什么
一个开放规范,把知识表达成一堆 Markdown 文件 + YAML frontmatter 的目录结构。每个"概念"(表、指标、接口、runbook)是一个文件,文件路径就是它的 ID,文件之间用普通 Markdown 链接互相引用,整个目录变成一张知识图谱。
这个思路来自 Karpathy 早些时候提出的 LLM-wiki 模式——与其每次让模型去搜文档,不如给它一个会自我生长的知识库。OKF 做的事是把这个模式标准化,让不同团队、不同工具、不同 Agent 产出的知识库可以互相读。
2. 设计原则
1)极简主义:整个规范只强制要求一个字段:type,其他全看你。
2)生产者和消费者解耦:人写的 wiki 可以被 Agent 读,Agent 生成的知识库可以被另一个 Agent 消费,格式是契约,工具各自独立。
3)不绑定任何平台:不需要账号、不需要 SDK、不需要 Google 的任何服务,就是一堆文件。
3. 附带的参考实现
1)一个 BigQuery 数据集自动扫描 Agent,能给每张表生成 OKF 文档,并爬文档补充 schema 和 join 路径
2)一个静态 HTML 可视化工具,把 OKF 目录渲染成交互式知识图谱,单文件,无后端
3)三个示例数据集:GA4 电商、Stack Overflow、Bitcoin 公开数据集
访问:loud.google.com/blog/products/data-analytics/how-the-open-knowledge-format-can-improve-data-sharing/
#HOW I AI# #程序员#
