按理说现在不需要翻译了, AI 就翻译的挺好,不过在 Hacker News 首页上读到的这篇文章,我还是想翻译推荐下——一家几十人公司的内部 Agent 怎么落地?都在谈企业 Agent,谈真正落地的经验的不多:
1. 这篇我觉得值得读,不是因为它把 Agent 写得多厉害,而是因为它把很多人嘴上说的东西,真的做出来了。我自己也在做一些内部的 AI 系统,读的时候就深有同感。先说最直观的一点:它看起来很真。作者写的是一套已经塞进公司日常的系统。CEO 在 AE 会议前问一句"这个季度纽约地区客户最多的反对意见是什么",半分钟后就拿到横跨 Salesforce、工单和通话转录的答案。BDR 团队碰上钓鱼攻击,本来要花一天重建时间线,结果一小时做完。商务拓展带回 280 个参会名单,Voltaire 几分钟补全 CRM 映射和联系方式。这些例子一摆出来,你大概就知道它不是在卖概念。
2. 再一个是信任。文章里最有价值的,不是那种"减少幻觉"的空话,而是怎么把信任做成产品机制。每个回答都带来源,文档能点回原文,SQL 直接摆出来给人看;碰到个人敏感信息,也不是一句"无权限"就打发掉,而是退一步给匿名 ID 的同类分析。还有一个判断我很认同:很多时候答错,不是模型不够强,而是路由错了。收入问题就该进 BigQuery,不该进代码库 Agent。"Agent 连错三次就没人再用了"——搞企业内 Agent 的都应该心有戚戚焉吧。
3. 第三个点是底座比 Agent 本身更难,也更值钱。Voltaire(这套系统的代号) 两周半搭完,前面的数据基础设施做了两年(做基础设施的看到这句话很😄)。Salesforce、Zendesk 和一堆内部工具先得灌进 BigQuery,dbt 和字段级文档要补齐;Google Drive 里 25 万多个文件也不是丢进向量库就完了,还得把权限、标签、摘要和相似关系整理出来,做成可离线加载的知识图谱。真正费力的地方都在这里。Agent 只是把这些东西接起来。
4. 最后是起步顺序。作者没劝你先做一个无所不能的 Copilot,而是先把自然语言转 SQL 这件事做对,比如回答"Q1 续约学区的净收入留存率是多少"。原因很简单:结构化数据最好验,SQL 错了能查,数字不对能 debug。信任不是靠 prompt 写出来的,是靠这种可验证性一点点攒出来的。这个点站稳了,再往上加文档、工单、代码和会议记录,才会越做越顺。
原文:http://t.cn/AXMf0Dlm
我的翻译:http://t.cn/AXMf0Dlu
发布于 浙江
