向度之桥 26-03-17 18:03
微博认证:科技博主

好家伙,阿里这次是真把钉钉拆了重建。

今天阿里发了悟空,全球首个企业级AI原生工作平台。

发布会上陈航说了句话:"我们把钉钉打碎了"。

8 亿用户的产品,底层代码全部重写,从 GUI 改成了 CLI。

为什么?

就为了让 AI Agent 不用再像人一样去点按钮,而是直接用命令操作系统。

这事儿表面上看是个产品升级,但我觉得它其实指向了一个更大的趋势:GUI 这个东西,可能真的要走到头了。

1

你仔细想想,GUI 的本质是什么?

是因为机器不会说人话,所以我们得学机器的交互方式——学怎么用菜单、学怎么点按钮、学各种操作逻辑。

每换一个 App 就得重新学一遍。我们这些年花在"学软件怎么用"上的时间,其实都是在给机器的笨买单。

但 Agent 时代不一样了。

当 AI 能真正听懂自然语言的时候,人只用管一件事:把问题说清楚。

剩下的,Agent 自己去想怎么拆解任务、调什么工具、走什么流程。

而它跟工具之间的沟通方式,天然就该是 CLI 甚至是二进制——因为那才是机器之间最高效的语言。

所以钉钉把自己从 GUI 改成 CLI,本质上不是在"降级",而是在顺应一个底层逻辑的翻转:以前是人去适应机器,以后是机器来适应人。

中间那层为人类设计的图形界面,反而成了多余的翻译层。

2

网上有个观点说"现存的程序员其实才是阻碍 Agent 技术发展的最大阻力",笑死,但细想确实有道理。

我们还在用人类的思维去搞软件设计——什么模块化、什么用户体验、什么交互规范。

但 Agent 根本不是这么理解赛博世界的。它不需要漂亮的界面,不需要引导流程,它需要的是能被高效调用的接口和清晰的权限边界。

3

回到悟空本身,阿里的牌面确实亮得很齐。

前一天刚成立了 ATH 事业群,吴泳铭亲自挂帅,把造模型的、送模型的、用模型的全拧成一股绳。

千问打 C 端声量,悟空吃 B 端场景——这套组合拳打的是"AI 进厂"的生意。

但说实话,市面上做 Agent 平台的不少,为什么我觉得悟空有点不一样?

因为企业级 Agent 最难的从来不是"AI 能不能干活",而是"它能不能在企业里安全合规可审计地干活"。

权限谁管?数据谁控?操作谁审?成本谁算?

这些问题你让一个个人级的 Agent 产品来答,根本答不上来。

但钉钉花了十一年,把组织架构、权限体系、审批流、数据资产这些苦活全干完了,所有操作在安全沙箱中运行,Token消耗一目了然。

悟空长在这套体系上面,生下来就带企业级基因,这个先发优势不是谁想追就能追的。

4

再加上阿里整个生态的 B 端能力——1688 的供应链、淘天的电商体系、支付宝的金融能力、阿里云的技术底座,都会以 Skill 的形式接入悟空。

它的野心不是做一个 AI 工具,是做 AI 时代的"toB 淘宝":一个技能市场、一个流量入口、一个生态平台。

这场仗才刚开始,但方向已经很清楚了:未来我们跟数字世界的交互方式,会彻底变掉。不是学操作,而是说需求。

不是点按钮,而是表达意图。

发布于 上海