爱可可-爱生活
26-06-18 21:32 微博认证:AI博主 2025微博新锐新知博主

【从对话框到控制权:Codex接管电脑的三种姿态】

AI正在从只会聊天的脑子进化成有手有脚的特工。Codex近期开放了欧盟和英国区的Computer Use权限,其核心价值在于它不再试图用一个方案解决所有问题,而是提供了三层递进的交互逻辑。

第一层是 ﹫Computer。这是最广义的视觉控制,它像人一样盯着屏幕、移动鼠标。虽然速度慢,但它能处理没有API的顽固软件,比如调系统设置、操作Spotify,甚至替你去跟亚马逊客服扯皮退款。

第二层是 ﹫Chrome。它继承了你的浏览器身份和登录态。优势是多标签协作和权限复用。处理Gmail邮件或Salesforce数据时,它比视觉模拟更精准,因为它理解浏览器逻辑而非简单的屏幕坐标。

第三层是 ﹫Browser。这是一个纯净的沙箱环境,最适合开发者调试本地代码或设计网页。你通过Appshot截图指点,它在隔离环境里即时修改,互不干扰。

AI Agent的进化不是为了取代API,而是为了填补API无法覆盖的荒原。当结构化工具失效时,视觉控制就是终极补丁。未来的核心竞争力,是懂得根据任务的身份敏感度、实时性要求,在不同交互表面间做精准调度。

x.com/jxnlco/status/2066970432855581052

#人工智能##AI创造营##Codex##Productivity##效率工具#

发布于 北京