【Google Gemini:从对话接口到Agent操作系统的跨越】
Google AI Studio 宣布 Interactions API 正式进入 GA 阶段,这标志着 Gemini 的开发范式发生了位移:从“对话优先”转向“任务优先”。
以往调用大模型更像是在操作一个聊天框,而新的接口将模型推理与 Agent 执行深度融合。开发者现在只需几行代码就能调用自带远程 Linux 沙箱的 Managed Agents,处理网页浏览、代码执行等复杂任务。最值得关注的底层逻辑是它废弃了传统的 Role(用户/助手)架构,改用 Step(步骤)模式。这种设计将思考、工具调用和输出解耦,让 Agent 的每一个动作都变得可追踪、可编程。
Google 正在把 AI 基础设施变成一种“异步服务”。通过 background 模式和 Flex 计费模式,长耗时的深度研究或媒体生成任务不再需要客户端死守连接。这种转变意味着大模型不再只是一个聪明的组件,而是一个能自主管理环境和状态的独立执行单元。对于开发者来说,这降低了构建复杂 AI 应用的门槛,但也意味着必须适应从“写 Prompt”到“编排工作流”的思维转变。
blog.google/innovation-and-ai/technology/developers-tools/interactions-api
#人工智能##AI创造营##Gemini##Agent##开发者#
发布于 北京
