#Google##Gemini##AI智能体##计算机视觉# 【功能发布：谷歌Gemini 3.5 Flash内置计算机操作能力，覆盖桌面端】 6月24日，谷歌在其官方博客宣布，将"计算机操作"（Computer Use）功能作为内置工具集成至Gemini 3.5 Flash模型。该功能此前以专用模型Gemini 2.5 Computer Use的形式独立提供，如今已原生

#Google##Gemini##AI智能体##计算机视觉#
【功能发布：谷歌Gemini 3.5 Flash内置计算机操作能力，覆盖桌面端】
6月24日，谷歌在其官方博客宣布，将"计算机操作"（Computer Use）功能作为内置工具集成至Gemini 3.5 Flash模型。该功能此前以专用模型Gemini 2.5 Computer Use的形式独立提供，如今已原生整合至主力Flash模型，支持浏览器、移动端和桌面三大平台。开发者可通过Gemini API及Gemini Enterprise Agent Platform调用。安全方面，模型经过针对性对抗训练以降低提示注入风险，并新增操作确认机制和注入检测自动中止两项企业级可选保护功能。
将屏幕操控从实验性专用模型升级为主力模型的标准内置工具，标志着谷歌在AI智能体方向上迈出关键一步。该功能采用"观察屏幕→推理操作→执行反馈"的循环机制，聚焦软件持续测试、跨应用知识工作等长周期企业自动化场景。此举与Anthropic的Computer Use和OpenAI的Operator形成三足鼎立之势，表明"让AI直接操作计算机"已成为头部AI公司的共识方向。

发布于北京