艾瑞网
26-06-25 11:21 微博认证:聚合互联网数据资讯,融合互联网行业资源的国内新经济门户。

#Google##Gemini##AI智能体##计算机视觉#
【功能发布:谷歌Gemini 3.5 Flash内置计算机操作能力,覆盖桌面端】
6月24日,谷歌在其官方博客宣布,将"计算机操作"(Computer Use)功能作为内置工具集成至Gemini 3.5 Flash模型。该功能此前以专用模型Gemini 2.5 Computer Use的形式独立提供,如今已原生整合至主力Flash模型,支持浏览器、移动端和桌面三大平台。开发者可通过Gemini API及Gemini Enterprise Agent Platform调用。安全方面,模型经过针对性对抗训练以降低提示注入风险,并新增操作确认机制和注入检测自动中止两项企业级可选保护功能。
将屏幕操控从实验性专用模型升级为主力模型的标准内置工具,标志着谷歌在AI智能体方向上迈出关键一步。该功能采用"观察屏幕→推理操作→执行反馈"的循环机制,聚焦软件持续测试、跨应用知识工作等长周期企业自动化场景。此举与Anthropic的Computer Use和OpenAI的Operator形成三足鼎立之势,表明"让AI直接操作计算机"已成为头部AI公司的共识方向。

发布于 北京