商战就是这么的朴实无华:微软针对Claude Computer Use API 放出了OmniParser。
OmniParser 是一个通用的屏幕解析工具,它将 UI 截图解释/转换为结构化格式,以改进现有的基于 LLM 的 UI 智能体。
另外,微软之前就在Github开源了针对 Windows交互的多智能体框架UFO,旨在无缝地在单个或多个应用程序之间导航和操作。
OmniParser :http://t.cn/A6n4rMBA
UFO:http://t.cn/A6Yxv5Qx
发布于 天津
