林亦LYi 24-10-26 19:32
微博认证:数码博主 微博原创视频博主

商战就是这么的朴实无华:微软针对Claude Computer Use API 放出了OmniParser。

OmniParser 是一个通用的屏幕解析工具,它将 UI 截图解释/转换为结构化格式,以改进现有的基于 LLM 的 UI 智能体。

另外,微软之前就在Github开源了针对 Windows交互的多智能体框架UFO,旨在无缝地在单个或多个应用程序之间导航和操作。

OmniParser :http://t.cn/A6n4rMBA

UFO:http://t.cn/A6Yxv5Qx

发布于 天津