马力AI和商业思维
26-06-26 12:26 微博认证:知群 CEO 微博新知博主

让 AI 帮你查个资料,最容易卡住的地方,是它打不开那些要登录才能看的页面。

公开网页它能搜、能读,可一旦内容藏在登录后面,或者那个页面得点几下、等它动态加载出来,AI 就抓瞎了。最近看到一个给 Claude Code(Anthropic 出的一款 AI 编程助手,跑在命令行里)补这块短板的东西,叫 web-access。装上它,Claude Code 就从「只会搜搜公开页」变成「能替你登录进去、把要交互的页面也读下来」,做调研、查内部资料这类活,能省掉你不少手动复制粘贴的工夫。

它不是一个单独的软件,是给 Claude Code 加的一项技能(这类给 Agent 加的本事通常叫 skill)。装进去之后,Claude Code 多了一身上网取数的本事,你照常跟它说话,它自己判断该怎么联网。

先说清楚它跟另一类工具的区别,免得搞混。有些工具是让 AI 替你动手操作浏览器,点按钮、填表单、把东西加进购物车,重点在「替你做网页上那些重复的机械活」。web-access 不是干这个的。它的重点是让 AI 自己会上网查东西、把查到的内容读回来给你用,是给 AI 供料,不是替你点鼠标。一个是手,一个是眼睛和腿,方向不一样。

它最核心的设计,作者叫「三层通道」。说白了就是 AI 上网取数有三条路,它会自己看情况选,也能几条混着用。

第一条最轻,就是普通的网页搜索和抓取,对付公开静态页面够用了。第二条稍微特别一点,用 curl 这类命令、或者接一个叫 Jina 的服务,专门抽取某些特定格式的内容,能帮着省点 token(也就是省点跟 AI 对话的成本,这条是可选的)。第三条是真正拉开差距的地方:它通过 CDP(浏览器调试协议,简单说就是一个能远程操控浏览器的官方接口)直接连上你本机那个已经登录好的 Chrome 或者 Edge。

连上你自己登录的浏览器,意味着什么呢?意味着你账号能看到的内容,它也能看到。要登录的后台、动态渲染出来的页面、得交互一下才出来的信息,原来 AI 够不着的,现在顺着你的浏览器就读进去了。

举几个具体点的场景你就明白这层差别有多大。比如公司内部的某个系统、某个后台,外面的搜索引擎根本搜不到,以前你只能自己一页页翻了贴给 AI;现在它能顺着你登录的浏览器直接进去读。再比如几家产品横向对比,每家的资料分散在各自要登录的页面里,它能一次性都给你拢回来。还有那种你之前看过、却忘了存哪儿的页面,它能去翻你浏览器的历史帮你找回来。这些活的共同点是:信息不在公开网页上,而是藏在「你登录后才看得见」的地方。

操作页面这块它也留了余地。光能读还不够,有时候得点一下、传个文件才出得来内容,它准备了三种点法——直接用网页脚本点、模拟真实鼠标去点、还有上传文件。不同网站脾气不一样,一种点不动还能换一种试,多一层兜底,但也不是保证哪个网站都能点得动。

打个比方,Claude Code 自带的联网,有点像只会开个没登录的无痕窗口随便搜搜;装上这个 skill,相当于给它配了一双能用你的账号登录、还能同时开好几个窗口干活的手。

并行这块也确实有点东西。你要是一次性让它查好几个目标,它会派出几个分身同时去查,共用同一个代理通道,每个分身占一个独立的标签页互不打架。要查的东西多的时候,这个比一个一个排队过来要快不少。

还有两个细节我觉得挺实用。一个是它会按网站「攒经验」——同一个域名,这次摸清楚了它的脾气、URL 的规律,下次再来就不用重新试,跨会话能记住。另一个是它能翻你本机浏览器的书签和历史,你之前看过存过的东西,它能帮你找回来。另外从网页上直接把图片、视频地址抠出来,甚至按时间点去抓视频某一帧,它也能做。

好话说完,门槛也得说。

它的门槛不算高,但也不是零。装它最省事的办法是一行命令搞定,你也可以让 AI 自己去装,或者走 Claude Code 的插件市场。但前提是你得装好 Node.js(22以上的版本),还得把浏览器的远程调试打开,更别说你本来就得是 Claude Code 的用户。这一套配下来,对完全不碰命令行的人,光环境就够卡一阵。它基本是本地跑、免费的,不强制你去买什么付费接口,这点还好。

另一个更要紧的提醒,是作者自己在说明里特意标出来的:在社交平台上跑这种浏览器自动化,比如拿去操作小红书,有被限流甚至封号的风险,建议你用小号试,别拿主力账号去冒险。这话我觉得得当真,平台对自动化行为一向敏感。

还有个细节值得提一句。作者在说明里特意讲,它的设计是「让 AI 像人一样思考」,给的是判断的思路,不是一步步的死流程。很多自动化工具是你把步骤定死、它照着跑,一旦页面变了就僵在那儿;它反过来,碰上没见过的页面能自己琢磨该走哪条路。好处是灵活,代价是结果不像写死的脚本那么稳,这一点心里有数就行。

这是个2026年3月才开的项目,到现在攒了7000多颗 star,5月中旬还更新过,源码是公开的,README 里标的是 MIT。开源圈里这个热度,说明确实有不少人吃这一套。

它解决的就是一个很具体的痛点:你已经在用 AI 帮你干活了,可它老在「打不开那个页」这种地方卡壳。把这层补上之后,AI 能替你够到的信息,一下子宽了很多。当然它也不是装上就万能,网页这东西本来就杂、就爱变,能省多少事,还得看你手上的活对不对它的路子,自己用一阵才知道。

它在 GitHub 上叫 eze-is/web-access,作者一泽 Eze(账号 eze-is)。名字太短容易撞,认准 eze-is/web-access 这个全名,别点错到同名的库去。

#马力的AI知识分享#
#马力的AI开源项目分享#

发布于 北京