马力AI和商业思维
26-06-17 20:33 微博认证:知群 CEO 微博新知博主

同一个 bug,普通 Claude 用69个词解释,有人把它调成只用19个,答案一模一样。

省下的那一多半字,就是省下的钱。

这是个叫 caveman 的开源小工具(GitHub 上7.2万颗 star),干的事说出来有点好笑:它让 AI 像穴居人那样说话,砍掉所有客套、虚词、铺垫,只剩技术内核。它自己的口号挺传神——脑子还是大脑子,嘴变小了。

先说为什么这能省钱,因为很多人没认真算过这笔账。你用 Claude Code、Cursor 这类工具写代码,背后是按 token 计费的(token 你可以理解成 AI 嚼字的最小单位,差不多几个字符算一个)。这里有个容易被忽略的点:AI 吐出来的字,通常比你输进去的字要贵。说白了,它回你的话越长,烧钱越狠。它每多说一句「好的,我很乐意帮你看看这个问题」,你就多付一点,一天下来废话的钱真不老少。

caveman 干的就是把这些废话掐掉。举两个它说明里的真实例子,你就明白它狠到什么程度。

你问 React 组件为什么反复重渲染,正常的 Claude 会写一大段:你的组件重渲染,很可能是因为每次渲染都创建了新的对象引用,当你把内联对象当作 prop 传进去,React 的浅比较会认为它每次都是不同的对象,于是触发重渲染,建议用 useMemo 把它缓存起来。这一段,69个 token。装上 caveman 之后它只回一句:每次渲染产生新对象引用,内联对象 prop 等于新引用等于重渲染,用 useMemo 包起来。19个 token,结论一字不差,代码该怎么写还怎么写。

再比如你报个 bug,正常版先来一堆「没问题!我很乐意帮你,你遇到的问题很可能是鉴权那块没有正确校验 token 过期……」caveman 版直接两句:鉴权中间件有 bug,过期判断该用小于号、不是小于等于号,改法如下。客套全没,干货全在。

它自己在介绍里最醒目的数字,是最高能省到大约75%的输出 token;README 后面的基准表又给了一组平均65%的口径。这点得说清楚:省的是 AI 吐出来的那部分,你发给它的代码和问题(也就是输入)该多少还是多少。所以它不是万能省钱药,是专治「AI 回话太啰嗦」这一种浪费。

我觉得它最贴心的是分了四档,一条命令就能切,你按自己的承受度挑。最轻那档只去掉填充词,读着基本正常,适合还想要点人话的;默认档是标准穴居人腔,省得明显又看得懂;再狠一档是电报式,几乎只剩关键词,适合自己很懂、扫一眼就行的老手。

最后一档对中文用户是个惊喜,文言文。让 AI 用文言回答,比大白话还省字。虽然我不确定多少人真会天天让 AI 之乎者也(读起来确实有点上头),但作为省 token 的思路,它是真成立的。

它还有个细节做得好:压的是说话的「风格」,不是你的语言。你用中文它就用中文给你压,用葡萄牙语就压葡萄牙语,代码、命令、报错原文一个字不动——这些要是动了就出事了。

装起来不费劲,一行命令跑下来大概半分钟,它会自动找到你电脑上所有支持的 agent 装好。而且不只 Claude Code,Codex、Cursor、Gemini、Copilot 这些主流的编程助手,三十多个它都能装。想用打一句 /caveman 就开,想让它好好说话,说句 normal mode 就切回来。作者还顺手做了个更狠的版本,干脆把整个编程 agent 都按这套思路重写了一遍,那是另一个项目,这里就不展开了。

当然,这东西不是人人都该装。它把回答压成只剩结论和代码,对已经懂、只想拿到答案赶紧干活的人是爽;可你要是新手,正指望 AI 把原理掰开揉碎讲给你听,它这么一精简,反而把你要的解释也省掉了。它宣传的最高省约75%、平均约65%、提速约3倍、准确率100%,都是项目方自己测的数,实际能省多少,还得看你怎么用、用哪一档。

它是开源项目,MIT 许可,GitHub 上就叫 caveman,作者是 JuliusBrussee。

说到底,这是个挺机灵的小东西。AI 越用越贵这件事上,大家都在想办法,有人去换便宜模型,有人去抠提示词,它倒选了个最朴素的角度,让 AI 少说废话。这道理放哪儿好像都对。

#马力的AI知识分享#
#马力的AI开源项目分享#

发布于 北京