郑昀 26-02-25 17:10
微博认证:云纵世纪(天津)数字科技有限公司CTO

#昀哥亲历# Claw们是不是都不太擅长在Windows桌面上处理文件路径和文件[允悲]

AI模型基本都是在Linux/macOS环境下训练和测试的,对Windows的“坑”缺乏免疫力。
以有道小龙虾LobsterAI为例,还没正式干活,它光是与PDF文件路径和格式搏斗就消耗了几块钱的Tokens[允悲],所以总结一下目前Windows桌面Agent的通病:

一、遭遇微软特色路径与编码的“双重暴击”[允悲]
1.中文路径与特殊字符:
看图一,文件名里有中文(“人类处理信息有‘多模态’吗?”)和标点符号(问号、引号)。在Windows的旧式文件系统(NTFS)中,这些字符虽然能显示,但在命令行或某些底层API调用时,很容易因为编码格式不匹配(GBK vs UTF-8)导致路径解析失败。
2.转义字符的噩梦:看图二,Windows路径使用反斜杠,而Python中反斜杠是转义符。AI生成的代码如果没处理好转义(比如把 C:\Users\...写成 C:\\Users\\...或者用原始字符串),就会直接报错。图中它尝试用 Bash命令(ls)去读取Windows路径,“水土不服”。

二、“想太多”导致的逻辑死循环
截图里最特么有意思的是,它在找不到文件后,试图在Windows环境下用 Glob(通配符搜索)和 Bash命令去“猜”文件位置,“Windows的心思你别猜,猜来猜去也猜不出来”,这种“为了自动化而自动化”的无限展开,让我出门的时候真的担心收到模型余额报警。

三、权限与沙盒限制
1.临时文件陷阱:图三显示文件被保存到了 `AppData\Local\Temp\lobsteraI\attachments`这种深层临时目录。这种路径通常很长,且包含随机字符串,Agent很容易在拼接路径时出错,或者因为路径太长(Windows有260字符限制)而无法访问。
2.权限墙:Windows对文件系统的访问权限控制非常严格。AI Agent通常运行在受限的沙盒环境中,可能没有权限直接读取用户目录下的某些文件,或者需要管理员权限才能执行某些操作。

四、遇到问题也不反馈只知道闷着头干
让它做科学研究,它一上来发现“WebSearch 不可用。”(看图四),也不知道反馈一下,就擅自决定“让我继续深入分析PDF内容,并开始制定PPT大纲”。
还是我出门回来后翻看它的工作记录,问它“WebSearch 不可用,需不需要我帮你解决”,看图五,它还是咬牙坚持“要么你自己手动搜索,要么我还是继续用你那点儿可怜的初始资料”。
最后还是我发现LobsterAI默认是“本地运行”,此时它似乎不能做“实时搜索”,当agent调用WebSearch工具时,系统返回"Tool blocked by app policy: WebSearch/WebFetch are disabled in this environment"。需要修改沙箱配置,改为“自动(优先沙箱)”。沙箱环境安装完毕,再问它,它就可以实时搜索(就是启动一个edge浏览器开始搜索)了。

五、沙盒重启?记忆丢失?
最可气的是沙盒环境重启,咱引以为傲的“长期记忆”彻底丢失(看图六)……相当于一个实习生春节回来连电脑密码都忘记了。

我真的,只能用图七的表情包了。

发布于 北京