这几天实测了一大波 AI Agent,结论:在当前的时间点,Manus 仍是断崖式领先 !
1、Manus:满分100,我给101分 !跑了一个pdf银行流水转Excel的任务,免费的Lite模型有瑕疵,付费的常规模型极其惊艳 ,不仅识别极其准确,而且在没有任何指令的情况下,把表格里的“收入”和“支出”标上了不同颜色,情绪价值到位!做PPT也真的可以一句话就生成一个能看的PPT。
2、ChatGPT Codex:99分,发挥非常稳定,中规中矩地完成了PDF转Excel表格的任务,不搞花里胡哨的 ,考虑到20美元包月的价格,真心不错。
3、MiniMax:状态极易“迷路” 。第一次转Excel中规中矩,让修改一下结果原文件直接弄丢了,程序在后台死循环干跑看不见成果 。开了最便宜的会员,可以做出来一个堪用的PPT。
4、Kimi:花199元开个第2贵的会员,一个月只用了19%额度 ,Agent群聊功能情绪价值给得很足,但实际使用就那样;跑pdf转Excel任务中规中矩完成了,做PPT直接崩盘惨不忍睹 。结论:普通PDF转Excel买最便宜的39元基础档就够了 。
5、阿里 Qoderwork:“Token刺客” ,传个pdf文件,让写个总结,卷宗没读完,300免费额度就光了,开会员的话,20美元才2000积分,直接毫无付费欲望 。
6、Claude第三方工作流 + DeepSeek模型:往上吹成神,实际用下来,直接弱智儿童,权限请求陷入死循环,跑个最简单的PDF转Excel的任务,一直在要权限,完全没有进展。
7、Gemini(Chat,非Agnent):遭遇经典幻觉,假装生成好了,结果根本没下载按钮,按它的指引转CSV格式打开后全是一团乱麻 。
总结:对于文科生和法律人来说,我们不需要懂怎么配Python沙箱,我们需要的是能直接听懂人话、具备业务预判能力的“全局智能体(Global Agent)” 。能帮你干活的绝不是单纯的聊天机器人,在这点上,Manus 确实好用,Meta花20亿买不亏,国家出手干预也很及时。
#AI测评 #法律科技 #Manus #大模型实测 #SaaS避坑 #办公神器
发布于 浙江
