OpenClaw 迭代速度一直很快。目前已经内置了视频、图片、音乐生成,能够直接通过对话出结果。视频支持 Grok、Runway、阿里万相、ComfyUI 四条线路,图片新增了参考图编辑,给一张 logo 它能出五种配色方案,20 秒全部搞定。音乐那边接了 Google Lirya、Minimax,甚至能丢一段参考音频进去让它生成风格相近的配乐。单说这些生成能力,跟直接用可灵、ChatGPT 比没太大优势,真正拉开差距的是智能体能读你本地文件。一句“把旅行文件夹里每张照片做 3 秒动画拼成短视频”就能端到端跑完,Runway 做不到这个。价值体现在那些需要自动化的工作。比如智能体每天自动读新闻、写摘要、生成 B-roll、配音乐,你一觉醒来,草稿就在那了。
它还集成了 Google Meet,能够直接作为参与者加入会议,实时记笔记,结束后输出摘要和行动项。你甚至可以让它自动加入日历中的所有会议。你没空参会的时候它替你去,回来看两分钟摘要就行,比 2 倍速看回放强太多。不过音频质量差的通话里转录准确度会打折扣,行动项最好自己过一遍。
记忆系统是 OpenClaw 最核心的功能。Active Memory 让智能体在对话中自己写压缩笔记,下次开新会话时自动拉取相关内容。代价是每轮对话多消耗 20% 到 30% 的 Token,长期项目值得开,一次性聊天建议关掉。“做梦”功能更有意思,智能体空闲时会自动整理记忆,丢弃过时信息,把反复出现的模式强化成持久记忆,跟人睡觉时大脑整合记忆的机制很像。这个功能需要时间积累,用一个月才能感受到效果。
#OpenClaw##智能体框架##AI创造营# http://t.cn/AXJnnrVn
发布于 上海
