【华人团队打造养虾神器,开源OpenClaw-RL框架,让AI边用边学】
过去一周全网都在养那只红色卡通龙虾 #OpenClaw# 。作为能够自己动手干活的 AI 智能体,有人花几千块请它回家,几天后账号被盗、文件被删,又花几百块请人卸载。从排队安装到扎堆卸载只隔了一周。
虾到底该怎么养?#北京大学# 博士、美国普林斯顿大学博士后研究员杨灵(合作导师为王梦迪教授)和团队成员(王胤杰博士等人)给出一个让虾越养越好、越养越聪明的答案。
几天前,杨灵等人发布了一个名为 OpenClaw-RL 的开源框架,核心逻辑非常简单但颇具洞察,你和 AI 的每一次对话本身就是最好的训练数据。这套系统让 AI 正常服务用户的同时,后台有四个完全解耦的模块在异步运转:策略服务、轨迹收集、过程奖励评估与参数训练,彼此互不阻塞。
杨灵告诉 #DeepTech# :“我们这次聚焦的是个性化场景下的在线强化学习。这个方向之前很少有人系统性地研究,主要原因是缺少自然产生的交互数据,学术界很难构造可复现的 benchmark,工业界也缺少端到端的训练闭环。”
戳链接查看详情:http://t.cn/AXfhq4Ou
