华人团队开源OpenClaw-RL框架

【华人团队打造养虾神器，开源OpenClaw-RL框架，让AI边用边学】

过去一周全网都在养那只红色卡通龙虾 #OpenClaw# 。作为能够自己动手干活的 AI 智能体，有人花几千块请它回家，几天后账号被盗、文件被删，又花几百块请人卸载。从排队安装到扎堆卸载只隔了一周。

虾到底该怎么养？#北京大学# 博士、美国普林斯顿大学博士后研究员杨灵（合作导师为王梦迪教授）和团队成员（王胤杰博士等人）给出一个让虾越养越好、越养越聪明的答案。

几天前，杨灵等人发布了一个名为 OpenClaw-RL 的开源框架，核心逻辑非常简单但颇具洞察，你和 AI 的每一次对话本身就是最好的训练数据。这套系统让 AI 正常服务用户的同时，后台有四个完全解耦的模块在异步运转：策略服务、轨迹收集、过程奖励评估与参数训练，彼此互不阻塞。

杨灵告诉 #DeepTech# ：“我们这次聚焦的是个性化场景下的在线强化学习。这个方向之前很少有人系统性地研究，主要原因是缺少自然产生的交互数据，学术界很难构造可复现的 benchmark，工业界也缺少端到端的训练闭环。”

戳链接查看详情：http://t.cn/AXfhq4Ou