Simon的白日梦 25-04-17 11:59
微博认证:科技博主

这个有点意思哈哈~用微信记录克隆一个自己~

WeClone:从微信聊天记录打造数字分身的一站式方案(WeClone: One-stop Solution to Create Digital Avatars from WeChat History)
🧐 通过微调大语言模型和语音克隆技术,WeClone 实现从微信聊天记录中创建可聊天、会“说话”的数字分身,支持多平台部署。
➡️链接:http://t.cn/A6rxQr68
✨重点

●🧠 全链路数字分身构建方案:包括聊天数据提取(使用 PyWxDump)、预处理(包括敏感词过滤)、微调训练(支持LoRA/QLoRA)和部署环节,形成完整工作流。
●💬 微信聊天数据微调LLM:项目默认支持 ChatGLM3-6B 作为基础模型,通过用户微信聊天数据微调,形成个性化对话风格的语言模型。
●🎧 声音克隆功能(WeClone-audio):利用微信语音消息配合 0.5B 语音模型,实现高质量语音克隆,使数字分身不仅“说话像你”,还能“声音像你”。
●🤖 跨平台部署:数字分身可绑定至 QQ、Telegram、企业微信、飞书等平台机器人,真正实现随时随地陪伴式交互。
●💻 硬件与显存需求:推荐使用 LoRA 微调方式,最低仅需 16GB 显存,支持 QLoRA 压缩以适应更小显卡。详细列出不同模型精度与大小的显存需求表。
●🛠️ 灵活配置与多模型支持:核心配置集中于 settings.json,可根据自身数据修改训练 epoch、LoRA 参数,支持替换为 Hugging Face 或魔搭社区模型。
●📊 数据处理自动化:使用时间窗口策略提取问答对,后续计划支持大模型辅助清洗;支持个性化问答风格设定。
●🚀 部署支持 AstrBot 框架:推荐使用 AstrBot 实现聊天机器人快速集成,支持 API 模式及 Web Demo 模式测试。
●⚠️ 当前版本处于快速迭代阶段:效果依赖数据质量,建议避免用于非法用途,Windows 平台推荐使用 WSL。

#AI白日梦想家[超话]# #ai创造营# #你好人工智能时代# #ai生活指南#

发布于 荷兰