耗时一个多月,我终于把这件事做完了。万部古籍里的服饰内容全量整理成果,
#述衣#项目今日正式上线,全部免费公开。
http://t.cn/AXxLtAKp
120.25.237.190/hanfu/shuyi/index.html
衣食住行,衣冠为首,我一直想弄明白:历代传世典籍里,究竟留下了哪些关于古代服饰的文字记载?前人虽有不少研究,却始终没有一套全覆盖、大而全的系统性成果。
得益于智能技术突飞猛进,此次全量处理万部传世古籍,把书中所有关于古代衣冠、服饰形制、冠履配饰、纹样面料、历代礼制穿搭的内容,逐条提取整理,做成了易懂的简明总结提要。
把所有古籍彻底筛了一遍,找出哪些典籍服饰记载丰富、哪些内容偏少、哪些仅有寥寥数笔、哪些全书无一字提及。这份全量整理,经史子集、不做节选,覆盖正史别史、礼制通典、文人笔记、各地地方志、类书丛书,真正做到无一遗漏。
往后无论是汉服同袍溯源考据,还是研究者做相关课题研究,都可以先看这份通识,把所有服饰相关史料,哪怕是藏在冷门古籍里的细枝末节,全都筛选提炼出来,可直接作为研究的基础和辅助;
通过不同古籍、不同作者的记载交叉印证,实证各类服饰形制在对应朝代的真实情况,让文史考据更严谨、更有依据。
古籍晦涩难懂,卷帙浩繁,一般人根本没有精力逐本翻查。现在不用啃原著,想查任意一部古籍有无服饰相关记载,看整理好的提要就能一目了然,希望我的工作能帮大家一定程序上解决了华夏衣冠古籍研究不好上手的难题。
---
怎么做到的?
完成这件事,靠的不是人工逐本翻书摘抄,而是基于龙虾AI智能体,搭建了一套专用的古籍全自动处理系统。
我一口气部署起了十几只龙虾,并行分工跑任务。万部古籍体量太过庞大,只有多智能体同时运转,才有可能在一个多月内做完这项庞大工程。
写技能,做插件,编脚本,给每一只龙虾都设定了一套服饰考据规则与整理标准,让它们严格按我的思路,自动拆解、解读、提炼古籍文本。为了给这群龙虾配上足够强的"大脑",接入了多款国内顶尖大模型,统一接口调度,按各家模型特性分配不同任务环节,为此开通了各家平台最高规格月度算力套餐。总计用掉了上百亿的token。很费¥。
上万部古籍,文本体量极大,每本都要经过多轮递进式拆解与逻辑推理,对话链路极长。一个多月高强度满负荷运行,各家平台最高规格月度套餐的算力配额都被全部耗尽。这样的工作量,如果纯靠人力伏案逐书翻检,估计至少需要好几年才能完成。因为我试过,太难了放弃了。
---
不只是AI在跑,我也全程没松手
不是部署完龙虾就可以完全撒手不管、坐等成品。
整个过程全程值守跟进:部署调度、紧盯运行状态、逐批校验产出结果、把数据下载回流;内容不满意、标准不达标的,还要打回去重新迭代处理;等拿到合格整理文档后,还要再二次规整梳理、优化内容结构,再逐一做成网页、搭建整套展示网站,后续还要长期维护更新。从调度、校验、返工、整理,到建站、运维,全程都投入了我大量时间精力和¥。光一个技能就迭代了上百个版本。
---
这次特意全程只用了国产大模型,没有选国外模型。不是国外的不好用,而是我想把这次万部古籍的高强度实战,完全交给国产AI来历练沉淀。
这一个多月海量的古籍拆解与服饰考据过程,产生的大量真实交互场景与推理链,相当于为国产大模型在「古籍理解」与「传统服饰解析」这两个垂直领域,做了一次高密度、高质量的实战强化,留下了大量高质量的古籍服饰领域对话数据和校验标注样本。将来大家在使用这些国产模型去查询同类问题时,有更大概率缓存命中得到更懂古籍、更懂汉服文化的回应。
以现成龙虾智能体为调度基座,以国产大模型为核心引擎,再加上全程人工值守校验、迭代返工、整理建站与运维维护,这场耗时、耗力、耗算力的攻坚,既把散落在万部古籍里的华夏衣冠文脉系统梳理沉淀,也为国产AI深耕传统文化,留下了一份扎实的实战积累。
此次接入的国产大模型:小米MiMo、智谱GLM、DeepSeek、Kimi、阿里、字节、腾讯、MiniMax等等。
---
当然客观来讲,即便用上国内顶尖大模型全力运转,也没办法做到百分之百毫无遗漏。古籍异体字多、行文晦涩繁杂,难免有内容梳理不全或小有偏差。
大家在使用过程中,如果发现哪本文献有遗漏、整理不全、内容有出入的地方,欢迎随时指正。我可以调度模型,针对对应典籍重新复盘、重新跑一遍修正,慢慢把这套成果打磨得越来越完善。
#汉服资料馆#
#古籍整理# #汉服# #龙虾OpenClaw# #国产大模型# #AI赋能传统文化#
