老刘说NLP_刘焕勇的微博

老刘说NLP_刘焕勇

2026-07-02 17:12来自微博网页版

【7千字深度看GraphRAG变体-SAG的叙事实现逻辑及4点辩证思考】最近社区看到一个GraphRAG的工作，《SAG: SQL-Retrieval Augmented Generation with Query-Time Dynamic Hyperedges》(http://t.cn/AXoqh7Rf， http://t.cn/AXoqh7RV)，讲的故事是（来自于其摘要）：不预先构建全局静态图，而是将每个文本

2

0

1

老刘说NLP_刘焕勇

2026-07-01 18:27来自微博网页版

【Agent落地观察：Agent的评估、优化、场景选择及Skill效果函数】继续看技术，微调Agent，看两个点。一个是Agent的评估与优化问题，看看怎么评估，已经skill这块的误区。另一个的，再看Agent的落地场景选择问题，可以抽象出来一些维度去看，虽然比较形而上(脱裤子放屁)，但也有着指引性。把握原理，深

2

0

2

老刘说NLP_刘焕勇

2026-06-30 20:04来自 iPhone客户端

【6千字看Agent落地架构优化史：从SingleAgent到Multi-Agent\Workflow再到Agent Skills】多总结点，来看一个很有趣的问题，就是Agent效果优化(架构层面)演变路线。总结的看，对于Agent能力的优化，有三个路径：1）将singleagent变成multi-agent，这样可以下放agent的压力，分解到若干个subagent里做提

3

0

4

老刘说NLP_刘焕勇

2026-06-30 08:40来自 iPhone客户端

【技术回顾：GraphRAG是否必要？兼看从OpenClaw到WorkBuddy】今天是6月的最后一天，2026年即将走完一半。继续看技术，回顾下老话题，GraphRAG方案与其他方案的对比，老生常谈了属于。另一个，最近WorkBuddy很火，使用起来的确也不错，所以，同样的，在这里做个总结，初步看看其设计逻辑。

2

0

2

老刘说NLP_刘焕勇

2026-06-29 13:58来自微博网页版

【关于Agentskill】技术拆解：Agent Skill的本质价值、实现逻辑及渐进式加载实例解读，继续做总结，回到skill这块，从根本逻辑上看这个技术。讲2个点，一个是Skill的本质价值认定及实现机制，看看其设计的思路和概念本质；一个是Skill三级加载机制-缓解上下文Token，用一个实际的例子来拆解出来具体是

3

0

1

老刘说NLP_刘焕勇

2026-06-28 19:31来自 iPhone客户端

【Agent技术总结：Agent所处节点、上下文工程及Memory的那些事儿】《老刘说NLP第47讲-Agent的当前节点、上下文工程及Memory问题》顺利结束，2个小时，系统回顾了下Agent记忆的相关问题，还蛮好的，有一些思考的点，做个回顾记录。我们会发现，很多技术都是相通的，虽有多种变体，但都来源于因果。这个

2

0

4

老刘说NLP_刘焕勇

2026-06-27 20:08来自微博网页版

【本体论再思考：本体自动生成4点疑问及本体增强LLM3点矛盾】继续看看本体话题，做点思考。两个点，一个是本体自动生成，一个是就是关于本体约束LLM这件事的矛盾点。http://t.cn/AXS8Ve2U

1

0

1

老刘说NLP_刘焕勇

2026-06-26 11:39来自微博网页版

【技术再思考：落地知识图谱的三个临界点、7个坑及22年之后的NLP是啥模样】继续思考，看两个点。一个是知识图谱落地逻辑的三点思考，包括基础设施角度看KG的层级构成、落地角度看KG的三个必要性临界点、实际落地KG的一些坑点。一个是22年之后做NLP的研究人员都在做啥？做几点思考。

1

0

2

老刘说NLP_刘焕勇

2026-06-25 18:46来自微博网页版

【多模态RAG开源项目PixelRAG思路及多模态Code生成总结】继续看技术进展，看多模态这个话题。一个是多模态code生成技术总结，这块的任务很多，图表转code，文档转code，网页转code等，可以在这里做个归类。一个是多模态RAG开源项目PixelRAG实现思路，可以看看其实现方式，有一些坑。

2

0

1

老刘说NLP_刘焕勇

2026-06-24 16:20来自微博网页版

RAG及文档解析、知识图谱及本体论、垂直大模型及Deepseek系列-老刘小课堂全集发布：社区线上分享做了进一步的剪辑整理，以形成了特定专题下的一些知识集合，正式推出老刘课堂三部曲，总共设置了知识图谱(本体论)、RAG(GraphRAG及文档解析)、大模型(Deepseek-R1、领域大模型)几个专题。

2

0

1

老刘说NLP_刘焕勇

2026-06-23 12:29来自微博网页版

【三点思考–读论文or用产品？做什么or怎么做? 创造力or判断力？兼看多页识别文档解析模型Unlimited OCR】继续看技术进展，两个点。一个是关于前沿跟进与精力分配的三点思考，这个节骨眼上，谈谈是有意义的，打个方向。一个是文档多页识别多模态大模型Unlimited OCR实现思路，是一个工程策略，做个收录

1

0

1

老刘说NLP_刘焕勇

2026-06-21 11:41来自微博网页版

【RAG在当前为什么“已不怎么被人提起”？发展变体回顾及背后的几个原因思考】端午假期最后一天，我们继续总结思考。本文选择RAG，先说一个观点：RAG继续作为底层组件存在，但作为"解决方案"的叙事已经终结。先从RAG当前技术的发展历史线说起，回顾下整体技术怎么演变及一些思考，然后看看RAG当前“不

4

0

4

老刘说NLP_刘焕勇

2026-06-20 20:30来自微博网页版

【技术再总结：知识自进化的3个Demo级项目及9个基本问题】知识自进化话题，看两个问题。一个是关于知识自进化，看9个问题；一个是关于知识自进化的3个Demo级项目。做做总结也不错，可看看，这块概念多，但还是Demo居多，核心看思路。这同样是知识自进化系列的跟进了，感兴趣的可看看，

2

0

2

老刘说NLP_刘焕勇

2026-06-19 22:29来自微博网页版

我现在有种强烈的感觉，与其花精力去看论文、看技术，还不如多花时间去体验不同的产品。然后，琢磨出来一些sense【别人的设计思路、想表达的点、想解决的问题以及解决的思路】，产品里面都是细节，且足够具象化。

1

4

老刘说NLP_刘焕勇

2026-06-19 21:34来自微博网页版

【技术思考：事理图谱在大模型时代下变成了如何摸样？】多写一篇，讲讲之前的事理图谱。在2021年的时候，我做过“学迹“系统，当时还没大模型，用来做事件驱动，还挺难做了，但是到现在，这种产品就会显得很容易了，从一个事件，推导出另一波事件，然后做预判。如今，站在当前大模型时代，可以回过头来

2

0

2

老刘说NLP_刘焕勇

2026-06-19 18:55来自 iPhone客户端

【知识自演化前沿概念Demo解析：LLM-Wiki的架构设计及实现逻辑】技术进展，看看LLM-Wiki的实现逻辑，作为“知识沉淀和自演化”概念的一个 demo 项目，看看架构设计和具体实现细节。http://t.cn/AXad8ajK

2

0

1

老刘说NLP_刘焕勇

2026-06-17 12:25来自微博网页版

【工具索引：三个知识图谱抽取开源项目ContextGem、langextract及Hyper-RAG】来看文档信息/知识图谱抽取框架的工具，这块再总结下，各有特点，挑代表性的看。两个点。一个是文档信息/知识图谱抽取框架回顾，包括ContextGem、langextract；另一个是Hyper-RAG抽取框架的有趣之处，通过控制输出以及配置不

5

0

1

老刘说NLP_刘焕勇

2026-06-16 08:54来自 iPhone客户端

【大模型应用范式演化总结及OmniVideo-100K-音视频推理数据合成思路】继续看技术，两个点。一个是大模型范式最新总结性读物，站在 2026 年6 月这个时间点，回顾了下大模型的发展，有种历史回顾的感觉。另一个是OmniVideo-100K-多模态大模型推理数据合成思路，属于数据工程的范畴。http://t.cn/AXaN7eTW

1

0

1

老刘说NLP_刘焕勇

2026-06-15 15:21来自微博网页版

【经验分享：落地本体论（语义层）的10点避坑指南及2个尝试途径】昨天参加A2M技术峰会并出品数据工程分论坛，整体还不错，其中关于语义层这块，来自纷享销客的郑子阳老师带来分享，其中落地本体论（语义层）的10点避坑指南以及一些陆地建议觉得不错，在此分享给大家，虽然是一套方法论，但也有借鉴意义

1

0

老刘说NLP_刘焕勇

2026-06-14 20:41来自微博网页版

【Agent Skill总结索引：4个基本问题、4种自优化方式及6类评测基准】继续看Agent skill进展，看两个技术总结，可以互补的看。一个是Agent Skill的4个基本问题：表示、获取、检索及演化策略，这个之前讲过的。一个是Agent skill的4种自优化方式和6类方式评测基准，是个补充。可以作为一个不错的索引收藏

3

0

2

老刘说NLP_刘焕勇

2026-06-13 21:39来自 iPhone客户端

【运维场景Agent的本体建模UModel及KG增强医学诊断Lung-R1思路】继续看技术，围绕知识图谱+RAG展开：一个是UModel-面向维修场景的统一数据建模方案，本质上是知识图谱+RAG的思路来解决维修场景，还带有一些动作，可以是“本体论”的一种实现，可以作为一个工程导向的方案来看。另一个，看看知识图谱增

1

0

1

老刘说NLP_刘焕勇

2026-06-12 12:12来自微博网页版

【关于本体论落地的6个真实认识、实体识别Skill及文档解析模型ppocrv6的几个关注点】前面几期都在讲palantir ontology，社区也一直在讨论，无论是从概念还是实践上，都可以做一些总结，这里先说几个结论。然后，也来看技术进展，分文档智能和知识图谱两个方向。一个是文档解析方向进展之ppocrv6，重点

1

0

1

老刘说NLP_刘焕勇

2026-06-11 12:09来自微博网页版

【再看Ontolgoy规则推理：语义网本体论中的规则表示方案及SWRL规则自动挖掘思路】顺着思路，讲讲推理规则，因为现在本体论都在讲建模业务规则，那么就必然会涉及到业务规则的制定问题，此外，还应该有规则自动生成的工作。所以，来看看关于语义网OWL体系中的推理规则方法，然后看看一个SWRL规则的自动

3

0

2

老刘说NLP_刘焕勇

2026-06-10 11:52来自微博网页版

【Palantir Ontology的Neo4j+业务规则引擎平替实现及其如何"驱动"Agent？】看2个问题：Palantir Ontology VS Neo4j+业务规则引擎方案、Ontology 如何"驱动"Agent？从落地的角度上说，结论：如果你的核心问题是“我的数据在多个系统里，我想关联查询”，Neo4j + 规则引擎足够。只有当你同时面临语义混乱

1

0

2

老刘说NLP_刘焕勇

2026-06-09 13:07来自 iPhone客户端

【Palantir ontology长文再总结：核心要素之间关系梳理、执行数据流、2个实例及具体落地建议】看三个问题：Palantir ontology要素之间的关系再总结、Palantir Ontology整体执行数据流、Palantir ontology具体落地建议，看完，看到底，会有收获。http://t.cn/AXXBOrbe，推荐看看

1

老刘说NLP_刘焕勇

2026-06-08 12:27来自微博网页版

【本体论再总结之发展三条主线及大模型后训练推理数据误区】看两个点，一个是再看本体论发展的三个时期，看个演进，另一个是大模型后训练数据总结，看看一些误区。技术更新慢下来了，但是，我们可以借此机会，做更多的总结，多总结，多思考。http://t.cn/AXXEixyN

1

0

1

老刘说NLP_刘焕勇

2026-06-07 22:45来自 iPhone客户端

【Palantir Ontology再认识：几大要素、OSDK及AIP的串联】最近又看了一圈，觉着可以再回顾下，做Palantir Palantir Ontology的实现构成再回顾，做个更清晰的认识，包括Palanti Ontology的具体构成、以及Palantir Ontology SDK（OSDK）、AIP（AI Platform），这三个东西比较完整的串起来，核心两点：其

2

0

1

老刘说NLP_刘焕勇

2026-06-04 22:56来自 iPhone客户端

【文档解析经验分享：复杂表格解析的隐形断层表现、影响及评估方式】http://t.cn/AXX6BbNx

0

2

老刘说NLP_刘焕勇

2026-06-02 11:53来自微博网页版

【GraphRAG中的“图谱”构建优化思路：MemGraphRAG的schema定义及冲突消解】来看下MemGraphRAG的图谱构建实现思路，其中对于GraphRAG重的图谱构建侧，做了个一些优化思路，虽然比较工程化，例如其中涉及到的图谱schema生成的方法、冲突检测。工作在：《MemGraphRAG: Memory-based Multi-Agent System f

1

0

3

老刘说NLP_刘焕勇

2026-06-01 20:58来自 iPhone客户端

【知识图谱结合RAG用于科学图表生成思路DiagramRAG】看下思路，RAG结合知识图谱用于科学图表生成方案，其内涵在于：图表有重要的特征拓扑结构，包括模块、连接、流向、分组、层级关系，知识图谱能把这些结构显性化，KG把图表拆成节点【模块、输入、输出、容器】+边【有向连接、包含关系、流向】+布局【

2

0

1

老刘说NLP_刘焕勇

2026-05-31 19:33来自 iPhone客户端

【2026年5月大模型进展趋势总结？及OmniRetrieva路由异构检索思路】今天是2026年5月31日，5月的最后一天，星期日，北京，天气晴看两个点，一个是2026年5月趋势进展总结，看看都发生了啥，把握趋势。另一个是回到技术，看RAG进展，OmniRetrieva路由异构检索，针对背后不同来源的知识库，通过路由的方式

2

1

老刘说NLP_刘焕勇

2026-05-31 11:11来自微博网页版

【目标检测多模态大模型摸底及LocateAnything架构设计及数据构造思路解析】看开放目标检测的话题，这个任务回顾下：给一张图和一句自然语言，这个模型在图里把你说的东西用方框圈出来。例如，输入：一张图片和其中的目标物体类别，如“找出红色杯子”、“定位图中的所有按钮”、“圈出右下角的小猫”，

3

0

2

老刘说NLP_刘焕勇

2026-05-30 12:20来自 iPhone客户端

RAG及文档解析、知识图谱及本体论、垂直大模型及Deepseek系列-老刘小课堂全集发布，http://t.cn/AX6eUEF4

3

0

1

老刘说NLP_刘焕勇

2026-05-30 12:19来自 iPhone客户端

【目标检测多模态大模型摸底及LocateAnything架构设计及数据构造思路解析】看开放目标检测的话题，这个任务回顾下：给一张图和一句自然语言，这个模型在图里把你说的东西用方框圈出来。例如，输入：一张图片和其中的目标物体类别，如“找出红色杯子”、“定位图中的所有按钮”、“圈出右下角的小猫”，

5

0

1

老刘说NLP_刘焕勇

2026-05-29 20:54来自 iPhone客户端

【AgentSkill自进化方案SkillOpt及PaddleOCR-VL-1.6文档多模态模型数据工程】看文档智能进展，PaddleOCR-VL-1.6更新，看看更新点，尤其是数据工程上的变化，构造难样本很重要。另一个是Agent skill自进方案SkillOpt，看看具体9步怎么做的，做个具像化理解。这块先说结论，很像梯度优化，但是但这个有几

2

0

1

老刘说NLP_刘焕勇

2026-05-28 12:27来自微博网页版

【技术拆解：三层图谱增强法律领域可解释推理之LegalGraphRAG及文档多模态ABot-OCR实现思路】看文档智能进展，看一个新多模态模型ABot-OCR的技术细节，包括数据部分和模型部分。另一个是法律领域融合多层图谱的LegalGraphRAG，三张图谱构建很有意思，尤其是对法律判定依据上做的约束条件，这个其实很像

2

0

3

老刘说NLP_刘焕勇

2026-05-27 11:50来自微博网页版

【前沿进展：LLM-Wiki自进化RAG及MinerU-Popo文档解析后处理设计思路技术】继续回到文档智能方向，主要还是结合RAG去讲。RAG检索增强范式主要沿两条路径发展：以视觉为中心的方法（如M3DocRAG、SV-RAG）利用图像嵌入实现页面级检索；另一种是结构感知框架的方案，则将文档建模为树或图，以进行细粒度的

3

0

3

老刘说NLP_刘焕勇

2026-05-26 08:12来自 iPhone客户端

【领域知识图谱进展：SciAtlas大规模学术知识图谱构建及检索思路】知识图谱进展，我们看看SciAtlas知识图谱的设计及检索方案，这是大规模、多学科、异构学术知识图谱，工作在《SciAtlas: A Large-Scale Knowledge Graph forAutomated Scientific Research》(http://t.cn/AX6CtRXf)，整合26个学科、4330

2

0

2

老刘说NLP_刘焕勇

2026-05-25 20:35来自 iPhone客户端

【文档多模态进展：文档多模态模型OCR评估基准CC-OCR V2的几个评估结论】继续回到文档智能方向进展，看一个文档多模态OCR评估基准，看看几个具体的结论，能够有些指引。但是，注意的是，这个是相对结论，仅供参考，贡献在于数据集。其实这里的结论就是，多模态模型定位任务尤为薄弱，这块还是可以再深

1

0

1

老刘说NLP_刘焕勇

2026-05-24 21:10来自微博网页版

【RAG及文档解析、知识图谱及本体论、垂直大模型及Deepseek系列-老刘小课堂全集发布】最近琢磨了件事儿，就是如何以一种更有效的方式来进一步挖掘现有社区已有积累的价值，因此进一步回顾，将之前的线上交流做成一个个小的课堂，进一步细分成一个个的小知识点，然后可以进行自定义的观看(比如网盘播放)

1

0

2

老刘说NLP_刘焕勇

2026-05-24 17:06来自微博网页版

【Agent框架详解：TencentDB Agent Memory的分层式长期记忆及符号化短期记忆设计细节】来看Agent记忆方面的进展，我们之前已经讲过很多了，尤其是基于图的Agent记忆、基于树的、基于层次的记忆方案等，都在解决上下文超载问题、个性化问题。最近有个方案很火，TencentDB-Agent-Memory，基于上下文卸载

4

1

2

老刘说NLP_刘焕勇

2026-05-23 18:02来自 iPhone客户端

【文档智能前沿进展：可信文档智能证据归因及中文历史字体文档表现评估】来回顾文档智能话题，来看两个新工作。一个是可信文档智能证据归因评估方向，要求模型输出答案时，同步标注元素级边界框引用（段落/表格/图片/公式），从而联合评估答案与引用区域，重点看看数据和评估都是怎么做的，核心看拆解

3

0

2

老刘说NLP_刘焕勇

2026-05-22 20:33来自 iPhone客户端

【大模型训练数据不过滤会更好？一个封闭假设实验及几个高质量数据集材料指引】来看两个话题，一个是关于高质量数据集的几个参考，指引、案例两个主题，做个记录。另一个看一个实验性的对比实验，大模型训练数据不需要过滤？看看这是在什么实验场景下的得出的相对结论。当然，先说结论：这个仅是封闭实

2

0

1

老刘说NLP_刘焕勇

2026-05-21 20:11来自 iPhone客户端

【大模型技术综述推介：Code as Agent Harness及LALM语音大模型梳理】来看几个有趣的综述，一个是Code as Agent Harness技术总结，关于 Harness的，画了一些图，做了一些总结，可以当读物。另外，语音大模型技术总结，022以来出现了一批语音大模型，如SpeechGPT、Qwen-Audio、Moshi、LLaMA-Omni、Kimi-

4

0

3

老刘说NLP_刘焕勇

2026-05-19 20:31来自 iPhone客户端

【Deepseek-V4的<think>幻觉问题及Agent Skill生成评估基准】继续看Agent skills，看一个生成评估工作。另外就是看看Deepseek-V4出现的<think>幻觉问题，也一并看看。http://t.cn/AXieI1MH

3

0

3

老刘说NLP_刘焕勇

2026-05-19 11:50来自微博网页版

【Agent落地前4简问、Claude创业指南PPT及Agent Skills的Scaling Law实验】看关于skill的一个工作，Agent Skills的Scaling Laws实验，看看一些结论。另外，看看Agent落地观点及基于claude进行创业的指南，会更宏观一些。http://t.cn/AXidANiU

1

0

3

老刘说NLP_刘焕勇

2026-05-18 09:07来自 iPhone客户端

【GraphRAG结合Agent做医疗幻觉检测及Video2GUI Agent训练数据合成思路】先来看GraphRAG与Agent结合用于医学幻觉检测思路，针对出院小结生成中忠实性幻觉问题【大模型生成的内容与原始病历记录相矛盾的陈述】，现有检测方法缺乏系统化医疗幻觉自动生成机制、未基于患者专属EHR上下文验证、无结构化可解

1

0

2

老刘说NLP_刘焕勇

2026-05-17 16:35来自 iPhone客户端

【Agent最近3个综述-多智能体、记忆演化及Token经济学：兼看多模态模型长上下文训练实验】换个视角，从综述角度看看Agent最近的几个总结，关于多智能体技术综述、Token经济学总结、Agent记忆机制的演化的几个话题，都还不错，尤其是中间的这个，很趁热度。另外，从技术角度上看多模态大模型长上下文训

3

0

3

老刘说NLP_刘焕勇

2026-05-15 13:31来自 iPhone客户端

【Agent Skill结合Graph做技能结构化执行：Group of Skills方案解读】继续来看Agent skill和Graph结合的主题，看第四个工作，在结构执行上做文章。讲的故事是Agent在具体执行时，需复用大规模技能库，全库提示的Token成本高，无法适配长上下文，扁平语义检索易遗漏依赖技能，无执行结构，检索到相关技

2

0

3

老刘说NLP_刘焕勇

2026-05-14 12:26来自 iPhone客户端

【Agent Skill结合Graph做技能检索及演化思路：SkillGraphs方案解读】在之前的文章《Agent Skill结合知识图谱进展：SkillSynth做数据合成及GraSP将Skill执行变为DAG图》(http://t.cn/AXJkvZUW)中，看了两个工作。一个是Skill结合图谱做Agent训练数据合成思路-SkillSynth，属于数据合成的范畴，还贴了sk

2

0

3

老刘说NLP_刘焕勇

2026-05-13 10:52来自微博网页版

【本体论的那些事儿-从Web语义本体、知识图谱本体再到Palantir Ontology–社区分享回顾】来看两个事情，一个是老刘说NLP技术社区第45讲回顾，最近讲本体论的太多，各种歧义，让人很摸不着头脑，所以，想着说，社区做一个围绕本体的专门的报告，其中涉及到一些话题，可以讲讲，所以就做了个线上交流，感

3

0

1

老刘说NLP_刘焕勇

2026-05-12 08:26来自 iPhone客户端

【Agent Skill的四个经典问题总结：Skill的表示、获取、检索及演化策略】Skills进展，看一个技术总结来快速看一个Agent Skill系统性技术综述，围绕技能生命周期（表示、获取、检索、演化）展开，将智能体技能定义为可复用的过程性工件，用以弥补工具调用与可靠执行间的过程鸿沟，系统梳理四类技能获取

3

0

3

老刘说NLP_刘焕勇

2026-05-11 13:10来自 iPhone客户端

【也看RAG中的Skill检索问题：Skills检索评测数据合成、专用Embedding模型训练策略】来看看Skills结合RAG的进展。讲的故事是现有技能基准多关注端到端执行效果，未单独测评检索能力，所以搞个SkillRet，面向LLM智能体技能检索测试集，发现结通用检索模型在长文本技能检索上表现不佳，基于SkillRet微调

2

0

4

老刘说NLP_刘焕勇

2026-05-10 20:02来自微博网页版

【知识图谱抽取Skill挖掘思路解读：Hyper-KGGen超图抽取框架】看看知识图谱抽取skill进展，讲的故事是知识超图生成的技能驱动抽取框架，通过粗到细抽取与自适应技能获取解决传统知识图谱仅支持二元关系的问题，搞了个Hyper-KGGen框架，冻结LLM、仅优化外部技能库的知识超图抽取框架，采用粗到细分层构

3

0

4

老刘说NLP_刘焕勇

2026-05-09 09:00来自 iPhone客户端

【Agent Skill结合知识图谱进展：SkillSynth做数据合成及GraSP将Skill执行变为DAG图】看技术进展，看Skill结合图谱做Agent训练数据合成思路-SkillSynth，其本质上还是属于数据合成的范畴，还贴了skill和知识图谱。另一个就是将skill执行搞成DAG图的思路，这是具体的执行方式上的切换了，也可以看看具体

4

0

6

老刘说NLP_刘焕勇

2026-05-08 11:51来自微博网页版

【RAG代码补全中的文本分块策略有啥？影响几何？如何选择？一项实证分析】继续看技术进展，RAG场景，看一个实证分析的结论，来看一个消融对比实验，因为行业实践混乱，谷歌推荐按函数/类分块、Mistral推荐语法树分块、Codestral用滑动窗口，无实证支撑，所以可以做一个RAG代码补全中分块策略的控制变量

2

0

5

老刘说NLP_刘焕勇

2026-05-07 17:47来自微博网页版

【Agent技术前沿：多模态搜索智能体可以咋做？OpenSearch-VL开源方案解读】看来看多模态搜索智能体的话题，来看一个具体的任务，想解决的问题是需要整合视觉检查、图像检索与文本证据获取的交替使用如何解决知识密集型的视觉问题，如果要做，那么就得训练。要训练，就得搞数据、设计实验环境。所以，就

2

0

2

老刘说NLP_刘焕勇

2026-05-07 08:59来自 iPhone客户端

【技术解读：2小时老刘说NLP第44讲《Deepseek-V4系列深度解析》干货分享顺利完成】今天，《老刘说NLP第44讲-Deepseek-V4系列深度解析》顺利完成，面向全体社区成员，进行2小时密集干货，这是社区线上分享系列的第44讲，近期也将举办palantir本体论专题分享作为第45讲，感兴趣的，可以一起加入社区看看

3

0

4

老刘说NLP_刘焕勇

2026-05-05 11:20来自微博网页版

【知识图谱如何用于代码仓库文档自动生成与更新？RepoDoc实现方案解读及相关方案回顾】，继续回到知识图谱这个话题，谈谈应用，代码知识图谱用于项目文档生成进展。代码文档工具（RepoAgent、CodeWiki）自动文档工具不理解代码之间的调用、依赖、结构，生成的文档碎片化、看不懂；把整个文件塞给大模型

2

0

2

老刘说NLP_刘焕勇

2026-05-04 10:21来自微博网页版

【论文Idea也能做成演化知识图谱？Intern-Atlas作为AI4Science基建的具体实现】五一假期第四天，继续回到技术看看知识图谱进展，讲的故事是现有科研基础设施以论文为中心，仅提供引用链接，缺失方法演化的结构化关系，无法被科研Agent高效利用，无法判断论文A是否扩展了论文B的架构，是否用不同机制解

1

0

3

老刘说NLP_刘焕勇

2026-05-03 12:14来自微博网页版

【多模态RAG前沿方案解读：DocSeeker分析-定位-推理及PurifyingFIG碎片信息增益去噪】五一假期第三天，我们继续回到技术，看多模态RAG的两个前沿进展，两个方向。一个是引入分析-定位-推理的多模态RAG思路，核心还是要看怎么做的这个数据构造，grounding能力的确是RAG的一个重点刚需能力。另一个，去噪

2

0

4

老刘说NLP_刘焕勇

2026-05-01 20:10来自微博网页版

【技术社区纳新】RAG＆KG＆LLM＆文档智能四大领域技术前沿：老刘说NLP技术社区持续对外纳新，老刘说NLP技术社区自建立以来，通过人工跟进、筛选，围绕‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍几个是偏向落地的大的主题，大模型(Agent、skill、Vibecoding等)、RAG（多模态RAG、GraphRAG、AgenticRAG）、文档智

1

0

4

老刘说NLP_刘焕勇

2026-04-30 19:09来自 iPhone客户端

【技术分享：如何构造可进化的知识处理系统？从理论到实践】还是回到技术问题，这几天讲知识工程讲的比较多，所以趁热打铁一下。知识自进化这个事情是一个很有趣的方向，正如鲍捷老师所说，今年所有的系统都会是可演化的。整个报告很干货，主旨是利用大模型技术重构知识工程全链条的最新实践。核心思想

2

1

3

老刘说NLP_刘焕勇

2026-04-29 23:48来自 iPhone客户端

【基于Graph的Agent记忆都怎么做？11个框架、7类基准及4个阶段总结性回顾】继续看Agent记忆，继续回顾下，基于Graph的Agent记忆技术总结，温故知新。基于Graph的智能体记忆的核心思想是将记忆内容建模为一种动态的、结构化的记忆图。在此范式中，记忆单元（如事件、实体、概念、观测）被抽象为结点，它

4

0

4

老刘说NLP_刘焕勇

2026-04-28 16:47来自微博网页版

【Ontology本体驱动Agent究竟是个啥？技术起底及静态、动态本体怎么区分？】最近，Ontology本体驱动Agent这个东西很火，也都在提，但还是太抽象，包装的很不错，大致就是【本体不是单纯的“知识库”，而是Agent的“业务宪法”和逻辑框架、本体驱动的本质是让Agent的认知步骤（规划、推理、执行）都在本

3

0

6

老刘说NLP_刘焕勇

2026-04-27 11:56来自微博网页版

【充满歧义的本体论到底是什么？从Web Ontology到Schema再到Palantir Ontology】最近Ontology（又被叫成本体论）特别火，然后概念很乱，搞得和迷糊。但是汇总的看，Ontology（本体）这个词确实是一词多义，目前在知识图谱、语义网和Palantir这三个语境中，虽然核心都指向 “如何组织和理解信息”，只是

3

0

4

老刘说NLP_刘焕勇

2026-04-26 18:45来自微博网页版

【GraphRAG or AgenticRAG？一个对比测试观察及AtomicRAG索引花活思路】回到RAG的方向，再做个回顾总结，看看GraphRAG VS AgenticRAG的一些观察，顺便回顾下这块的一些数据集、方法和对比结论。另外，GraphRAG的花活索引工作还在继续，来看看基于原子-实体抽取的GraphRAG思路AtomicRAG，也很有趣。

4

0

2

老刘说NLP_刘焕勇

2026-04-25 12:28来自微博网页版

【DeepSeek V4的思考模式推理指引及生成模型做视觉理解之VisionBanana思路】DeepSeekV4思考模式推理指引、包括推理模式、VLLM支持，看两个点，一个是DeepSeekV4进行推理的一些细节，怎么使用要看官方。另一个是生成模型做视觉理解之VisionBanana思路，属于多模态范式的范畴。http://t.cn/AXxTStYR

3

0

2

老刘说NLP_刘焕勇

2026-04-24 12:49来自微博网页版

【DeepSeek-V4大模型速览及正统Ontology自动化构建方案解读】看看一个正统Ontology自动生成方案，来看ontology自动生成方案进展，讲的故事本体的自动生成，核心思路是通过MCP协议联动RDF/OWL本体图、向量RAG、SHACL验证、SPARQL查询等模块，由Ontology Builder流水线自动从文本/对话/外部数据构建并更

6

0

6

老刘说NLP_刘焕勇

2026-04-23 11:49来自微博网页版

【文档解析类Skill可以怎么做？TextIn xParse Skill的设计思路解析】伴随着Openclaw的热潮，Skill技能化也逐步成为企业Agent应用的重要形式，因此，TextIn xParse Skill也顺势上架ClawHub(http://t.cn/AXxKOJqK进一步提供免费使用的skill，延续之前的商业稳定性、可用性及效果优势，帮助企业更快速地把

2

0

5

老刘说NLP_刘焕勇

2026-04-23 11:49来自微博网页版

【Agent数据合成框架AgentFlow的设计思路及实现流程】继续看技术，看看Agent数据合成框架AgentFlow，数据合成这个我们讲多次了，现在借着这个工具，我们来看看一些实现细节，数据工程挺重要的。http://t.cn/AXxKOM69

4

0

7

老刘说NLP_刘焕勇

2026-04-22 11:55来自微博网页版

【Agent工作流可否用大模型自动生成？Chat2Workflow数据集构建及评测方式解读】继续看技术，看看workflow自动生成评测的事情，这其实已经是很多产品比如coze自带的功能里。评测和数据构建会比较重要，所以看看，里面那几个生成workflow的prompt有些用。http://t.cn/AXxiFvvS

2

0

3

老刘说NLP_刘焕勇

2026-04-21 20:18来自 iPhone客户端

【现在的Agent Memory到底在给谁做？人本位 or 模型本位? 一点思考】最近agent记忆系统，突然有个疑问，手指头+脚趾头都快数不过来的记忆框架是否不太对劲？其实这个问题很经典，感兴趣的可以想想看。http://t.cn/AXxMNG7G

2

0

3

老刘说NLP_刘焕勇

2026-04-20 09:29来自 iPhone客户端

【大模型时代的知识工程：从参数化到自演化的范式跃迁】大模型浪潮之下，知识工程正迎来一场从底层逻辑到顶层架构的范式革命，站在2026年这个时间点上，我们可以做些观察。王昊奋老师昨日在OpenKG公众号(技术动态 | 大模型时代的知识工程（同济大学王昊奋）一文中对大模型的知识工程做了介绍，但限于PP

4

0

4

老刘说NLP_刘焕勇

2026-04-17 19:25来自 iPhone客户端

【又一个Agent系统技术总结及Qwen3.6-35B-A3B开源进展】继续看技术进展，两个话题。一个是可以关注的一个科普综述-关于Harness Agent，图画的很好看，对各个组件的之间的关系，刻画的也不错，可收藏。另一个是关注下基础模型的开源，包括Qwen系列模型Qwen3.6-35B-A3B、图像生成大模型ERNIE-Image。

1

0

5

老刘说NLP_刘焕勇

2026-04-15 11:52来自 iPhone客户端

【技术总结：后训练策略更新及Agent动态记忆演化维度、风险总结】继续看技术，看两个技术总结，分别是后训练策略更新技术总结以及Agent动态记忆的几个演化维度及风险。文章会比较短，主要还是看结论。http://t.cn/AXMnQ0BT

2

0

1

老刘说NLP_刘焕勇

2026-04-14 12:26来自微博网页版

【Agent Skill自动蒸馏方案解读第三篇：CoEvoSkills的多智能体协同演化思路】skill蒸馏的第三篇文章，顺便回顾下一些已有的方法和基本实现逻辑，尤其中其中的测评逻辑。http://t.cn/AXMHIhLZ

4

0

2

老刘说NLP_刘焕勇

2026-04-13 13:37来自 iPhone客户端

【Skills进化方案再解读：SkillClaw技能演化实现思路】继续看技术，昨天我们在《技术解读：如何借助Agent自动蒸馏Skill？Trace2Skill方案及文本层级分类小讨论》(http://t.cn/AXMKkInI)中介绍了Trace2Skill的思路，本质就是llm去总结已经跑出来的路径，然后抽取共性，也就是里面的频模式加权合并。其本

2

1

6

老刘说NLP_刘焕勇

2026-04-12 13:24来自微博网页版

【技术解读：如何借助Agent自动蒸馏Skill？Trace2Skill方案及文本层级分类小讨论】技术解读：如何借助Agent自动蒸馏Skill？Trace2Skill方案及文本层级分类小讨论，http://t.cn/AXMKkInI

4

0

2

老刘说NLP_刘焕勇

2026-04-11 12:18来自微博网页版

【OpenClaw带火的大量Skill如何做RAG？一项实验报告及学科图表转LaTeXcode强化学习思路】继续看技术，看Skill结合RAG思路进展，毕竟现在opencla 这波的skill是越来越多，但不是越多越好，还是会涉及到怎么检索的问题，还是会用到RAG。所以，先看一个故事，给定用户任务查询，从大规模技能库中检索完成

4

0

5

老刘说NLP_刘焕勇

2026-04-10 11:48来自微博网页版

【文档解析方案最新进展：MinerU2.5-Pro更新、数据工程及FlowExtract流程图解析思路】来看文档解析相关前沿进展，这块依旧比较卷，两个点。一个是传统CV方式做流程图解析思路FlowExtract，一个是MinerU2.5-Pro更新及其中的数据工程思路，重点的重点，还是要看数据怎么做的。会有一些思路，虽然很常规。

2

0

5

老刘说NLP_刘焕勇

2026-04-09 13:05来自 iPhone客户端

开源免费，大模型书！449页PDF！http://t.cn/AXMqKDIx

3

0

3

老刘说NLP_刘焕勇

2026-04-09 12:37来自微博网页版

【方案拆解：基于实体树的Agent记忆方案MemBrain及开源模型进展】继续看Agent记忆上的事情，看看基于实体-主题-时序-版本控制的Agent记忆方案，很常规的组合方案，不算太创新。另一个看看两个开源模型进展：语言大模型GLM-5.1和检测大模型 WildDet3D。http://t.cn/AXMqig1F

3

0

5

老刘说NLP_刘焕勇

2026-04-08 13:34来自 iPhone客户端

RAG＆KG＆LLM＆文档智能四大领域技术前沿：老刘说NLP技术社区持续对外纳新，http://t.cn/AXMLB5aK

2

0

4

老刘说NLP_刘焕勇

2026-04-08 13:33来自 iPhone客户端

【技术指引：Arxiv 5大方向论文监控点位、大模型面试指南、FIPO强化策略及目标分割工具】速看几个可以关注的进展，包括Arxiv上AI方向论文监控点位、大模型强化学习策略、开放目标分割模型以及大模型面试指南进展。http://t.cn/AXMLB2Z2

1

0

1

老刘说NLP_刘焕勇

2026-04-07 22:48来自 iPhone客户端

【Agent结构化记忆方案解读：HINDSIGHT细分记忆及Graphify代码KG构建插件拆解】继续看Agent记忆进展，昨天看10种Agent记忆方案对比总结，顺着这个思路，我们继续看看结构化记忆这条路怎么做？解读两个工作，一个是基于细分结构化及时序的Agent记忆思路HINDSIGHT，重点看看记忆的构建和检索思路，找些思

3

0

3

老刘说NLP_刘焕勇

2026-04-06 12:08来自微博网页版

【技术拆解：Agent记忆如何做？10种主流Agent记忆方案多维度对比总结】继续看Agent记忆进展，看10种Agent记忆方案对比总结，可以借此机会，看看这些记忆系统在设计的时候都有哪些组件，有哪些优化策略，以及有哪些经验。【我们已经陆陆续续讲了多个了，也有一些综述，但拉到一个框架上，做抽象的回顾，

4

0

7

老刘说NLP_刘焕勇

2026-04-05 12:09来自微博网页版

【方案解读：Agent多模态记忆框架OMNI-SIMPLEMEM及ChartNet基于改写增强的数据合成思路】今天是清明节，大家清明安康！继续回到数据工程，看数据合成的思路，基于改写增强的Chart理解数据集合成方案ChartNet，CVPR 2026的工作，开源数据集、模型都已经开源，思路可以借鉴。另外，看看Agent多模态memory

5

0

5

老刘说NLP_刘焕勇

2026-04-04 12:09来自微博网页版

一个好的技术社区应该是怎样的？老刘说NLP技术社区的几点实践。http://t.cn/AXInkMOH

0

2

老刘说NLP_刘焕勇

2026-04-04 12:08来自微博网页版

【知识图谱与大模型结合再回顾：科学领域视角看KG进化、构建及结合LLM思路】继续看技术方面的进展，从科学知识图谱技术总结回顾知识图谱。来看看科学知识图谱（SciKGs）总结，工作在《Bridging Data and Discovery: A Survey on Knowledge Graphs in AI for Science》，http://t.cn/AXInk79s，梳理了S

1

0

3

老刘说NLP_刘焕勇

2026-04-02 20:27来自 iPhone客户端

【实践指引：多模态客服智能体竞赛任务及大模型+RAG可否审稿评估基准】继续看技术方面的进展，看看用于练手的多模态客服智能体竞赛，看看任务是如何设计的，感兴趣的可以做一做。另外就是看看大模型结合RAG是否可以用于做学术论文审稿的基准设计思路，核心还是看这个设计的trick。http://t.cn/AXIl2b8x

1

0

3

老刘说NLP_刘焕勇

2026-04-01 11:50来自微博网页版

【AgenticRAG如何用于图像生成？Gen-Searcher智能体工程化组合思路】http://t.cn/AXIoHAQ6，继续看技术方面的进展，用于图像生成的多模态深度搜索智能体思路，其实本质是RAG用于image生成的方式【根据作图要求，找相关图片、相关信息，一次变多次，搞成agent】，这是一个应用型的思路，虽然很组合性，

1

0

3

老刘说NLP_刘焕勇

2026-03-31 14:30来自微博网页版

发现一门超实用的课程——《大语言模型基础：理论与实践》 ✴吃透核心算法：注意力机制、Transformer全链路拆解 ✴9 大项目实战：从0实现一个自己的mini-ChatGPT ✴进阶提示工程：玩转few-shot、CoT，搞定三大真实场景 ✴筑牢编程根基：完整PyTorch代码实操，夯实NLP开发能力 📌 所需基础：Python

1

0

3

老刘说NLP_刘焕勇

2026-03-31 12:04来自微博网页版

【文档解析开源趋势：从MinerU更新日志看主流文档解析项目趋势】继续看技术方面的进展，从MinerU看文档解析项目方向的趋势。本文会很短，主要还是快速看到一些结论性的东西。http://t.cn/AXIJTD4m

2

0

4

老刘说NLP_刘焕勇

2026-03-30 11:41来自微博网页版

【多模态大模型能否检测出论文图像是否造假？THEMIS评估基准设计思路解读】继续看技术方面的进展，来看论文图像造假方面的检测，这个在当前大模型横行的时代，造假防不胜防之下，怎么从基础性工作的角度上，做一些检测的工作。也就是论文图像造假取证多模态大模型评估，重点看其中的数据构建和任务设计

2

0

3

老刘说NLP_刘焕勇

2026-03-29 20:47来自微博网页版

【有趣的RAG幻觉缓解新思路：MARCH多智能体强化自我检查方案解读】继续看技术方面的进展，看看多智能体+强化学习缓解RAG幻觉思路MARCH的思路《MARCH：多智能体强化自我检查以减少大模型幻觉》，这个很有趣，思路很简单，从效果上看来也显得有效，很有趣，推荐看看。http://t.cn/AXIqAh4T

2

0

3

老刘说NLP_刘焕勇

2026-03-29 09:41来自微博网页版

【技术再回顾：大模型做知识图谱构建及GraphRAG多路召回动态融合思路】回到GraphRAG上，看下GraphRAG的常规思路，然后看一个很trick的小点和大模型做知识图谱思路，看下实现流程，http://t.cn/AXI47ans

2

0

3

老刘说NLP_刘焕勇

2026-03-28 11:48来自微博网页版

【Agent工作流优化综述及大模型注意力变体技术总结】继续看技术方面的进展，看看大模型的注意力变体方案总结，做个记录。另外就是LLM智能体工作流优化综述，虽然很理论，看看也不错，做给索引。http://t.cn/AXIwmkBu

2

1

4

老刘说NLP_刘焕勇

2026-03-26 11:49来自微博网页版

【文档OCR模型需要怎样的高质量数据？PP-OCRv5数据策略实证分析及真实场景数据合成思路】数据才是当前模型能力和决定是否可以落地的关键，尤其是现在的高质量这个东西，啥叫高质量，对模型性能有好处，并且能够形成标准化的数据资产就是高质量。先看PP-OCRv5中的数据策略实证分析，轻量级模型的性能上

3

0

4

老刘说NLP_刘焕勇

2026-03-25 12:02来自微博网页版

【文档解析大模型最新进展：基于扩散思路做OCR之MinerU-Diffusion及网页解析工具MinerU-HTML更新】继续看技术，回到文档解析领域，看两个有意思的点。一个是基于扩散模型做文档OCR思路MinerU-Diffusion，用来做加速的，思路很看，很有趣另一个是HTML解析工具进展之MinerU-HTML，偏向工程，解析网页的轮

0

5