创建自定义LLM (大语言模型) ChatBot 的过程图解,主要包括以下几个主要步骤:
- 输入文档 (Documents):从原始文档开始,可以设置分块策略(Chunking Strategy),如块的大小(Chunk Size)和重叠(Overlap)。
- 嵌入策略(Embedding Strategy):使用算法(如E5或BERT)将文档分块嵌入向量表示(Embeddings)。
- 文档检索器(Document Retriever):基于嵌入向量检索与查询相关的文档分块。
- 上下文生成策略(Context Generation Strategy):根据检索到的分块,决定要检索多少分块、为每个分块提供多少上下文、如何处理重叠分块。
- LLM选择(Choice of LLM):选择大语言模型,如GPT、Claude等。
- 响应生成(Generate Responses):根据所选的分块策略、嵌入策略、上下文生成策略和LLM,生成所有可能的响应。
- 响应评估(Evaluate Responses):使用BLEU、METEOR、BERT Score和ROUGE Score等指标评估生成的响应质量。
- 最佳模型(Best Model):选择评分最高的模型作为最终的ChatBot模型。
发布于 北京
