【LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)】'lechmazur/confabulations: Hallucinations (Confabulations) Document-Based Benchmark for RAG' GitHub: github.com/lechmazur/confabulations #AI评估# #大型语言模型# #幻觉识别# #AI创造营#
发布于 北京
