rag-best-practices_开源项目-程序员客栈

1. 项目解决了什么问题？项目名为：rag-best-practices（大语言模型检索增强生成技术最佳实践），针对“大语言模型数据更新不及时，垂直领域问答多幻觉”的问题给出了改善方案。通过垂直领域知识库检索辅助模型生成内容，减少生成幻觉，将通用大模型在一定程度上专业化；通过更新知识库，使得过往预训练的大模型能够回答实时新闻报道中出现的内容，进一步提高通用大模型的回答能力。2. 项目采用的技术？- Query Classification：并非所有查询都需要检索增强。- Sliding Window Chunking：块大小显著影响性能。更大的块提供了更多的上下文，增强了理解，但增加了处理时间。较小的分块提高了检索的召回率，减少了时间，但可能缺乏足够的上下文。使用sliding window技术更加有效，即将文本按照句子进行划分，每个块包含窗口大小个句子。- Embedding：嵌入模型选择BAAI/big-large-en，并对其在专业数据库中进行微调，提高其检索能力。- Vector Database：Qdrant支持多种索引类型、十亿规模的向量支持。- Retrieval：HyDE（pseudoDoc+query）+Hybrid Search（=0.3*BM25+Original embedding）。- Reranking：monoT5模型参数量小且准确率相对较高，RankLLaMA绝对准确率更高。- Repacking：reverse方式最好。- Generator Fine-tuning：混合相关和随机上下文可以增强生成器对无关信息的鲁棒性，同时保证相关信息的有效利用。用一个相关文档和一个随机选择的文档来训练。（待实现）3. 项目有哪些亮点？对当前提出的各种RAG方法进行整合，统一实现了论文中提到的技术，方便模块化定制。

rag-best-practices

作品详情

重点城市程序员兼职推荐

重点岗位程序员兼职推荐