rag-best-practices

我要开发同款
潮涨潮消2024年10月06日
26阅读
开发技术自然语言处理、深度学习
所属分类人工智能
授权协议LGPL许可

作品详情

1. 项目解决了什么问题?
项目名为:rag-best-practices(大语言模型检索增强生成技术最佳实践),针对“大语言模型数据更新不及时,垂直领域问答多幻觉”的问题给出了改善方案。通过垂直领域知识库检索辅助模型生成内容,减少生成幻觉,将通用大模型在一定程度上专业化;通过更新知识库,使得过往预训练的大模型能够回答实时新闻报道中出现的内容,进一步提高通用大模型的回答能力。
2. 项目采用的技术?
- Query Classification:并非所有查询都需要检索增强。
- Sliding Window Chunking:块大小显著影响性能。更大的块提供了更多的上下文,增强了理解,但增加了处理时间。较小的分块提高了检索的召回率,减少了时间,但可能缺乏足够的上下文。使用sliding window技术更加有效,即将文本按照句子进行划分,每个块包含窗口大小个句子。
- Embedding:嵌入模型选择BAAI/big-large-en,并对其在专业数据库中进行微调,提高其检索能力。
- Vector Database:Qdrant支持多种索引类型、十亿规模的向量支持。
- Retrieval:HyDE(pseudoDoc+query)+Hybrid Search(=0.3*BM25+Original embedding)。
- Reranking:monoT5模型参数量小且准确率相对较高,RankLLaMA绝对准确率更高。
- Repacking:reverse方式最好。
- Generator Fine-tuning:混合相关和随机上下文可以增强生成器对无关信息的鲁棒性,同时保证相关信息的有效利用。用一个相关文档和一个随机选择的文档来训练。(待实现)
3. 项目有哪些亮点?
对当前提出的各种RAG方法进行整合,统一实现了论文中提到的技术,方便模块化定制。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论