公开分享,突破开源RAG短板的5大关键策略!
在 AI 蓬勃发展的时代,智能问答助手已深度融入我们的工作与生活。
但不同智能助手的表现参差不齐,有的常常含糊其辞、答非所问;有的却精准流畅,宛如行业专家。
其实,这一巨大差距的根源,在于是否应用了RAG(检索增强生成)技术,以及是否攻克了RAG技术的关键瓶颈。
开源RAG的优势和短板
RAG技术改变了传统的智能问答模式。传统模式需把大量文档纳入大模型训练,成本高、耗时久,知识更新还得重新训练,效率低下。
RAG 技术则在大模型外构建独立文档检索系统。用户提问时,系统先从文档库精准筛选相关片段,再与问题一同输入大模型生成回答。
使企业无需大规模训练大模型,就能快速运用最新文档知识,大幅提升响应速度与回答准确性,降低企业知识管理成本和维护难度。
RAG技术示意
然而,开源 RAG 技术也存在显著局限。
#在文档切分上,面对含多层级标题、交叉引用、嵌套段落等复杂结构的专业文档,只能依靠简单规则按固定字数或段落切分,致使片段过长含冗余或过短致语义破碎,影响大模型对核心要点的把握,降低问答质量;
#向量召回策略先天不足,仅 60 - 70% 的文档召回命中率,导致大量相关文档遗漏,限制大模型生成回答时的参考信息,削弱回答全面性与准确性;
#检索重排环节,缺乏有效机制精准判断召回片段与用户问题的语义相关性,仅靠基础方式排序,面对隐晦问题无法将关键内容前置,使大模型因参考信息无序难以生成条理清晰、针对性强的答案。
突破开源RAG短板的5大关键策略
01创新性切分算法重塑回答精准度
深度语义与结构分析:金现代自研了一套切分算法,将其应用在小金智问智能问答平台当中。与市面上常规切分算法不同,它突破了仅以段落、句子为依据的刻板模式。
通过实践验证以及众多客户的真实反馈,该算法能够深入到文档结构与语义层面,充分利用大纲、目录、章节、标题等多维度关键信息,对文档进行精准切分。
在处理文档时,它能精准把握段落逻辑与内容关联,确保切分后的文本片段长短适宜,语义连贯且完整。
这种切分方式为智能问答提供更优质、准确的信息输入,大幅提升了智能问答的准确性。
表格与公式解析突破:针对文档中的表格和公式,金现代研发了基于类HTML 解析语法的表格理解增强技术(已申请专利)。
这一技术能够帮助大模型更准确地理解表格中数据的真实语义。
以差旅报销住宿标准为例,大模型借助该技术可以清晰地识别各数据所代表的指标以及数据之间的关联,准确回答诸如 “北京出差的住宿标准” 等针对表格的复杂问题。
表格解析示意
02自主召回策略扩大知识覆盖
开源 RAG 技术的向量召回策略,其召回文档命中率在 60 - 70%。
金现代采用自研的向量召回 + 关键词召回的多路召回策略,成功将召回的文档命中率提升至 85% 以上。
向量召回通过优化向量空间模型,更精准地计算语义相似度;关键词召回则基于对文档内容的深入词法、句法分析,精准提取关键信息。
这一创新策略大大扩充了大模型在生成回答时可参考的知识范围,为提供更全面、准确的回答奠定了坚实基础。
03智能检索重排优化信息呈现
金现代引入检索重排(Rerank)技术,并采用 Cross - Encoder 模型对召回片段进行二次排序。
该模型能够联合编码查询问题与召回文档片段,精准捕捉二者之间的语义相关性,使更相关的片段排在更靠前的位置。
使得大模型生成的回答更具针对性和准确性,有效避免了无关或低相关信息对回答的干扰。
04可视化切分配置满足个性需求
为满足企业多样化的个性需求,金现代提供了可视化切分配置方法。
在实际操作中,切分方案可能因业务变化、文档更新等因素出现不合理的情况。有了可视化切分配置,企业无需担忧复杂的技术流程或依赖外部技术支持。
通过直观的操作界面,可自主完成对切分片段的编辑、修改、合并等操作,高效解决切分不合理的难题,保障知识管理工作顺畅推进。
05严密权限控制保障数据安全
金现代拥有一套完整的权限控制体系,这意味着传递给大模型的知识均经过严格的权限过滤。
以一个拥有多个部门的企业为例,市场部员工仅能访问与市场业务相关的文档,研发部员工只能查看研发相关资料。
即使大模型功能强大,也无法获取超出员工权限范围的知识,从根本上杜绝了数据泄露的风险。
金现代将以上技术应用在小金智问智能问答平台中,目前已在多家客户的实际业务场景中成功落地,具有高准确性、强安全性、低成本的显著优势。未来,金现代会持续提供高效、精准的智能化服务,为企业的持续创新与发展赋能。