这篇论文在RAG(检索增强生成)和Reasoning(多步推理)的结合中属于检索增强推理类型。其核心目的是通过检索外部知识来增强大型语言模型(LLMs)的推理能力,解决以下问题:
论文未聚焦于通过推理优化检索策略(如意图解析或查询改写),而是专注于通过检索弥补知识缺口,提升多步推理的可靠性。因此,其核心目标是“通过检索增强推理能力”,而非“通过推理优化检索质量”。
→ 核心推理流程:
问题分解 → 主动检索触发 → 文档整合 → 验证迭代 → 最终答案生成
<begin_of_query>)主动触发检索,获取外部知识。<begin_of_documents>...</end_of_documents>)被嵌入推理路径,作为后续生成的依据。<answer>标签)并覆盖真实答案(Cover Exact Match)。单次迭代单元为 “检索触发 → 文档整合 → 局部推理验证”。模型在每次推理中可动态决定是否触发新的检索(见图6案例中的多轮检索)。
属于动态流程的Agentic RAG。