AAR | Notion

Untitled

Q: 这篇论文试图解决什么问题？

A: 这篇论文试图解决的问题是如何提高大型语言模型（LMs）在知识密集型任务中的泛化能力，特别是在零样本（zero-shot）场景下。尽管大型LMs拥有数十亿参数并能够捕捉大量人类知识，但它们在效率、准确性和可解释性方面存在局限性。此外，大型LMs的高计算成本也影响了它们的实用性。为了克服这些挑战，论文提出了一种名为Augmentation-Adapted Retriever (AAR) 的方法，旨在通过检索增强（retrieval augmentation）来辅助LMs，而无需对LMs进行微调（fine-tuning）。

AAR的核心思想是创建一个通用的检索插件，它可以与未知的或无法共同微调的LMs配合使用。通过使用一个小型的源LM来提供LM偏好的信号，AAR能够在训练过程中学习这些偏好，并在不直接微调目标LM的情况下，通过检索到的文档来增强目标LM的性能。这种方法允许AAR作为一个通用插件，服务于各种不同的目标LM，从而提高了LMs在零样本任务中的泛化能力。

Q: 有哪些相关研究？

A: 相关研究主要集中在以下几个方面：

检索增强（Retrieval Augmentation）：
- 先前的研究探索了如何通过检索器从外部语料库中检索知识来增强LMs。例如，Guu et al. (2020) 和 Lewis et al. (2020) 展示了检索增强在多种知识密集型任务上的有效性。这些方法通常需要对LM进行端到端的微调，以适应检索器并处理特定的下游任务。
零样本学习和推理（Zero-shot Learning and Reasoning）：
- 大规模的无监督预训练LMs，如GPT-3 (Brown et al., 2020) 和 GPT-4 (OpenAI, 2023)，能够在推理时执行零样本学习。这些模型通过在推理时提供任务描述来执行多种下游任务。
- Instruction-finetuned LMs，如Sanh et al. (2022) 和 Chung et al. (2022)，通过使用人类指导在多个监督任务上进行预训练，也展现出了强大的零样本学习能力。
检索器与LM的解耦（Decoupling Retriever and LM）：
- Rubin et al. (2022) 和 Lin et al. (2022) 提出了独立于LM的检索器训练方法，这些方法允许在不微调LM的情况下进行检索增强。
- 其他研究，如Shi et al. (2023)，使用LM的似然度来训练检索器，以满足黑盒LM的偏好。
零样本检索增强（Zero-shot Retrieval Augmentation）：
- 最近的研究，如Ouyang et al. (2022)，探索了不微调LM的零样本检索增强方法。这些方法可以受益于实体中心的问题回答、思维链推理和多跳问题回答。
知识注入（Knowledge Injection）：
- 通过映射网络（Zhang et al., 2023）或文档编码（Xiao et al., 2023）来增强LMs的零样本性能，这是一种即插即用的知识注入方法。

这些相关研究为AAR方法提供了理论基础和技术背景，AAR在此基础上进一步探索了如何通过源LM的偏好来训练检索器，以便在不直接微调目标LM的情况下提高其泛化能力。

Q: 论文如何解决这个问题？

A: 论文通过提出一种名为Augmentation-Adapted Retriever (AAR) 的方法来解决这个问题，具体步骤如下：

源LM的选择：
- 选择一个小型的编码器-解码器语言模型（如Flan-T5Base）作为源LM，用于提供LM偏好的信号。
LM偏好的获取：
- 使用源LM的融合在解码器中的注意力分数（fusion-in-decoder attention scores）来注释LM偏好的文档。这些文档被视为正面文档集的一部分。
正面和负面文档集的构建：
- 结合人类偏好的正面文档集（即地面真相）和LM偏好的文档，形成训练检索器的正面文档集。
- 使用ANCE（Xiong et al., 2021）技术挖掘负面文档，这些文档不会被检索器检索到。
检索器的微调：
- 使用上述构建的正面和负面文档集对检索器进行微调，使其能够检索出对目标LM有用的文档。