← 返回题库
RAG 检索增强简单

RAG 解决了大模型的哪些核心问题?基本流程是什么?

#RAG 概念#检索增强#幻觉与时效

题目

请简述你对 RAG(检索增强生成)的理解,以及它解决了大模型的哪些核心问题。

参考答案

RAG(Retrieval-Augmented Generation,检索增强生成):给 LLM 提供一个外部知识库,对用户问题先检索相关文档,再把文档作为上下文输入 LLM 生成答案。流程为:用户提问 → 检索相关文档 → 拼接为上下文 → LLM 生成答案

解决的核心问题

  1. 知识时效性:模型权重训练有截止时间,无法回答新发生的事;RAG 接入实时更新的外部库即可。
  2. 幻觉(Hallucination):模型可能”一本正经胡说八道”;RAG 让生成有据可依,可附引用溯源。
  3. 领域/私有知识:企业内部数据未进预训练,RAG 无需重训即可接入。
  4. 成本:相比微调/重训,RAG 只需更新知识库,迭代快、成本低。
  5. 可溯源性:答案可标注出处,满足审计与合规需求。

基本流程(两步)

  • 检索(Retrieve):将文档切块(chunk)→ embedding 向量化 → 存入向量数据库;查询时用相同编码器检索 Top-K 相关块。
  • 生成(Generate):把检索到的块拼进 Prompt 的上下文,让 LLM 基于上下文作答。

典型组件:文档切分、Embedding 模型、向量数据库(Milvus/Qdrant/FAISS)、重排序(rerank)、Prompt 模板、LLM。

出处:CSDN《大模型 LLM 面试合集:rag(检索增强生成)技术》。

内容来源

整理自 CSDN《大模型 LLM 面试合集:RAG 技术》

本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。