RAG 和 GraphRAG 阿航的博客

发表评论
123 次浏览

A+

所属分类：笔记

1 RAG

1.1 RAG的定义

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索（Retrieval）和生成模型（Generation）的方法。它的核心思想是：在生成文本前，先从外部知识库或文档中检索相关信息，并将这些信息作为额外上下文输入给生成模型，从而提升生成结果的准确性、可靠性，克服大模型的幻觉。

1.2 RAG的一般流程

知识库构建：文本/代码/图片 -> Embedding -> Vectors -> 生成向量数据库/知识库（包括Pinecone、Chroma、PostgreSQL-pgvector等）。
Retrieval（检索）：Prompt -> Embedding -> Vectors -> 外部数据库（如向量数据库）中检索匹配。
Fusion and Generation（融合生成）：
- 将检索到的内容与原始 prompt 拼接或融合。
- 调用 LLM（如 GPT、LLaMA、Mistral）生成答案。

RAG 已经从单纯检索+生成，逐渐演进到动态检索、自适应生成、结构化知识融合、多模态扩展、智能体驱动的路线，未来趋势是让 LLM 更好地利用外部知识，并具备自主决策能力。

向量数据库格式：[嵌入向量 : 文本]

传统数据库格式：[文本 : 文本]

2 GraphRAG

2.1 GraphRAG的定义

GraphRAG（Graph-based Retrieval-Augmented Generation） 是一种将图结构知识引入 RAG 框架的方法。与传统 RAG 仅依赖向量检索不同，GraphRAG 通过图数据库/知识图谱来组织、存储和检索信息，使得生成模型不仅能看到相关的文档片段，还能理解实体之间的关系和上下文语义结构。

换句话说：

普通 RAG = 把文本切成碎片（改过程称为 Chunking），按语义相似度（如 Embedding 后的向量余弦值、欧式距离、点积等）查询和匹配。
GraphRAG = 把知识组织成图（节点+边），不仅查到“相关内容”，还能查到“相关关系”。

2.2 GraphRAG的核心步骤

构建知识图谱：从文本或数据库中抽取实体（nodes）和关系（edges）。
图检索（Graph Retrieval）：输入查询后，先在图谱中找到相关节点；可进行邻居扩展（neighbor expansion）或多跳推理，找到更完整的上下文。
上下文组装（Context Assembly）：把检索到的子图转化为文本或结构化上下文（如三元组）。
增强生成（Augmented Generation）：将子图信息 + 用户问题一起输入大模型，生成更加准确的回答。

文档级 GraphRAG 流程：长文档切分（chunking：以单词、语句或段落为单位）-> 抽取关键词、实体、关系 -> 构建成 局部知识图谱，节点表示实体，边表示关系 -> 检索图谱相关部分作为上下文，融合 User Prompt 交给 LLM 生成答案。

跨文档级 GraphRAG 流程：长文档切分 -> 将不同文档中的实体进行 对齐与去重 -> 将实体和关系合并，构成一个 跨文档大图谱 -> 在问答时，跨越不同文档找到答案路径，实现 知识融合与多跳推理。