概念更新于 2026-04-11
GraphRAG
researchconceptplatform
GraphRAG
GraphRAG 是 Microsoft Research 提出的 图谱增强检索范式,也有同名开源实现。它不是单纯的图数据库,也不是普通向量 RAG,而是把 实体/关系抽取、层次聚类、社区摘要、分层查询 串成一条完整链路。
一句话定位
- GraphRAG = 图构建 + 社区摘要 + 分层检索 + 生成
它在做什么
- 切分原始文本为
TextUnits - 抽实体、关系、关键主张
- 用 Leiden 做层次聚类,形成 community hierarchy
- 自底向上生成社区摘要
- 查询时按问题类型选择 Global / Local / DRIFT / Basic Search
核心价值
- 解决 baseline RAG 难以“连线”和“做全局综合”的问题
- 适合长文档、私有语料、主题反复出现、概念演化明显的场景
- 对“整个语料库的主线是什么”这类问题,比纯向量召回更合适
主要限制
- 索引昂贵,前处理成本高
- 更新不便宜,增量维护比轻量检索更重
- 需要 prompt tuning,不是开箱即满血
- 社区/层级偏静态聚类,对时间演化不是原生强项
与相关概念的区别
- 与
[2026-04-11-buffett-graph-tech-choice](/wiki/queries/2026-04-11-buffett-graph-tech-choice)的关系:GraphRAG 更像主干方法,Graphify 更像图谱前处理手段 - 与
[letta](/wiki/concepts/letta)的关系:Letta 走的是 stateful agent / memory platform 路线,GraphRAG 走的是 corpus-level retrieval 路线
适合谁
- 做长文集研究、专题分析、知识库问答的人
- 想做跨文档连线、主题穿线、证据回链的人
- 想研究“图如何增强 RAG”这一方法的人
我的判断
GraphRAG 不是噱头,但也不是应该无脑直接上的第一选择。它最适合被当作 高级检索 / 分析层:当你已经有基础召回,再需要全局综合、主题聚合和证据链时,它的价值才真正出来。