Neo4j 不是向量库替代品,它是企业 AI 的关系层
Neo4j 在企业 AI 里的核心价值不是图数据库本身,而是把关系、路径、证据和权限组织成可解释检索层。本文验证了 Walmart AdaptJobRec 等真实企业案例。
Source: https://github.com/neo4j/neo4j | https://neo4j.com/customer-stories/
很多团队第一次接触 Neo4j 时,会把它理解成“一个更高级的数据库”。但如果你把它放到企业 AI 的场景里看,会发现它真正解决的不是“存什么”,而是“怎么把关系、路径、证据和权限一起交给 AI”。
这也是 Neo4j 这几年最重要的变化:它不再只是图数据库,而是在往 企业知识图谱、GraphRAG、Agent memory 和可解释检索层 走。
背景:为什么光靠向量不够
向量检索很擅长回答“像不像”,但企业 AI 真正常遇到的问题往往是:
- 这份答案为什么重要?
- 这条结论沿着哪条证据链得出来?
- 这个人、这份文档、这个系统、这条权限之间是什么关系?
- 如果要追责、审计、回溯,路径在哪里?
这些问题不是“相似度”能完全解决的。它们需要一层能把实体、关系、来源、版本、责任人、权限串起来的结构。
Neo4j 的位置,恰好就在这里。
Neo4j 在 AI 里最有价值的 4 个场景
| 步骤 | 做什么 | Neo4j 的作用 |
|---|---|---|
| 1 | 向量 / 关键词召回 | 先拿到候选证据 |
| 2 | 图遍历 | 沿实体、关系、权限、来源继续扩展 |
| 3 | 证据链组织 | 把路径、责任人、版本和出处串起来 |
| 4 | LLM 生成 | 基于结构化上下文输出可解释答案 |
1. GraphRAG
向量先召回候选,Neo4j 再沿图扩展:
- 实体消歧
- 关系补全
- 来源追踪
- 证据链回溯
这比单纯把 chunk 丢给 LLM,更适合长文档、企业文档和跨系统知识。
2. 企业知识问答
在制药、金融、软件、制造这些场景里,答案往往不是“一个文本片段”,而是:
- 相关人
- 相关系统
- 相关流程
- 历史决策
- 风险路径
Neo4j 能把这些东西组织成可查询的知识网络。
3. Agent memory
如果把智能体当成长期运行的工作系统,记忆不该只是聊天记录,而是:
- 用户偏好
- 任务状态
- 工具调用
- 历史结果
- 依赖关系
这些内容天然更像图,而不是纯文本。
4. 可解释 AI / 审计型 AI
企业真正愿意付费的 AI,往往不是“会说”,而是“说得清、查得到、回得去”。 Neo4j 在这里的优势是:
- 能给出路径
- 能给出来源
- 能给出上下文
- 能把权限和版本纳入检索过程
真实企业案例
Neo4j 在 AI Agent 的落地案例正在快速增加,以下是经过验证的真实项目:
Walmart:职业推荐 Agent
Walmart 全球技术团队构建了 AdaptJobRec,用 Neo4j 知识图谱建模"角色-技能-成长路径"的关系网络。Agent 能沿着技能图谱做多跳推理,为员工推荐个性化的职业发展路径。
- 效果:延迟降低 53%,推荐质量显著提升
- 论文:AdaptJobRec: Enhancing Conversational Career Recommendation through an Agentic Knowledge Graph Approach
Floorboard AI:空管训练 Agent
Floorboard 将**机场布局(图式楼、滑行道、跑道、停机位)**建模为 Neo4j 图谱,结合天气和流量数据,构建了一个真实的空中交通管制模拟环境。Agent 可以在这张图上做路径规划、冲突检测和实时决策。
- 场景:飞行员训练、AI 管制员对话模拟
- 特点:图结构让 Agent 理解机场的拓扑关系,而不只是文本描述
其他已公开案例
- Gilead Sciences:用知识图谱做欺诈检测,查询性能提升 1000 倍
- JupiterOne:网络安全态势图谱,自动推理攻击路径
- Arhasi:合规监控从 6 个月缩短到 6 周
- Quollio:企业元数据知识图谱,做数据血缘和合规查询
这些案例的共同点:不是只要 TopK,而是要关系、证据和治理一起进来。
Neo4j 的比较优势
| 维度 | Neo4j | 向量库 | 关系库 | 云厂商图能力 |
|---|---|---|---|---|
| 核心强项 | 关系、路径、解释 | 相似召回 | 事务、报表 | 采购、集成 |
| AI 角色 | 关系层 / 证据层 | 召回层 | 业务结构层 | 足够好底座 |
| 适合问题 | 为什么、怎么连、证据在哪 | 像不像 | 记录和统计 | 快速上线 |
| 短板 | TCO 不一定最低 | 关系表达弱 | 多跳查询重 | 图产品深度较弱 |
Neo4j 不一定最便宜,但它往往更适合做“AI 的关系中枢”。
结论
如果你的 AI 产品只需要相似检索,Neo4j 不是第一选择。
但如果你的问题是:
- 这件事和那件事怎么连起来?
- 为什么是这条证据链?
- 谁负责、谁审批、谁受影响?
- 这条知识从哪里来、能不能回溯?
那 Neo4j 就不是“可有可无”的数据库,而是企业 AI 的基础设施。
它最强的价值,不是把数据变成图,而是把 关系、路径、上下文和可解释性 变成可以被 AI 直接使用的结构。