OpenViking：字节把 AI Agent 的上下文管理做成了文件系统

建议摘要：OpenViking 不是又一个向量库，而是在把“Agent 的记忆、资源、技能”统一收进一个可递归、可观察、可分层加载的上下文数据库里。它更像 Agent 时代的上下文操作系统，而不是传统 RAG 工具。

先说结论

如果你只把 OpenViking 看成“开源向量检索项目”，会低估它。

它真正想做的，是把 AI Agent 运行时最麻烦的一层——上下文管理——做成基础设施：

记忆不再散落在 prompt、代码、向量库和临时缓存里
资源不再只是扁平文档，而是可按目录组织、递归检索的上下文树
技能不再只是工具函数，而是可被调用、可被沉淀、可被复用的上下文资产
会话不再只是聊天记录，而是能提炼长期记忆的成长过程

一句话概括：

OpenViking 不是“更好的 RAG”，而是在尝试做 Agent 时代的上下文操作系统。

这个项目到底在解决什么问题

传统 RAG 和普通记忆系统，最常见的问题有几个：

上下文碎片化
- 记忆在对话记录里
- 文档在知识库里
- 技能在代码里
- 结果就是：Agent 很难统一理解“我现在到底拥有什么上下文”
长任务会膨胀
- Agent 一跑就是几十轮
- 上下文越来越大
- 直接截断会丢信息，直接压缩又容易损失关键细节
检索是黑盒
- 扁平向量检索能找相似，但很难解释“为什么是这段”
- 一旦错召回，调试体验很差
记忆不会自己进化
- 很多系统只是“存对话”
- 但真正有价值的是：把对话里的偏好、事件、模式、工具经验提炼出来

OpenViking 的思路，是把这些问题统一收口到一个文件系统范式里解决。

项目概览

仓库：volcengine/OpenViking
维护方：字节跳动 / 火山引擎
许可证：AGPL-3.0
创建时间：2026-01-05
最新 Release：v0.3.9（2026-04-18）
Stars：约 22.5k
定位：面向 AI Agents 的 Context Database

它的定位不是“一个工具”，而是“Agent 的上下文底座”。

架构拆解：文件系统 + 分层上下文 + 递归检索

OpenViking 的核心抽象很统一：
它把所有上下文都变成一个 viking:// 风格的虚拟文件系统。

flowchart TB A[Client\nSync / Async / HTTP / CLI] B[Service Layer\nFS / Search / Session / Resource / Relation] C[VikingFS\nviking:// 虚拟文件系统] D[AGFS\n文件存储层] E[queuefs\nSemanticQueue / EmbeddingQueue] F[SemanticProcessor\n生成 L0/L1 + 向量化] G[Vector Index] H[Session System\ncommit / archive / memory extraction] I[Retrieval\nintent analysis + recursive search + rerank] A --> B --> C B --> H C --> D C --> E E --> F F --> G H --> C B --> I I --> C

三种上下文类型

OpenViking 不是只存文档，它把上下文分成三类：

Resource：知识和规则，比如文档、FAQ、代码仓库
Memory：Agent 的长期记忆，比如用户偏好、事件、模式
Skill：可调用能力，比如工具、MCP、工作流

对应路径大致是：

viking://resources/...
viking://user/memories/...
viking://agent/skills/...

这一步很关键。
因为它不是把所有东西都混成“文本块”，而是从一开始就给上下文分了角色。

核心机制 1：L0 / L1 / L2 三层上下文

OpenViking 的另一个核心，是把内容分成三层：

flowchart TB L2[L2 原文 / 原始文件] L1[L1 .overview.md\n导航型摘要] L0[L0 .abstract.md\n极短摘要] V[向量检索] R[Rerank / 路径理解] O[按需读取原文] L2 -->|bottom-up 生成| L1 L2 -->|bottom-up 生成| L0 L0 --> V L1 --> R L2 --> O

这三层分别干什么

L0
- 很短
- 适合快速过滤和向量召回
L1
- 更完整
- 适合 rerank 和理解目录结构
L2
- 原始内容
- 真正需要细节时再加载

这个设计的价值

它解决的是“上下文不能一次性全塞给模型”的问题。
先给一个极短摘要，再给导航摘要，最后才给原文。

这会带来两个好处：

省 token
更容易按层级理解内容

对 Agent 来说，这比“把所有资料直接拼 prompt”合理得多。

核心机制 2：递归检索，不是扁平搜索

OpenViking 的检索不是单纯“搜相似文本”，而是：

先做 intent analysis
生成 0–5 个 TypedQuery
在对应根目录做全局搜索
再在目录树里递归深入
最后 rerank

检索流程图

flowchart LR Q[用户查询] --> IA[Intent Analysis] IA --> TQ[TypedQuery] TQ --> GS[Global Search] GS --> HQ[Recursive Directory Search] HQ --> RK[Rerank] RK --> R[返回结果]