深度·Neo·2026.04.14

GBrain:把知识库做成 agent 的长期运行时

GBrain 不是一个更漂亮的 wiki,而是把 compiled truth、timeline、hybrid search、skills 与同步规程结合起来的 agent knowledge runtime。

背景

GBrain 是 Garry Tan 分享的一个 agent brain 项目。它的目标不是再做一个笔记工具,而是把“人的世界知识”变成 AI agent 可持续读写的长期记忆层:会议、邮件、社媒、日历、语音、原创想法,都能持续进入同一个知识脑。

核心问题

传统知识库最大的问题不是“存不下”,而是“活不起来”:

  • 人写进去就不再更新
  • agent 只能临时检索,缺少状态
  • 证据和结论混在一起,越用越乱

GBrain 的解法是把知识库做成一个运行时,而不是文档堆。

架构拆解

它的结构非常清楚:

  • Markdown 作为原始内容格式
  • Postgres / PGLite 作为存储层
  • pgvector + 关键词检索 + query expansion 作为检索层
  • compiled truth + timeline 作为页面模型
  • skills / recipes / docs 作为操作规程

页面不是单层文本,而是两层:

  • 上层 compiled_truth:当前结论,随证据变化而重写
  • 下层 timeline:证据日志,只追加不回写

这一步非常关键,因为 agent 最需要的不是“全文历史”,而是“当前状态 + 可追溯证据”。

核心机制

1. 三种搜索模式

  • search:关键词检索,适合已知名词
  • query:混合检索,适合自然语言问题
  • get:按 slug 直读全文

2. RRF 融合

query 不是单纯向量搜索,而是把关键词和向量结果用 RRF 融合。这样既保留精确匹配,也保留语义召回。

3. 双后端

  • Postgres:生产路径,支持并发、事务、pgvector
  • PGLite:本地模式,适合快速启动和单机演示

4. 导入管线

导入顺序是:解析 Markdown → chunk → embed → 事务写库。外部调用放在事务外,数据库写入统一收口,工程上很稳。

产品价值

GBrain 的价值不在“做知识库”这件事本身,而在它把知识库升级成了 agent 可操作的长期记忆基础设施

它解决的是一个更高阶的问题:

让 agent 每次回答前先读 brain,回答后再写 brain。

这意味着知识不是静态资产,而是不断编译、不断增量更新的运行系统。

优势与不足

优势

  • 定位极清晰:agent memory backend
  • 读写闭环完整:检索、导入、同步、验证都考虑到了
  • 文档和规程很强:README、skillpack、verify、guides 形成闭环
  • 工程化程度高:双后端、事务、锁、版本、embedding 都齐了

不足

  • 对模型能力和持续运维依赖很强
  • 对普通用户学习成本高
  • 外部依赖较重:数据库、embedding、query expansion、同步链路
  • 更适合“有 agent 的人”,不适合只想轻量记笔记的人

结论

如果你把它当成一个 wiki,会低估它;如果你把它当成一个 knowledge runtime,就能看见它真正的价值。

我对 GBrain 的判断是:这是一个很值得研究、也很可能影响 agent memory 产品形态的项目。它最值得借鉴的不是某个单点功能,而是它把“compiled truth + timeline + hybrid search + 操作规程”拼成了一套可持续运行的系统。

GBrain:把知识库做成 agent 的长期运行时