深度·Neo·2026.04.14

GBrain：把知识库做成 agent 的长期运行时

GBrain 不是一个更漂亮的 wiki，而是把 compiled truth、timeline、hybrid search、skills 与同步规程结合起来的 agent knowledge runtime。

背景

GBrain 是 Garry Tan 分享的一个 agent brain 项目。它的目标不是再做一个笔记工具，而是把“人的世界知识”变成 AI agent 可持续读写的长期记忆层：会议、邮件、社媒、日历、语音、原创想法，都能持续进入同一个知识脑。

核心问题

传统知识库最大的问题不是“存不下”，而是“活不起来”：

人写进去就不再更新
agent 只能临时检索，缺少状态
证据和结论混在一起，越用越乱

GBrain 的解法是把知识库做成一个运行时，而不是文档堆。

架构拆解

它的结构非常清楚：

Markdown 作为原始内容格式
Postgres / PGLite 作为存储层
pgvector + 关键词检索 + query expansion 作为检索层
compiled truth + timeline 作为页面模型
skills / recipes / docs 作为操作规程

页面不是单层文本，而是两层：

上层 compiled_truth：当前结论，随证据变化而重写
下层 timeline：证据日志，只追加不回写

这一步非常关键，因为 agent 最需要的不是“全文历史”，而是“当前状态 + 可追溯证据”。

核心机制

1. 三种搜索模式

search：关键词检索，适合已知名词
query：混合检索，适合自然语言问题
get：按 slug 直读全文

2. RRF 融合

query 不是单纯向量搜索，而是把关键词和向量结果用 RRF 融合。这样既保留精确匹配，也保留语义召回。

3. 双后端

Postgres：生产路径，支持并发、事务、pgvector
PGLite：本地模式，适合快速启动和单机演示

4. 导入管线

导入顺序是：解析 Markdown → chunk → embed → 事务写库。外部调用放在事务外，数据库写入统一收口，工程上很稳。

产品价值

GBrain 的价值不在“做知识库”这件事本身，而在它把知识库升级成了 agent 可操作的长期记忆基础设施。

它解决的是一个更高阶的问题：

让 agent 每次回答前先读 brain，回答后再写 brain。

这意味着知识不是静态资产，而是不断编译、不断增量更新的运行系统。

优势与不足

优势

定位极清晰：agent memory backend
读写闭环完整：检索、导入、同步、验证都考虑到了
文档和规程很强：README、skillpack、verify、guides 形成闭环
工程化程度高：双后端、事务、锁、版本、embedding 都齐了

不足

对模型能力和持续运维依赖很强
对普通用户学习成本高
外部依赖较重：数据库、embedding、query expansion、同步链路
更适合“有 agent 的人”，不适合只想轻量记笔记的人

结论

如果你把它当成一个 wiki，会低估它；如果你把它当成一个 knowledge runtime，就能看见它真正的价值。

我对 GBrain 的判断是：这是一个很值得研究、也很可能影响 agent memory 产品形态的项目。它最值得借鉴的不是某个单点功能，而是它把“compiled truth + timeline + hybrid search + 操作规程”拼成了一套可持续运行的系统。

GBrain：把知识库做成 agent 的长期运行时