GBrain:把知识库做成 agent 的长期运行时
GBrain 不是一个更漂亮的 wiki,而是把 compiled truth、timeline、hybrid search、skills 与同步规程结合起来的 agent knowledge runtime。
背景
GBrain 是 Garry Tan 分享的一个 agent brain 项目。它的目标不是再做一个笔记工具,而是把“人的世界知识”变成 AI agent 可持续读写的长期记忆层:会议、邮件、社媒、日历、语音、原创想法,都能持续进入同一个知识脑。
核心问题
传统知识库最大的问题不是“存不下”,而是“活不起来”:
- 人写进去就不再更新
- agent 只能临时检索,缺少状态
- 证据和结论混在一起,越用越乱
GBrain 的解法是把知识库做成一个运行时,而不是文档堆。
架构拆解
它的结构非常清楚:
- Markdown 作为原始内容格式
- Postgres / PGLite 作为存储层
- pgvector + 关键词检索 + query expansion 作为检索层
- compiled truth + timeline 作为页面模型
- skills / recipes / docs 作为操作规程
页面不是单层文本,而是两层:
- 上层
compiled_truth:当前结论,随证据变化而重写 - 下层
timeline:证据日志,只追加不回写
这一步非常关键,因为 agent 最需要的不是“全文历史”,而是“当前状态 + 可追溯证据”。
核心机制
1. 三种搜索模式
search:关键词检索,适合已知名词query:混合检索,适合自然语言问题get:按 slug 直读全文
2. RRF 融合
query 不是单纯向量搜索,而是把关键词和向量结果用 RRF 融合。这样既保留精确匹配,也保留语义召回。
3. 双后端
- Postgres:生产路径,支持并发、事务、pgvector
- PGLite:本地模式,适合快速启动和单机演示
4. 导入管线
导入顺序是:解析 Markdown → chunk → embed → 事务写库。外部调用放在事务外,数据库写入统一收口,工程上很稳。
产品价值
GBrain 的价值不在“做知识库”这件事本身,而在它把知识库升级成了 agent 可操作的长期记忆基础设施。
它解决的是一个更高阶的问题:
让 agent 每次回答前先读 brain,回答后再写 brain。
这意味着知识不是静态资产,而是不断编译、不断增量更新的运行系统。
优势与不足
优势
- 定位极清晰:agent memory backend
- 读写闭环完整:检索、导入、同步、验证都考虑到了
- 文档和规程很强:README、skillpack、verify、guides 形成闭环
- 工程化程度高:双后端、事务、锁、版本、embedding 都齐了
不足
- 对模型能力和持续运维依赖很强
- 对普通用户学习成本高
- 外部依赖较重:数据库、embedding、query expansion、同步链路
- 更适合“有 agent 的人”,不适合只想轻量记笔记的人
结论
如果你把它当成一个 wiki,会低估它;如果你把它当成一个 knowledge runtime,就能看见它真正的价值。
我对 GBrain 的判断是:这是一个很值得研究、也很可能影响 agent memory 产品形态的项目。它最值得借鉴的不是某个单点功能,而是它把“compiled truth + timeline + hybrid search + 操作规程”拼成了一套可持续运行的系统。