Uber:如何在 5 个月里把 AI Skills 从 2 扩到 500+,企业 AI 落地真正靠什么
Uber 的关键不是“AI 战略”,而是把 AI 做成了可复用、可治理、可自发扩散的工程技能市场。
Uber 如何把 2 个 Claude Skills 扩成 500+:企业 AI 落地真正靠什么
故事先讲清楚
这篇文章讲的是 Uber 内部一件很典型、也很反直觉的事。
最开始,只有一个工程师在内部 repo 里做了 2 个 Claude Skills:一个处理 CI 日志的 triage / repair,另一个做基础 code review。没有 kickoff,没有 steering committee,也没有预算审批,管理层甚至一开始都不知道这个东西存在。
但它没有停在试验阶段。几个月后,越来越多工程师在自己的日常工作里用到了这些技能:有人拿它看日志,有人拿它做代码审查,有人把它接到验证流程里。因为它真的能省时间、能把事情做完,这个内部 repo 逐渐从 2 个技能扩成了 500+ skills,覆盖代码审查、生产监控、验证和组织知识沉淀等多个环节。
所以这篇案例真正值得看的,不是“Uber 有多少 AI 技能”,而是:一个小工具,为什么能在企业里自然长成一套技能市场。
核心问题
这篇案例回答的是一个很现实的问题:
企业里的 AI,怎样才能从试验品变成日常工作的一部分?
很多公司卡在三个地方:
- AI 不能直接帮人省时间,所以一线工程师没动力用
- AI 工具太散,没有统一的分发和治理机制
- AI 产出不够可验证,一旦进生产就会让团队不放心
Uber 的做法,是把 AI 变成一套可扩展的“技能市场”。
Uber 做了什么
1) 从一个人、两个技能开始
最早的内部 marketplace 只有两个工具:
- CI 日志 triage / repair skill
- 基础 code reviewer
它们都不是宏大能力,而是非常具体、非常高频的问题。
这很关键。因为工程师真正愿意为 AI 付出注意力的,不是概念,而是“我现在就能少做一件麻烦事”。
2) 让扩散发生在工作流里
增长不是靠培训会,也不是靠管理层宣讲,而是靠一次次实打实的节省时间:
- 2024 年 10 月:2 个 skills
- 2024 年 12 月:大约 20 个 skills
- 2025 年 1 月:团队开始明显感受到“这东西真的有用”
- 2025 年 3 月:200+ curated skills,300+ experimental tools
文章里最重要的信号是:
工程师不是被要求去用 AI,而是在工作里碰到了 AI 真的能帮忙的点,然后自己开始造更多工具。
3) 把 AI 做成两层市场
Uber 没有把所有技能混成一个大仓库,而是拆成两层:
Golden Marketplace
- 自动加载
- 默认可用
- 严格治理
- 手工 code review
- CI/CD 检查
- LLM-as-a-Judge 评估
- 只保留 100–200 个核心技能
Personal Sandbox
- 通过 URL 分享
- 手动加载
- 不设上限
- 允许快速试验
- 适合团队和个人的小工具
这个结构很像企业版“核心区 + 试验区”的设计:
- 核心区要稳
- 试验区要快
- 让创新先在边缘发生,再筛选进入核心
技术机制:Uber 为什么能撑住 500+ Skills
1) 技能不是一个按钮,而是一个“技能家族”
比如 code review,不是简单一个“Review Code”按钮,而是按任务复杂度分层:
- typo fix:轻量 review
- 影响支付逻辑的改动:深度架构审查
这说明 Uber 不是把 AI 当成“自动替代人”,而是把它当成“按需增强人”。
2) 验证比生成更重要
文章里提到的另一个重点是 verification。
AI 写代码不稀奇,真正难的是:
- 这段代码能不能跑
- UI 会不会坏
- 测试会不会过
- 环境切换后是否仍然稳定
Uber 把技能接到了验证链路里,比如:
- 启动 iOS simulator
- 切 dark / light mode
- 切语言
- 跑测试
- 确认生成结果没有破坏界面
这一步特别重要,因为它把 AI 从“会说”推进到“会验”。
3) 把组织知识外化成技能
Uber 还把 senior engineer 的经验做成 Claude Skills:
- Go GC 调优
- AWS 路由修复
- 特定架构判断
这意味着:
- 新人可以拿到以前只能靠请教 senior 才能获得的经验
- 组织知识不再只存在于人的脑子里
- 技能本身成为可复用资产
换句话说,Uber 在做的不是“更多 AI”,而是“把组织经验产品化”。
为什么这套方法能跑起来
1) 解决的是高频小痛点
最先成功的工具不是最复杂的,而是最贴近日常工作的:
- 日志 triage
- 代码审查
- 生产监控
- 验证
这些任务都很具体,也最容易让工程师感受到“这东西省我时间”。
2) 让工程师成为创造者,不只是消费者
很多企业 AI 项目死在一个地方:工程师只能“使用”,不能“改造”。
Uber 的模式是:
- 工程师自己能建 skill
- 有用的 skill 再进入市场
- 市场再决定它是不是值得标准化
这会形成正循环:
用到 → 发现省时 → 想自己做 → 做出来再扩散
3) 把治理放在核心,不扼杀边缘创新
Uber 的两层市场其实是在平衡两个目标:
- 不让核心系统失控
- 不让创新死在流程里
这比“一刀切的统一平台”更适合大型组织。
这件事对企业 AI 落地意味着什么
这篇案例最有价值的结论是:
企业 AI 的规模化,不一定先来自“战略”,而更可能来自一个个真正能省时间的技能包。
它给团队的启发很直接:
- 先做小工具,不要先画大饼
- 先让一线工程师省时间,再谈平台化
- 先把有用能力沉淀成技能,再考虑治理和标准化
- 不要只看生成能力,要把验证链路接上
- 把组织知识做成资产,而不是留在少数人脑子里
适合谁看
这篇案例尤其适合:
- 做企业 AI 平台的人
- 做开发者工具的人
- 做 Agent / Workflow / Copilot 产品的人
- 关心 AI 如何真正进入工程生产流程的人
如果你正在做企业内部 AI 项目,这篇文章的重点不是“Uber 做了什么花活”,而是:
他们用什么机制,让 AI 真的开始被一线工程师持续使用。
我的判断
Uber 这件事不是“500+ skills 很厉害”这么简单。它更像是在证明一个判断:
企业 AI 最先跑通的,不是通用大模型能力,而是围绕高频工作流的可复用技能市场。
它的价值不在于把一切自动化,而在于:
- 把 AI 插进日常工作流
- 把知识从个人脑中外化
- 把有效工具做成可治理资产
- 把创新从中心放到边缘,再回收到核心
这比“开个 AI 战略会”更接近真实落地。
一句话总结
Uber 的成功不是先有战略再落地,而是先让 AI 在工程师的真实工作流里省时间,再把有用的能力沉淀成一个可治理的技能市场。