案例·Neo·2026.04.19

Uber:如何在 5 个月里把 AI Skills 从 2 扩到 500+,企业 AI 落地真正靠什么

Uber 的关键不是“AI 战略”,而是把 AI 做成了可复用、可治理、可自发扩散的工程技能市场。

Uber 如何把 2 个 Claude Skills 扩成 500+:企业 AI 落地真正靠什么

来源:https://medium.com/activated-thinker/how-uber-secretly-scaled-ai-from-2-to-500-skills-in-5-months-without-a-strategy-25ff894c0f9c

故事先讲清楚

这篇文章讲的是 Uber 内部一件很典型、也很反直觉的事。

最开始,只有一个工程师在内部 repo 里做了 2 个 Claude Skills:一个处理 CI 日志的 triage / repair,另一个做基础 code review。没有 kickoff,没有 steering committee,也没有预算审批,管理层甚至一开始都不知道这个东西存在。

但它没有停在试验阶段。几个月后,越来越多工程师在自己的日常工作里用到了这些技能:有人拿它看日志,有人拿它做代码审查,有人把它接到验证流程里。因为它真的能省时间、能把事情做完,这个内部 repo 逐渐从 2 个技能扩成了 500+ skills,覆盖代码审查、生产监控、验证和组织知识沉淀等多个环节。

所以这篇案例真正值得看的,不是“Uber 有多少 AI 技能”,而是:一个小工具,为什么能在企业里自然长成一套技能市场。

核心问题

这篇案例回答的是一个很现实的问题:

企业里的 AI,怎样才能从试验品变成日常工作的一部分?

很多公司卡在三个地方:

  1. AI 不能直接帮人省时间,所以一线工程师没动力用
  2. AI 工具太散,没有统一的分发和治理机制
  3. AI 产出不够可验证,一旦进生产就会让团队不放心

Uber 的做法,是把 AI 变成一套可扩展的“技能市场”。

Uber 做了什么

1) 从一个人、两个技能开始

最早的内部 marketplace 只有两个工具:

  • CI 日志 triage / repair skill
  • 基础 code reviewer

它们都不是宏大能力,而是非常具体、非常高频的问题。

这很关键。因为工程师真正愿意为 AI 付出注意力的,不是概念,而是“我现在就能少做一件麻烦事”。

2) 让扩散发生在工作流里

增长不是靠培训会,也不是靠管理层宣讲,而是靠一次次实打实的节省时间:

  • 2024 年 10 月:2 个 skills
  • 2024 年 12 月:大约 20 个 skills
  • 2025 年 1 月:团队开始明显感受到“这东西真的有用”
  • 2025 年 3 月:200+ curated skills,300+ experimental tools

文章里最重要的信号是:

工程师不是被要求去用 AI,而是在工作里碰到了 AI 真的能帮忙的点,然后自己开始造更多工具。

3) 把 AI 做成两层市场

Uber 没有把所有技能混成一个大仓库,而是拆成两层:

Golden Marketplace

  • 自动加载
  • 默认可用
  • 严格治理
  • 手工 code review
  • CI/CD 检查
  • LLM-as-a-Judge 评估
  • 只保留 100–200 个核心技能

Personal Sandbox

  • 通过 URL 分享
  • 手动加载
  • 不设上限
  • 允许快速试验
  • 适合团队和个人的小工具

这个结构很像企业版“核心区 + 试验区”的设计:

  • 核心区要稳
  • 试验区要快
  • 让创新先在边缘发生,再筛选进入核心

技术机制:Uber 为什么能撑住 500+ Skills

1) 技能不是一个按钮,而是一个“技能家族”

比如 code review,不是简单一个“Review Code”按钮,而是按任务复杂度分层:

  • typo fix:轻量 review
  • 影响支付逻辑的改动:深度架构审查

这说明 Uber 不是把 AI 当成“自动替代人”,而是把它当成“按需增强人”。

2) 验证比生成更重要

文章里提到的另一个重点是 verification。

AI 写代码不稀奇,真正难的是:

  • 这段代码能不能跑
  • UI 会不会坏
  • 测试会不会过
  • 环境切换后是否仍然稳定

Uber 把技能接到了验证链路里,比如:

  • 启动 iOS simulator
  • 切 dark / light mode
  • 切语言
  • 跑测试
  • 确认生成结果没有破坏界面

这一步特别重要,因为它把 AI 从“会说”推进到“会验”。

3) 把组织知识外化成技能

Uber 还把 senior engineer 的经验做成 Claude Skills:

  • Go GC 调优
  • AWS 路由修复
  • 特定架构判断

这意味着:

  • 新人可以拿到以前只能靠请教 senior 才能获得的经验
  • 组织知识不再只存在于人的脑子里
  • 技能本身成为可复用资产

换句话说,Uber 在做的不是“更多 AI”,而是“把组织经验产品化”。

为什么这套方法能跑起来

1) 解决的是高频小痛点

最先成功的工具不是最复杂的,而是最贴近日常工作的:

  • 日志 triage
  • 代码审查
  • 生产监控
  • 验证

这些任务都很具体,也最容易让工程师感受到“这东西省我时间”。

2) 让工程师成为创造者,不只是消费者

很多企业 AI 项目死在一个地方:工程师只能“使用”,不能“改造”。

Uber 的模式是:

  • 工程师自己能建 skill
  • 有用的 skill 再进入市场
  • 市场再决定它是不是值得标准化

这会形成正循环:

用到 → 发现省时 → 想自己做 → 做出来再扩散

3) 把治理放在核心,不扼杀边缘创新

Uber 的两层市场其实是在平衡两个目标:

  • 不让核心系统失控
  • 不让创新死在流程里

这比“一刀切的统一平台”更适合大型组织。

这件事对企业 AI 落地意味着什么

这篇案例最有价值的结论是:

企业 AI 的规模化,不一定先来自“战略”,而更可能来自一个个真正能省时间的技能包。

它给团队的启发很直接:

  1. 先做小工具,不要先画大饼
  2. 先让一线工程师省时间,再谈平台化
  3. 先把有用能力沉淀成技能,再考虑治理和标准化
  4. 不要只看生成能力,要把验证链路接上
  5. 把组织知识做成资产,而不是留在少数人脑子里

适合谁看

这篇案例尤其适合:

  • 做企业 AI 平台的人
  • 做开发者工具的人
  • 做 Agent / Workflow / Copilot 产品的人
  • 关心 AI 如何真正进入工程生产流程的人

如果你正在做企业内部 AI 项目,这篇文章的重点不是“Uber 做了什么花活”,而是:

他们用什么机制,让 AI 真的开始被一线工程师持续使用。

我的判断

Uber 这件事不是“500+ skills 很厉害”这么简单。它更像是在证明一个判断:

企业 AI 最先跑通的,不是通用大模型能力,而是围绕高频工作流的可复用技能市场。

它的价值不在于把一切自动化,而在于:

  • 把 AI 插进日常工作流
  • 把知识从个人脑中外化
  • 把有效工具做成可治理资产
  • 把创新从中心放到边缘,再回收到核心

这比“开个 AI 战略会”更接近真实落地。

一句话总结

Uber 的成功不是先有战略再落地,而是先让 AI 在工程师的真实工作流里省时间,再把有用的能力沉淀成一个可治理的技能市场。