案例·Neo·2026.04.19

Uber：如何在 5 个月里把 AI Skills 从 2 扩到 500+，企业 AI 落地真正靠什么

Uber 的关键不是“AI 战略”，而是把 AI 做成了可复用、可治理、可自发扩散的工程技能市场。

Uber 如何把 2 个 Claude Skills 扩成 500+：企业 AI 落地真正靠什么

来源：https://medium.com/activated-thinker/how-uber-secretly-scaled-ai-from-2-to-500-skills-in-5-months-without-a-strategy-25ff894c0f9c

故事先讲清楚

这篇文章讲的是 Uber 内部一件很典型、也很反直觉的事。

最开始，只有一个工程师在内部 repo 里做了 2 个 Claude Skills：一个处理 CI 日志的 triage / repair，另一个做基础 code review。没有 kickoff，没有 steering committee，也没有预算审批，管理层甚至一开始都不知道这个东西存在。

但它没有停在试验阶段。几个月后，越来越多工程师在自己的日常工作里用到了这些技能：有人拿它看日志，有人拿它做代码审查，有人把它接到验证流程里。因为它真的能省时间、能把事情做完，这个内部 repo 逐渐从 2 个技能扩成了 500+ skills，覆盖代码审查、生产监控、验证和组织知识沉淀等多个环节。

所以这篇案例真正值得看的，不是“Uber 有多少 AI 技能”，而是：一个小工具，为什么能在企业里自然长成一套技能市场。

核心问题

这篇案例回答的是一个很现实的问题：

企业里的 AI，怎样才能从试验品变成日常工作的一部分？

很多公司卡在三个地方：

AI 不能直接帮人省时间，所以一线工程师没动力用
AI 工具太散，没有统一的分发和治理机制
AI 产出不够可验证，一旦进生产就会让团队不放心

Uber 的做法，是把 AI 变成一套可扩展的“技能市场”。

Uber 做了什么

1) 从一个人、两个技能开始

最早的内部 marketplace 只有两个工具：

CI 日志 triage / repair skill
基础 code reviewer

它们都不是宏大能力，而是非常具体、非常高频的问题。

这很关键。因为工程师真正愿意为 AI 付出注意力的，不是概念，而是“我现在就能少做一件麻烦事”。

2) 让扩散发生在工作流里

增长不是靠培训会，也不是靠管理层宣讲，而是靠一次次实打实的节省时间：

2024 年 10 月：2 个 skills
2024 年 12 月：大约 20 个 skills
2025 年 1 月：团队开始明显感受到“这东西真的有用”
2025 年 3 月：200+ curated skills，300+ experimental tools

文章里最重要的信号是：

工程师不是被要求去用 AI，而是在工作里碰到了 AI 真的能帮忙的点，然后自己开始造更多工具。

3) 把 AI 做成两层市场

Uber 没有把所有技能混成一个大仓库，而是拆成两层：

Golden Marketplace

自动加载
默认可用
严格治理
手工 code review
CI/CD 检查
LLM-as-a-Judge 评估
只保留 100–200 个核心技能

Personal Sandbox

通过 URL 分享
手动加载
不设上限
允许快速试验
适合团队和个人的小工具

这个结构很像企业版“核心区 + 试验区”的设计：

核心区要稳
试验区要快
让创新先在边缘发生，再筛选进入核心

技术机制：Uber 为什么能撑住 500+ Skills

1) 技能不是一个按钮，而是一个“技能家族”

比如 code review，不是简单一个“Review Code”按钮，而是按任务复杂度分层：

typo fix：轻量 review
影响支付逻辑的改动：深度架构审查

这说明 Uber 不是把 AI 当成“自动替代人”，而是把它当成“按需增强人”。

2) 验证比生成更重要

文章里提到的另一个重点是 verification。

AI 写代码不稀奇，真正难的是：

这段代码能不能跑
UI 会不会坏
测试会不会过
环境切换后是否仍然稳定

Uber 把技能接到了验证链路里，比如：

启动 iOS simulator
切 dark / light mode
切语言
跑测试
确认生成结果没有破坏界面

这一步特别重要，因为它把 AI 从“会说”推进到“会验”。

3) 把组织知识外化成技能

Uber 还把 senior engineer 的经验做成 Claude Skills：

Go GC 调优
AWS 路由修复
特定架构判断

这意味着：

新人可以拿到以前只能靠请教 senior 才能获得的经验
组织知识不再只存在于人的脑子里
技能本身成为可复用资产

换句话说，Uber 在做的不是“更多 AI”，而是“把组织经验产品化”。

为什么这套方法能跑起来

1) 解决的是高频小痛点

最先成功的工具不是最复杂的，而是最贴近日常工作的：

日志 triage
代码审查
生产监控
验证

这些任务都很具体，也最容易让工程师感受到“这东西省我时间”。

2) 让工程师成为创造者，不只是消费者

很多企业 AI 项目死在一个地方：工程师只能“使用”，不能“改造”。

Uber 的模式是：

工程师自己能建 skill
有用的 skill 再进入市场
市场再决定它是不是值得标准化

这会形成正循环：

用到 → 发现省时 → 想自己做 → 做出来再扩散

3) 把治理放在核心，不扼杀边缘创新

Uber 的两层市场其实是在平衡两个目标：

不让核心系统失控
不让创新死在流程里

这比“一刀切的统一平台”更适合大型组织。

这件事对企业 AI 落地意味着什么

这篇案例最有价值的结论是：

企业 AI 的规模化，不一定先来自“战略”，而更可能来自一个个真正能省时间的技能包。

它给团队的启发很直接：

先做小工具，不要先画大饼
先让一线工程师省时间，再谈平台化
先把有用能力沉淀成技能，再考虑治理和标准化
不要只看生成能力，要把验证链路接上
把组织知识做成资产，而不是留在少数人脑子里

适合谁看

这篇案例尤其适合：

做企业 AI 平台的人
做开发者工具的人
做 Agent / Workflow / Copilot 产品的人
关心 AI 如何真正进入工程生产流程的人

如果你正在做企业内部 AI 项目，这篇文章的重点不是“Uber 做了什么花活”，而是：

他们用什么机制，让 AI 真的开始被一线工程师持续使用。

我的判断

Uber 这件事不是“500+ skills 很厉害”这么简单。它更像是在证明一个判断：

企业 AI 最先跑通的，不是通用大模型能力，而是围绕高频工作流的可复用技能市场。

它的价值不在于把一切自动化，而在于：

把 AI 插进日常工作流
把知识从个人脑中外化
把有效工具做成可治理资产
把创新从中心放到边缘，再回收到核心

这比“开个 AI 战略会”更接近真实落地。

一句话总结

Uber 的成功不是先有战略再落地，而是先让 AI 在工程师的真实工作流里省时间，再把有用的能力沉淀成一个可治理的技能市场。