投资·R129·2026.05.18

一周之内,中国 AI "六小虎"融资超 1000 亿:资本正在重新定义谁有资格留下来

过去七天,中国 AI 大模型赛道发生了有史以来最密集的资本事件。

cover

过去七天,中国 AI 大模型赛道发生了有史以来最密集的资本事件。

5月7日,月之暗面(Moonshot AI)完成约 20 亿美元融资,估值突破 200 亿美元,美团龙珠领投,中国移动参投。

5月8日,DeepSeek 被曝首轮融资目标 500 亿元人民币(约 73.5 亿美元),创始人梁文锋自掏 200 亿。投后估值跳升至 3500 亿元(约 515 亿美元),国家大基金洽谈领投。

同一天,阶跃星辰(StepFun)接近完成 25 亿美元融资,华勤、龙旗、豪威、中兴等产业链资本集中入场。公司已完成股改、拆除红筹,目标 2026 年底港股上市。

三家公司在不到一周时间里合计对外宣布或披露的融资规模,换算下来超过 1000 亿元人民币。

这场融资潮不再是简单的"烧钱竞赛"。它的背后,是中国 AI 从"技术理想主义"向"资本商业化"的急转弯,也是一轮残酷的筛选——谁拿到钱、谁拿到什么样的钱,将直接决定 AI 六小虎在未来 18 个月的生死线。

本文拆解这三笔融资,试图回答一个核心问题:当资本从"广撒网"变成"押巨头",中国 AI 的座次正在如何重新排列。


一、DeepSeek:从"技术乌托邦"到 500 亿的现实主义

DeepSeek 的故事是这三家里最戏剧性的。

就在两个月前,梁文锋还在公开场合表示"不急于商业化""研究优先于收入"。这家从量化对冲基金幻方孵化出来的 AI 实验室,一直是开源社区的精神偶像——API 定价行业最低,模型开放权重,拒绝外部融资。

但现在,一切都变了。

一个数字说明转折的幅度: DeepSeek 的估值在 21 天内翻了 5 倍。从 4 月初的约 100 亿美元,到 4 月 22 日的约 200 亿美元,再到 5 月 8 日投后预期的 515 亿美元。这种估值膨胀速度,在中国科技史上前所未有。

但更值得关注的不是估值,而是钱从哪里来、往哪里去。

梁文锋自掏 200 亿——这个细节可能是本轮融资最重要的信号。他的个人财富主要来自幻方量化(管理规模超 700 亿元,2025 年平均收益率 56.6%)。自投 40%,意味着两件事:

第一,梁文锋在向外部投资者传递"我自己全部押上"的信号。这实际上锁死了他对 DeepSeek 的定价主导权——你投不投是你的事,但估值由我说了算。

第二,这个比例也暗示了融资的底层逻辑正在变化。在之前的融资传闻中,腾讯曾提出认购 20% 股权被拒,阿里则因"生态绑定"条款谈崩。DeepSeek 选择的资方结构——国家大基金领投、梁文锋主投——指向一个清晰的方向:DeepSeek 不想要战略投资者,只想要不出声的财务钱。

这是有代价的。国家大基金(大基金三期,规模约 470 亿美元)此前从未公开投资过一个大语言模型公司。它的入场意味着 DeepSeek 的算力供应链正在向国产芯片(华为昇腾)倾斜,而这也为 DeepSeek 带来了新的供应稳定性——但同时也锁死了部分灵活性。

V4.1 为什么重要。 计划 6 月发布的 V4.1 将补齐多模态(图像+音频理解),这是 V4 发布时最大的缺失项。更重要的是,它标志着 DeepSeek 从"5 个月迭代一次"向"月度级迭代"转变——向行业常规节奏靠拢。

但 DeepSeek 面临的结构性问题依然存在:

  • 商业化真空。 开源导致大量企业客户选择自行部署,分流 API 收入。主流云厂商(AWS、阿里云、火山引擎)都在提供免费的 DeepSeek 服务,而 DeepSeek 从中零分成。公司至今没有任何公开的 ARR 数据——在同行中,月之暗面 ARR 已超 2 亿美元,智谱 ARR 达 17 亿元人民币。
  • 人才流失。 近期核心研究员接连离开,包括 V3/R1 核心贡献者郭达雅、LLM 核心研究员王炳宣、魏浩然、以及被字节挖走的罗福莉。研发团队 270 人中已有约 10 人离开。虽然 4% 的离职率在行业中不高,但离去的都是最核心的人。
  • 从"研究实验室"到"产品公司"的组织转型。 内部已组建数十人的产品团队,探索 Agent 和 C 端产品——但这件事,需要的是完全不同的组织文化。

DeepSeek 的这场融资,本质上是在回答一个问题:一个以"技术理想"著称的公司,能不能在拿到 500 亿之后,仍然保持它的技术灵魂?


二、月之暗面:ARR 翻倍背后,真正的赌注在 K3

月之暗面是三家中国公司中,融资节奏最激进的一个。

从 2025 年底 43 亿美元估值,到 2026 年 5 月突破 200 亿美元——半年 5 倍。成立以来累计融资超 376 亿元人民币,是中国大模型创业公司中累计融资最多的。

这轮 20 亿美元的领投方是美团龙珠,中国移动、CPE 源峰参投。美团龙珠的入场尤其值得注意——它意味着美团正在战略性押注 AI Agent 在本地生活服务中的应用。

但真正支撑这轮 200 亿美元估值的,是模型能力和商业化数据的双重突破。

Kimi K2.6(4 月 20 日发布并开源)在几个关键指标上已经超过 GPT-5.4:SWE-Bench Verified 80.2 分、HLE-Full(带工具)54.0 分(GPT-5.4 为 52.1)、DeepSearchQA F1 92.5(GPT-5.4 为 78.6)。在代码和深度搜索这两个方向,K2.6 的领先是实质性的。

更关键的是它支持的 300 个子 Agent 并行协作——这在目前的开源模型中是独一份。当一个模型可以同时编排 300 个 Agent 执行 4000 个步骤时,它从"对话工具"变成了"工作流引擎"。

商业化数据也在快速跟进:

  • ARR 从 3 月初的 1 亿美元,一路飙升至 4 月的 2 亿美元——月增 1 亿美元的斜率非常陡峭。
  • 海外收入已超过国内收入,这在国产大模型中不多见。K2.5 在 OpenRouter 上 Token 消耗一度冲到全球第二,环比增长超 230 倍。
  • Kimi 的 Stripe 数据显示,个人订阅支付订单 1 月环比暴增 8280%

但用户规模是它的隐忧。 在中国 AI 原生 App 月活排名中,Kimi 以 834 万排第 9,远低于豆包的 3.45 亿和 DeepSeek 的 1.27 亿。公司去年主动停止了大规模广告投放——这是战略性取舍,但也意味着 C 端阵地正在被大厂产品蚕食。

更大的赌注是 K3(预计 2026 年发布)——2.5 万亿参数 MoE,等效算力需求是当前 K2.6 的 10 倍。K3 如果成功,月之暗面可能在 Agent 集群能力上建立一个暂时的护城河;但如果 K3 延迟或效果不及预期,200 亿美元的估值压力会非常大。


三、阶跃星辰:产业资本入场,IPO 箭在弦上

阶跃星辰和另外两家走了一条完全不同的路。

它没有和 DeepSeek、月之暗面在开源模型榜单上硬拼,而是选择了"AI + 终端"的差异化路线——把模型装进手机、汽车和 IoT 设备里。

这轮 25 亿美元融资的投资者结构很能说明问题。

华勤、龙旗(全球手机 ODM 头部)、豪威(图像传感器)、中兴通讯——这几家都是产业链资本。它们入局不是因为阶跃的模型分数最高,而是因为推动 AI 上终端需要模型公司和硬件厂商的深度绑定。

这种关系的具体形态已经可以看到:

  • 阶跃已与 OPPO 联合开发"一键问屏"功能——拍照即问即答,端侧推理。
  • 吉利汽车 + 千里科技 联合发布 AgentOS 智能座舱,搭载 Step-Audio 端到端语音模型,银河 M9 车型上市 3 个月销量近 4 万辆,预计 2026 年"上车"超 100 万辆。
  • 公司董事长由 旷视科技联合创始人印奇 担任,同时他也是千里科技(A 股上市公司)的董事长。这种"一个人管两家公司"的结构,在 AI 大模型公司中非常罕见。

商业模式上,阶跃走的是 "端 + 云"双轮驱动:端侧按 License 收费,云侧按 API 消耗计费。目前手机端装机已超过 4200 万台,日均服务近 2000 万人次。

但阶跃的故事最具决定性的变量,是它在 2026 年的 IPO。

公司已于 4 月完成股改(有限责任公司→股份有限公司),拆除红筹架构,预期基石定价约 100 亿美元。目标是在 6 月前向港交所递表,年底完成上市。

这将是中国大模型赛道继智谱(02513.HK,市值约 4347 亿港元)、MiniMax(00100.HK,市值约 2657 亿港元)之后的 第三股

而一个值得注意的背书是 香港投资管理有限公司(HKIC)——被称为"港版淡马锡"——已成为阶跃的股东。它在 AI 大模型领域目前只押注了这一家公司。


四、三家公司放在一起看,模式已经清晰了

把 DeepSeek、月之暗面和阶跃星辰放在一起对比,三家公司走向了三个完全不同的方向:

维度 DeepSeek 月之暗面 阶跃星辰
核心策略 开源 + API,技术驱动 模型 + Agent 集群,产品驱动 AI + 终端,产业绑定
本轮融资 500 亿人民币(最大单笔) 20 亿美元 25 亿美元
估值 ~515 亿美元 ~200 亿美元 ~100 亿美元(预期基石)
商业化 尚无公开 ARR ARR 2 亿美元,海外 > 国内 营收约 10 亿人民币
关键资方 国家大基金(潜在),梁文锋自投 美团龙珠,中国移动 华勤、中兴、HKIC
最大优势 技术口碑+开源社区+超低成本 Agent 集群能力,快速增长的 ARR 产业深度绑定,清晰的 IPO 路径
最大风险 商业化真空,核心人才流失 C 端被大厂蚕食,K3 成败 营收规模与估值匹配度
下一步 6 月发 V4.1,推进商业化产品 K3 模型,潜在港股 IPO 6 月递表,年底上市

五、这些钱不会平均分配

这三笔融资合在一起,其实给出了一个清晰的时间表。

从现在到 2027 年中,中国 AI 大模型赛道将经历这样几个阶段:

阶段一(当前-2026 年中):烧钱换壁垒。 各家拿到的这些资金,绝大部分将变成算力、人才和基础设施。字节跳动已经把 AI 基础设施预算升到 2000 亿元,相当于每天烧 5.5 亿——这意味着市场对推理成本的要求正在急剧提高。谁的模型推理成本更低、规模化效率更高,谁就能在这个阶段抢到更多开发者和企业客户。

阶段二(2026 年中-2026 年底):IPO 窗口。 阶跃星辰年底上市,月之暗面和 DeepSeek 大概率也会在 2027 年前后启动 IPO 流程。公开市场的审视会完全不同——估值不再只靠融资叙事支撑,而是要看 ARR、毛利率、客户留存。月之暗面目前是三家中有最好商业化数据的,DeepSeek 如果到时仍无公开 ARR,将面临巨大压力。

阶段三(2027 年起):赢家通吃。 当资本不再相信"先烧钱再赚钱"时,中国 AI 六小虎中可能只会剩下 2-3 家。开源市场(DeepSeek 的优势)、Agent 平台(月之暗面的方向)、终端嵌入(阶跃的选择)——这三个赛道最终有不同的生存法则。


写在最后

500 亿、20 亿、25 亿美元——放在任何一个市场,这些数字都显得抽象。但它们的实际含义是:中国 AI 的入场券正在变得极端昂贵。

梁文锋自掏 200 亿,美团龙珠领投 20 亿,华勤和中兴以产业链身份入局——每一笔钱背后都有明确的逻辑,但没有一笔是"容易"的钱。

对于创业者和投资者来说,中国 AI 已经不再是一个"要不要上牌桌"的问题。问题是:当你拿到这笔钱之后,你准备在 18 个月内证明什么?

DeepSeek 的选择是证明它能从实验室变成产品公司。月之暗面的选择是证明 K3 能把 Agent 集群推向新高度。阶跃的选择是证明 AI 在终端上真的有用户愿意付费。

三条路,三个赌注。2026 年底的港股和公开市场,会告诉我们谁对了。