我爱免费 发表于 2025-6-30 21:06

AI云服务,格局变了?

作者:微信文章
过去十年里,云计算一直是“三巨头”——AWS、Azure、GCP——的天下。它们靠着规模经济、生态锁定与纵向整合,把 IaaS 做成了现代 IT 的自来水。然而,生成式 AI 的骤然爆发让原本稳定的市场结构出现新的转机:算力供应与收入份额脱钩、GPU 产能成稀缺货币、新玩家携带“GPU-only”模式弯道超车?2025 年预估数据显示,Azure GPU 占有率约 30%,GCP 20%,AWS 20%,而 Oracle + CoreWeave 等新云阵营合计竟拿下 30% 的 NVIDIA 高端 GPU。对比其不足 7% 的云收入占比,这是一场典型的“算力逆袭”。Oracle (ORCL) 在6月30日盘前交易时段股价一度拉升超过7%。CEO Safra Catz 在最新 SEC 文件中披露:公司 FY-2026 开局强劲,Multi-Cloud 数据库收入仍保持大于100% 的增速,并已签下多笔大型云服务合同;其中一份合同自 FY-2028 起,单年可贡献大于300 亿美元收入。一份合同从28财年开始,一年就能贡献30B收入,一石激起千层浪!1. 这 300 亿美元意味着什么?指标FY-2025 实际对比/占比Oracle 总营收574 亿美元300 亿美元≈52%Cloud & License Support440 亿美元300 亿美元≈68%最新 RPO(合同在手)1,380 亿美元+22% 增量
如果合同完全落地,FY-2028 起 Oracle 将迎来“第二条营收曲线”,单一合同规模已接近 OCI 现有年收入的 2 倍,对长期增长基数影响深远。
谁会是这个客户?(时间线梳理)
Safra Catz 6 月 30 日 SEC 说明透露已签下多份大单,其中一份自 FY-2028 起每年贡献 >300 亿美元收入,且不影响 FY-2026 指引。Stargate-US(德州 Abilene)Oracle 斥资 400 亿美元购入 40 万颗 Nvidia GB200 GPU,为 OpenAI 15 年租赁的首座数据中心。Stargate-UAE(阿布扎比)G42-SoftBank-OpenAI-Oracle-Nvidia 联合打造,2026 年投产、首期 10 万颗 GPU,定位“世界最大主权 AI 云”。xAI Grok 3 宣布落地 OCIOracle 将为 Musk 的 xAI 训练 / 推理下一代模型,释放更多 GPU 负载。Oracle Defense Ecosystem6 月中旬推出,目标是把 OCI 嵌入美军及盟国 AI/数据链路中。产能“排队”Catz 在 Q4 FY-2025 电话会上坦言“正在推迟接单,以等待数据中心扩容”。



潜在签约方:谁有能力一年掏 300 亿美元?


主观区间估计,仅用于框架讨论。
若合同确认为 Stargate-级 AI 云,对Oracle的长期增长曲线有何撬动?

①营收基数再抬升,FY-2025 总收入 574 亿美元,OCI≈120 亿。300 亿合同落地后,单一客户贡献 ≈52 % 的 FY-2025 总营收基数;相当于 OCI 现有规模的 2-3 倍。②HPC-AI 基础设施 TAM 外溢
Compute Cost 曲线,大模型训练成本≈参数量×算力单价×迭代频次。模型迭代加速 → GPU 周期性翻倍需求;供给瓶颈(功耗 + 供应链)使“拿到算力”成为稀缺服务,拉高租赁单价。
主权云 & 防务云,中东、日韩、欧盟均在评估“本土 LLM + 数据主权”方案,典型合同规模 5-15 亿美元/年;若 Stargate-UAE 验证可行,Oracle 可复制到多国。
多云数据库 (MySQL HeatWave / Oracle DB@Azure),AI 工作流重依赖向量 + 事务混合,Catz 已披露多云 DB 收入 >100 % YoY,带来高毛利二次增量。
③边际盈利结构CapEx 前置(GPU+液冷+自研 RDMA 网络),但租赁合同通常包含 匡算式“power + GPU amortization + 运维”,边际 S&M≈0 → 运营利润率可上 30-35 %。按 300 亿营收、30 % EBIT 估算,单合同可贡献 90 亿 EBIT / 年,对应 >1.5 美元/股 FCF(8 % WACC 折现)。④二阶导弹性一旦 5 GW-级园区建成,Oracle 可 多租户分片 给 xAI、Cohere、Anthropic 等第二梯队;单园区实际 ARPU 可能 超出首份合同。Catz 强调“先有订单再建机房”,意味着 RPO 曲线将与 CapEx 同步上扬,现金流剪刀差 可通过预付款缓解。

通过OCI,我们可以看到云iaas的TAM在AI的加持之下迎来了加速发展,Synergy 数据显示,仅 2025Q1 的 AI 推动额外增加约 $17 B 收入,跑出了自 2022 以来最高季度增速;资本开支同步创历史新高,验证“订单->算力->收入”的正循环已经启动。

为什么 Oracle 的 400 K+ Blackwell 级 GPU 订单 让它一跃成为 “第二大算力巨头”,并为 2028 年 300 亿美元年化合同 铺平了道路?

左侧:2025 E 全球云收入份额
AWS 44 %、Azure 30 %、GCP 19 % ⇒ 三巨头合计 ≈ 93 %Oracle + CoreWeave 5 %其余“New Clouds”仅 ≈ 2 %


右侧:2025 E NVIDIA GPU 采购份额
Azure 30 %(与收入占比大致匹配)GCP 20 %(略高于收入占比)AWS 20 %(明显低于收入占比,因为自研 Trainium2/Bronco 取代部分 NV 芯片)CoreWeave 19 % + Oracle 11 %⇒ 新兴云阵营合计 30 %

GPU 配置权正从“收入份额”转向“AI 负载占比”重新分配,催生出“新一代超大规模云”(Neo-Hyperscalers)。

为何 “GPU 份额为何快速向新兴云阵营倾斜” ?

第一,核心驱动力在于新旧两类云厂商的路径分化
①技术栈选择的分水岭,AWS / Azure / GCP 同时押注自研 ASIC(Trainium、TPU 等)与 NVIDIA GPU,因此在采购 NV 先进 GPU 时必须给自家芯片“留窗口”,对 NV 的依赖自然下降。Oracle、CoreWeave 及其他“GPU-only 云” 则彻底把算力押在 NVIDIA,一句话——“能早拿货就不等”。这种“单一阵营”策略让他们在排产谈判中可以用更高的预付款和绑定协议换取优先交付与更大产能份额。

②商业模式直接影响现金流速度,传统巨头仍以销售通用 IaaS为主,AI GPU 需要先通过自家平台接入后再 upsell Copilot、Bedrock、Vertex 等 AI 服务——GPU → 收入的转化周期长。新云玩家则直接按 “GPU-小时”或多年租赁计费,像 CoreWeave 这样的小体量公司,单一大单就能使收入数倍膨胀(2024→2025 指引从 20 亿美元跳到 80 亿美元)。

③资本结构与融资手段,三巨头 CapEx 已是百亿美元量级,GPU 投入必须兼顾利润率门槛。Neo-Hyperscalers 通过 Sale-Leaseback + OEM 融资 快速滚动:先锁服务器、再把机柜和机房“卖给”金融机构回租,用高成长覆盖利息。

④供应链谈判权再洗牌,NVIDIA 2025 年计划包下 约 37 万片 CoWoS 晶圆,其中 大约三分之一将分配给 Oracle、CoreWeave 等新云客户——因为他们“100 % 绑定”并愿付更高 ASP。传统巨头如 AWS 如果想追加 NV 订单,就必须与自研芯片产能“抢”CoWoS 封装线,或转向自家 ASIC —— GPU 份额由此被“挤出”。
第二,供应链 & 成本曲线产生了连锁效应

①CoWoS 产能紧缺将长期化

TSMC 2024 年月产约 3.5 万片,预计到 2025 年提高到 7-7.5 万片,2026 年才可能摸到 9 万片/月,但需求攀升更快。当“新云”手握 30 % 的 GPU 采购份额,意味着 >1/3 的新增 CoWoS 线被锁,传统巨头若要加单只能另找 OSAT 扩张或继续加速 ASIC。

②HBM4 与液冷溢价被外溢

HBM4 制程复杂度提升,单颗价格比 HBM3e 再贵 30 %+,加上液冷部件在整机 BOM 中占比 >20 %,使 2025-26 年旗舰 GPU ASP 可望达到 2023 H100 的 1.25×。

③电力与选址竞赛升温

德州 ERCOT 2024 全年实时均价已降至 $28.8/MWh,远低于全美均价,吸引“大云”与“新云”排队建厂;然而伴随 AI 数据中心潮,电力峰谷差与拍卖溢价扩散。路透 2024-11 报道警告,达拉斯-沃斯堡地区的 AI-DC 热潮或推高未来光伏电价与输电拥堵,意味着 旧园区扩容成本可能高于新建“自供电”园区。

新云阵营 GPU/收入 值 >3,意味着算力储备远超当期收入,可支撑随后 2-3 年的快速放量;反观三巨头该指标 <1,需要通过 AI 服务高附加值变现才能追赶。二阶导机会,一旦封装、HBM 等硬瓶颈缓解,GPU ASP 有望下行 → 小型 GPU-only 云的单卡租金成本大降 → 租金价格战 将反向挤压缺少纵向整合护城河的玩家。

综上,GPU 份额向“新云”倾斜并非短期噪音,而是技术路径、财务结构与供应链布局三重逻辑叠加的结果。谁能率先解决封装+HBM+电力的三重瓶颈,谁就能继续扩张 GPU 市占并锁定高 ARPU;而对上游(CoWoS、HBM、液冷、电力)的投资机会,也将伴随这一迁移过程同步释放。


2024-25 高端 AI GPU(H100/GB200/HBM4 配置)已下单规模,以公开报道与供应链追踪为准,仅计 NV 先进 GPU,不含 TPU/Trainium/TPU v5e 等自研芯片。Oracle 为何能在 GPU 排位赛冲到“第二”?

“All-in NVIDIA” 换 优先排产 + 折扣,Oracle 并无自研 ASIC 负担,直接以 $40 B 现金/预付款锁住约 35-40 % 的 2025-26 GB200 产线;TSMC-CoWoS 产能被定向保障。“订单先行、建 DC 后补” 资本策略,先由 OpenAI/G42 签多年租赁,Oracle 再以 Sale-Leaseback & REIT 结构铺设 Abilene 5 GW 园区;GPU 现金回收与偿债/折旧几乎同步。高单价租赁模式,加速 ROI,Blackwell 训练节点租金估 $3.5-4/卡·时,是 2024 年 H100 的 1.3-1.4×;租赁单价 直接映射 到 OCI 毛利率,而无需像 AWS/Azure 那样平摊到通用 IaaS。

Oracle 在“AI GPU/年” 度量下 市占 ≈20-25 %(仅次于 Microsoft),而其云收入份额目前只有 ≈5 %。GPU 配置与收入的 倒挂,为 2026-28 年 OCI 的第二条 S-curve 提供了算力底座。
如何支撑 单一客户2028 年 $30 B 年化合同?


单卡年化租金 $75-80 K × 400 K ≈ 30-32 B(贴近管理层指引)。400 K GPU 可提供 >30 EXAFLOPS FP8 算力,足以满足 OpenAI“70T 参数模型” 三次/年全量训练需求,外加 xAI、Cohere 分片。
Oracle 以“硬锁 40 万枚 GB200 + 5 GW AI 园区” 把自己推上 高端 GPU 采购排位第 2,重新划分了算力食物链。算力先行、收入后收的模式,使其有能力在 2028 财年兑现 年化 $300 亿 的超大合约,并可能在 2026-27 年即开始部分提前确认 RPO。若 GPU→现金流链条跑通,Oracle 的 云估值重定价空间 将基于“GPU 占有率”而非传统 IaaS 份额,投资者应密切跟踪封装、HBM、液冷与电力等瓶颈缓解速度。从 “算力即产业货币” 的角度看,新兴 GPU-only 云已在供应链、资本结构和商业模式上给传统巨头上了一课。AI 时代的云服务不再只是“卖虚拟机和带宽”,而是“把稀缺 GPU 变现为高附加值 AI 服务”的终极战场。未来 3 年,谁能率先打通 GPU → 训练租赁 → AI 平台 → 主权云 的四层飞轮,谁就能把今天的算力领先,转化为明天的现金流护城河。对于观察者而言,锁定 封装产能、HBM 市占、电价曲线与 GPU/收入 值,或许是穿透 AI 云变局最简洁也最有效的指标体系。全文完。吞噬世界,软件3.0是什么样的?AI垂类SaaS的大爆发?AI 时代的十倍杠杆:两名非AI工程师的“半年奇迹”?Anthropic的ARR 5 个月翻3 倍背后ChatGPT 能否成为“下一代横向企业平台”?互联网女王重磅报告中的曲线&数字与思考
页: [1]
查看完整版本: AI云服务,格局变了?