设计 → EDA/IP → 晶圆代工 → CoWoS封装 → HBM内存 → 载板/PCB → 测试 → 散热/电源 → 互连/光模块 → ODM组装 → DGX系统 → CUDA | 全球130+上市公司标注
⭐⭐⭐⭐⭐ = 绝对瓶颈,全球 ≤2 家 ╱ ⭐⭐⭐⭐ = 寡头壁垒,切换需 2年+ ╱ ⭐⭐⭐ = 头部集中 ╱ ⭐⭐ = 充分竞争 ╱ ⭐ = 完全可替代
半导体级硅纯度要求99.999999999%(11个9)。德国Wacker+美国Hemlock+日本Tokuyama三巨头, 中国自给率<10%, 但通威/协鑫在电子级多晶硅快速追赶。
AI数据中心供配电的核心——SiC功率器件比硅器件效率高5%, 散热好50%。Wolfspeed/Coherent/Rohm三巨头, 中国天岳/天科在追赶。
NVIDIA芯片制造离不开的精细化工——EUV光刻胶(日本JSR/TOK/Fujifilm垄断90%+), 中国自给率<5%。高纯特气(林德/液化空气/大阳日酸)三巨头。
NVIDIA GPU的生命线——没有ASML EUV光刻机=没有H100/B200。ASML年产能仅~50台, 单价$200M, TSMC/三星/Intel全排队。全球唯一供应商。
芯片制造的三大核心工艺——Lam(刻蚀#1)+应材(沉积#1)+KLA(检测#1)三巨头, 加上东京电子形成四强格局。中微公司3D NAND刻蚀已达5nm水平。
NVIDIA的皇冠——Blackwell B200 GPU含2080亿晶体管, 2个计算die+8个HBM3E堆叠。CUDA生态15年积累, 10万+GPU内核调用, 切换成本=重写所有AI代码。
让千卡万卡GPU协同工作的命脉——NVLink是GPU间高速通信协议, 带宽900GB/s。NVIDIA收购Mellanox获得InfiniBand, 数据传输比以太网快3倍。
NVIDIA的护城河不是硬件是软件——CUDA开发15年, 积累10万+GPU内核, cuDNN做深度学习加速, TensorRT做推理优化。切换成本=重写所有AI代码。
地球上最精密的制造——NVIDIA所有GPU都用TSMC工艺, 4nm(B200)是全球量产最先进节点。TSMC 3nm良率>85%, 2nm 2025试产。三星3nm良率仅~60%。
AI芯片的拼装术——TSMC CoWoS把GPU计算die和HBM内存封装到一起, 互连密度比传统封装高100倍。产能决定NVIDIA GPU出货量。没有CoWoS就没有H100。
GPU旁边的专属高速内存——B200用8颗HBM3E, 每颗24GB/1TB/s带宽。SK海力士独家供应NVIDIA HBM3E, 市占~53%。三星#2, 美光#3。中国长鑫在研HBM2。
游戏卡和部分AI推理卡用GDDR而非HBM——GDDR7带宽是GDDR6的2倍。三星/美光/SK海力士三分天下。NVIDIA RTX 50系列将率先用GDDR7。
让千卡万卡GPU组网的必需品——NVIDIA Spectrum-X是以太网AI网络方案, Quantum是InfiniBand方案。Arista/思科也在推AI专用以太网。没有高速网络=AIGPU各自为战。
GPU间数据以光速传输——800G/1.6T光模块是AI数据中心标配。中际旭创全球#1, Coherent/新易盛紧追。每台AI服务器需要8-16个光模块。
B200功率1000W+——风冷已经不够, 液冷是AI数据中心的标配。Vertiv/CoolIT/Boyd三大液冷方案商。AI芯片功耗每代翻倍, 液冷是确定性需求。
单GPU功耗<500W仍可用风冷——热管+VC+风扇方案。台达/Cooler Master/Auras三巨头。AI推理卡功耗较低, 风冷仍有市场但增速不如液冷。
GPU供电的精细化管理——一颗B200需要数十颗PMIC和功率MOSFET。MPS/Infineon/TI三巨头, 中国南芯/矽力杰在消费电源领先但AI服务器电源尚弱。
数据中心不能断电——UPS(不间断电源)+PDU(电源分配单元)。施耐德/伊顿/Vertiv三巨头。AI数据中心的UPS需求是传统数据中心2-3倍(因GPU功耗高)。
把GPU/CPU/内存/网络卡装成一台AI服务器的集成工作。鸿海/广达/超微/英业达四大ODM, 中国浪潮/联想也在做。毛利率低(~6%)但营收体量巨大。
GPU的最终消费者——微软/AWS/Google/Oracle四大云厂采购NVIDIA GPU建AI云服务。每家年采购$10B+ GPU, 是NVIDIA最大客户群。