Nvidia的委曲求全,中國如何「去NVDA化」? - 深度分析第6期:NVDA, 華為, 阿里巴巴, 寒武紀
2025年8月27日,Nvidia再次公佈一份非常亮麗的財報。但在財報中,專為中國市場設計的H20晶片,銷售收入為零。
2025年8月28日,中國AI晶片龍頭寒武紀股價大漲,一年內上升超過450%,短暫超越貴州茅台,成為中國A股股王。
2025年8月29日,中國巨頭阿里巴巴在財報後,傳出將會研發自家芯片,股價大漲。
H20的這個銷售收入的「零」,不是市場需求的自然結果,而是地緣政治力量影響商業的最佳範例。
它意味著過去那套純粹的商業邏輯正在失效,一個由政策主導、規則被徹底改寫的全新賽局已經展開。
對於投資者而言,理解這場賽局的複雜性,對於理解所有晶片玩家,無論是美或是中,都十分重要。
在這篇分析中,我將深入剖析這場美中晶片戰爭,並將其分為四大部分:
解讀賽局: 首先,我們將剖析這場新賽局的兩條核心規則—美國政府用以精準打擊的「性能密度」門檻,以及懸而未決的「15%營收上繳」條款。
認清枷鎖: 接著,我們將審視所有中國玩家共同面臨的、難以逾越的「物理邊界」(製造良率、產能瓶頸)與根深蒂固的「生態高牆」(CUDA帝國)。
玩家博弈: 在此基礎上,我們將深入分析牌桌上四類玩家的生存策略與投資價值:
Nvidia:「戴著鐐銬的王者」如何發動防守反擊戰。
華為:「中國國家隊王牌」如何進行一場全棧式的豪賭。
阿里等雲巨頭:如何通過「自研自用」實現供應鏈自救與價值重估。
寒武紀:「獨立挑戰者」如何在鋼絲上殺出一條血路。
終局推演: 最後,我們將對未來5年的市場格局進行推演,判斷這場沒有終點的平行賽跑,將如何重塑全球的科技版圖。
對於投資者來說,這不僅是一場關於晶片的分析,更是一幅幫助您在未來十年美中科技格局重塑中,理解全局的戰略地圖。
第一章:新賽局的規則——地緣政治下的AI晶片戰場
1.1 關鍵事件時間軸(2023-2025)
為了準確理解當前的局勢,我們首先需要重溫導致當前局面的關鍵節點:
2023年10月: 拜登政府收緊出口管制,Nvidia的A800與H800晶片被禁售,迫使Nvidia開始設計符合新規的「降規版」晶片,即H20系列。
2025年4月: 美國新政府突然升級管制,在沒有正式法規的情況下,要求美國企業暫停向中國銷售H20等AI晶片,市場陷入混亂。
2025年5月: Nvidia發布第一季(截至2025年4月)財報,宣布因H20銷售暫停,一次性計提了高達45億美元的庫存減損。
2025年7月: 美國政府態度軟化,同意在特定條件下核發H20銷售許可,但提出一項史無前例的附加條款:Nvidia等需將對華銷售收入的15%上繳給美國政府。
2025年7月中旬:美國商務部長Howard Lutnick在CNBC訪談中表示:「我們不賣給中國最好的東西,也不是第二好或第三好的,第四好才是我們認為可以的,要讓中國開發者對美國技術上癮。」
2025年7月下旬:中國網路安全管理部門以「國家安全問題」為由召見NVIDIA代表,要求說明H20晶片是否具有「追蹤定位」和「遠端關閉」功能,質疑晶片可能存在安全後門。
2025年8月上旬:中國政府部門(包括網信辦、工信部、發改委)向國內科技公司發布非正式通知,「敦促本土企業避免使用NVIDIA H20晶片」,特別是涉及政府相關用途的應用。主要受影響公司包括:騰訊、字節跳動、阿里巴巴、百度等被要求解釋為何需要H20而不使用國產替代品。
2025年8月中旬:多家中國科技企業開始「縮減H20訂單」,部分公司完全暫停新的H20採購,等待國家安全審查結果。中國官方媒體開始批評H20晶片存在「安全風險」且技術先進性不足。NVIDIA要求供應商暫停H20相關生產,包括要求三星電子、Amkor Technology、鴻海等供應商停止H20晶片的封裝和相關工作,實際上中止了H20在中國市場的前景。
2025年8月下旬: Nvidia發布第二季(截至2025年7月)財報,確認由於15%條款的法規細節不明,公司無法確認相關收入,導致該季度對華H20銷售額為零。同時,中國宣布計劃在2026年將AI晶片產量提升三倍,華為等公司加速推進自主AI晶片開發,減少對NVIDIA的依賴。
2025年9月(目標): Nvidia計劃向中國客戶提供下一代合規晶片B30A的樣品,試圖在新的規則框架下,重新奪回市場。
1.2 解讀賽局規則:半導體管制與15%條款
當前的賽局,核心規則有二,它們共同定義了Nvidia及所有玩家的行動邊界。
要理解美國的半導體管制,我們可以將其視為針對一個「超級數學家團隊」的三道獨立防線。
這個團隊的目標是解決一個極度複雜的AI難題(比如訓練GPT-4),而單靠一個數學家(單一晶片)是絕對不夠的,必須依靠數千名數學家組成的團隊(AI叢集)協同工作。
美國的規則就是為了確保中國無法組建出最頂尖的「數學家團隊」。為此,他們設立了三條各自獨立的紅線:
規則一:「總算力」門檻 (Total Processing Performance)
這是什麼? 限制單一數學家個人的聰明上限(個人計算速度)。
比喻: 這條規則等於在說:「你團隊裡的任何一個數學家,其智商(算力)都不能超過180。」這是最直接的限制,防止單兵作戰能力過強的晶片出現。
規則二:「性能密度」門檻 (Performance Density)
這是什麼? 這是一個防止「化整為零」的規則。它的公式是:總算力 ÷ 晶片面積。
比喻: 這條規則並非關於團隊溝通。它關注的是數學家「大腦的精華濃縮度」。
想像一下,規則一禁止你聘用智商180的愛因斯坦。
但你很聰明,你說:「好,那我專門製造一種『迷你大腦』,每個體積只有正常大腦的十分之一,但智商高達160。然後我把十個這種『迷你大腦』緊密地組裝在一起,不就等於創造出一個超級天才了嗎?」
「性能密度」規則就是為了堵住這個漏洞。它等於在說:
「我們不僅要看你每個數學家的智商(總算力),還要看他的大腦有多濃縮(晶片面積)。如果智商相對於大腦體積的比例過高,即使總智商沒超標,也禁止!」
這就從根本上限制了透過堆疊高密度「小晶片」(Chiplet) 來繞過管制的能力。
規則三:「互連頻寬」門檻 (Interconnect Bandwidth)
比喻: 無論你的數學家個人有多聰明,真正決定團隊能否解決頂級難題的,是他們的溝通效率。如果溝通不暢,一群天才也會因等待訊息而癱瘓。
因此,這第三條獨立的規則等於在說:
「我們直接限制你團隊的會議室大小和溝通線路的速度(互連頻寬)。你可以讓數學家們溝通順暢(高頻寬),但前提是他們必須只是一群普通學生(低算力);或者,你可以擁有一群相當聰明的數學家(中等算力),但必須讓他們用寫信的方式緩慢溝通(低頻寬)。」
所以,美國的管制策略是三管齊下的:
限制你引擎的最大馬力(總算力)。
限制你把引擎做得又小又強的能力(性能密度)。
限制你車子的輪胎和傳動軸,讓引擎的馬力無法有效傳遞到多個輪子上協同作用(互連頻寬)。
這三條規則中,任何一條被觸發,晶片就會被管制。這確保了即使單項指標看起來合規,但只要它在「個人能力」、「能量密度」或「團隊協作」任何一個維度上過於突出,就無法被用來組建頂級的AI訓練叢集,從而達到了從根本上限制其集體實力的目的。
規則二:懸而未決的「15%營收上繳」條款
這項提議是地緣政治工具箱裡的「新發明」。它對Nvidia構成了巨大的商業難題:
財務衝擊: 這筆費用究竟是視為「稅金」還是「銷售成本」?它將直接侵蝕Nvidia本已高達70%以上的毛利率。
定價難題: 這15%的成本,是轉嫁給中國客戶,還是由Nvidia自行吸收?如果轉嫁,將使其產品在與中國本土晶片的競爭中處於價格劣勢。
營收確認風險: 正如Nvidia財務長Colette Kress所言,在正式法規出台前,公司無法確認這筆收入,這給其財務預測帶來了極大的不確定性。
1.3 結構性逆風 vs. 週期性波動
作為投資者,區分影響市場的長期結構性因素和短期週期性因素至關重要。
結構性因素(決定賽局走向的長期力量):
美國出口管制: 這是最核心的結構性逆風,已從晶片本身擴展到製造設備(如EUV光刻機)。
CUDA生態系鎖定: Nvidia真正的護城河,構成了極高的轉換壁壘。
中國本土製造瓶頸: 本土晶圓代工廠在先進製程上的代差,是所有本土晶片公司無法迴避的物理限制。
週期性因素(影響季度表現的短期波動):
這些因素如同市場的「短期天氣」,會造成波動,但並不改變長期的「氣候」。AI資本支出週期:雲端巨頭經歷瘋狂採購(暴食期)後,需時間消化算力轉化收入,因此暫緩訂單。
加速卡價格波動:灰色市場的黃牛價對政策和供需敏感,影響官方定價。
短期補貼政策:政府採購如興奮劑,催生短期訂單,但結束後可能出現市場真空。
總結而言,當前的市場變局,主要是由結構性因素驅動的。
這意味著我們正在見證的,並非短期的市場波動,而是一場深刻的、長期的產業格局重塑。
第二章:共同的枷鎖——中國半導體產業的物理邊界與生態高牆
在分析賽局中各個「棋手」的策略之前,我們必須先理解「棋盤」本身的物理限制。
所有中國的AI晶片玩家,無論其設計多麼宏偉,戰略多麼高明,都戴著一副共同的、由產業基礎設施決定的沉重鐐銬。
這副鐐銬由兩部分組成:難以逾越的「物理邊界」和根深蒂固的「生態高牆」。
2.1 物理邊界之一:製造之牆
所有中國頂尖AI晶片設計公司的命運,最終都匯流到了一家企業:中芯國際(SMIC)。
它是中國大陸唯一能提供7奈米先進製程的晶圓代工廠,也是橫在所有雄心壯志前的一堵高牆,由三個核心指標構成:
良率(Yield):中芯國際因使用DUV光刻機,其7奈米製程的良率據報不足50%,導致每100顆晶片就有超過50顆是廢品。這不僅讓產量低下,也讓需要高度一致性的AI叢集組建變得極其困難。對比之下,台積電在2025年初的2奈米製程良率已達60%,甚至傳出近期能達到90%。
成本(Cost):低良率,疊加上DUV多重曝光技術比EUV高出50%的生產成本,使得中國晶片的有效成本可能是台積電同級產品的2-3倍。這讓它們從出廠那一刻起,就背負著沉重的成本包袱。
產能(Capacity):中芯國際的先進製程產能優先供應給華為。這使得其他公司如寒武紀能獲得的份額非常有限,常常導致中國晶片陷入「理論上很不錯,市場上買不到」的窘境。2024年,華為昇騰910B的出貨量據估計僅20萬顆,而同期Nvidia向全球交付了超過100萬顆H100,差距顯而易見。
2.2 物理邊界之二:封裝與記憶體的窒息點
先進封裝(Advanced Packaging):頂級AI晶片極度依賴如台積電 CoWoS 這類的2.5D/3D封裝技術,將多個晶片和記憶體堆疊在一起。中國本土的封裝廠如長電科技與通富微電,雖然在努力追趕,但在技術成熟度和產能上仍有差距,這直接限制了中國晶片系統性能的上限。
高頻寬記憶體(HBM):這個市場被三星、SK海力士和美光三家巨頭壟斷。中國的長鑫存儲在技術上仍落後數代,無法自主生產HBM。這意味著所有中國高端AI晶片都面臨著關鍵「糧食」被隨時切斷的風險。
2.3 生態高牆:CUDA帝國下的三種選擇
如果說硬體決定了性能的「天花板」,那麼軟體生態則決定了開發者「是否願意走進這座房子」。在這場關於習慣、效率和信任的戰爭中,所有玩家都必須面對 CUDA 這座高牆,並做出自己的選擇。
無可爭議的帝國 —— Nvidia CUDA:
經過15年的投入,CUDA佔據了超過90%的市場份額。它集開發工具、函式庫和龐大的開發者社群於一體,形成了一條深不見底的護城河。
然而,其專有和封閉的特性,在出口管制的背景下,也成為中國用戶最致命的戰略弱點。
雄心勃勃的挑戰者 —— 華為的CANN與MindSpore:
華為選擇了最艱難的道路——建立一個完全獨立的系統。
其優點是完全自主可控,但生態過於年輕,長期被開發者批評不穩定、文檔差,學習曲線極其陡峭。
務實的適應者 —— 阿里與寒武紀的「兼容派」:
它們選擇兼容 PyTorch 等主流開源框架,極大降低了開發者的遷移門檻。
但這種策略的代價是無法建立自己獨有的生態護城河,且底層優化受限。
第三章:戴著鐐銬的王者——Nvidia的防守反擊戰
面對中國市場這塊佔其數據中心業務近20%的版圖,Nvidia的處境極為微妙。
它既要遵守美國政府日益嚴苛的規定,又要抵禦中國本土競爭對手的蠶食。
它的策略不是硬碰硬的對抗,而是一場精密的、在規則邊緣遊走的防守反擊。這是一場戴著鐐銬的舞蹈,每一步都必須精準無比。
3.1 H20的昂貴教訓與15%的枷鎖
H20晶片的潰敗,給Nvidia上了一堂價值 45億美元 的昂貴課程。
這筆驚人的庫存減損,不僅是財務報表上的一個數字,更是華爾街衡量其管理層應對地緣政治風險能力的關鍵指標。
然而,相比於一次性的損失,後續的 「15%營收上繳」 條款,才是套在Nvidia脖子上一個更長期、更棘手的枷鎖。這個條款對Nvidia的商業模式構成了三重打擊:
毛利率的直接侵蝕:15%的費用將從其高達75%以上的毛利率中直接扣除,無論會計上定義為稅金還是銷售成本,都將重創其盈利能力。
銷售渠道的混亂:將成本轉嫁給客戶會削弱產品競爭力,自行吸收則犧牲利潤。這種兩難處境讓其通路夥伴無所適從。
營收確認的會計難題:在法規細節不明朗之前,無法確認相關收入,這直接導致了2025年第二季度對華銷售額戲劇性地歸零。
3.2 B30A:一把懸而未決的法律工程學手術刀
在H20的廢墟之上,Nvidia正在醞釀其下一代應對方案:B30A。
然而,這款晶片並非已成定局的產品,而是仍處於一個「微妙階段」的「法律工程學」產物。
它的所有細節,從最終性能到能否面市,都取決於與美國政府的持續對話。
Nvidia CEO黃仁勳本人也坦言,雖然公司正在為中國市場準備H20的後繼產品,但「這不是我們能做的決定,這取決於美國政府。」
因此,我們對B30A的分析,是基於目前市場上最可靠的傳聞和消息,來推演Nvidia試圖在這條合規的鋼絲上,走出怎樣精妙的舞步。
它的目標,依然是沿著「性能密度」的紅線進行一次完美的外科手術式切割。
B30A的設計哲學:一個更聰明的「半顆心臟」
據市場消息,B30A的性能約是其全球旗艦B300的一半。但這不是簡單的算力減半,而是一場精密的「外科手術」,其核心是架構的代際飛躍:
從Hopper到Blackwell: H20基於較舊的Hopper架構(H100的同代技術),而B30A據稱將搭載Nvidia最新的Blackwell架構。這本身就是一次根本性的升級,意味著底層效率和能力的全面提升。
單晶片設計: 據行業推測,B30A將採用更簡潔的單晶片(Single-Die)設計,將所有電路整合在一塊完整的矽片上。這既降低了製造成本,也更容易在性能上進行精準控制以滿足法規。
這場手術的精妙之處,據稱體現在以下三個關鍵的「取」與「捨」:
1. 架構優勢:取「巧勁」,而非「蠻力」
B30A預計將繼承Blackwell架構最核心的優勢,例如其搭載的第二代Transformer Engine。這就像給晶片安裝了一個專門理解AI語言模型的「協同處理器」。
好比一台僅有1200萬像素的最新款手機,憑藉其先進的AI影像處理晶片,在色彩和夜景表現上能輕鬆勝過一台只有「蠻力」的2400萬像素老款相機——B30A追求的正是這種「架構巧勁」,而非純粹的算力堆砌。
2. 記憶體的取捨:取「個人空間」,捨「團隊頻寬」
這是B30A相較於H20最顯著的潛在升級。據報導,它將配備高達144GB的HBM3e高速記憶體,比H20的96GB HBM3多出了整整48GB。
這相當於給一個天才員工配備了超快的本地硬碟(HBM3e),並且硬碟容量還擴大了50%,讓他能獨立處理更龐大、更複雜的個人任務。
然而,正如「性能密度」規則所要求的,儘管個人工具升級了,但辦公室的總體溝通效率(互連頻寬)依然會受到嚴格限制,導致在需要千人協作的大項目中,數據共享的延遲仍會拖慢整個團隊的進度。
這正是性能密度管制的目標:允許單兵作戰極其高效,卻從根本上限制大規模叢集的組建能力。
3. 功耗與互連:更精準的「節流閥」
B30A的設計並非簡單降級,而是更精準的「節流」。
功耗控制(更優的能效比): H20的功耗約為400瓦。得益於Blackwell架構據稱高達25倍的能效提升,B30A預計能在相近甚至更低的功耗下,釋放出遠超H20的性能。這如同設計一台性能翻倍的超級家電,卻依然能使用「標準插座」,無需客戶對數據中心進行昂貴的電源改造,極大降低了部署成本。
互連技術(帶有限速閥的私家高速): B30A據稱保留了Nvidia自家的NVLink高速互連技術。這是一個關鍵的信號。它不再是「放棄私家高速公路,改走公共道路」,而更像是「你依然可以在私家高速上行駛,但我們給你安裝了一個無法拆卸的電子限速閥」。Nvidia提供了最好的技術,但將其速度精確地校準在合規的紅線之下,既保證了基礎的叢集能力,又滿足了性能密度的嚴苛要求。
總結而言,Nvidia在中國的策略已經非常清晰:
它放棄了在頂級訓練市場上與政策進行正面對撞,而是利用其無可匹敵的CUDA生態和深厚的架構設計能力,提供一個性能「足夠好」、開發體驗「最熟悉」、部署成本「可接受」的次優選擇。
它的賭注是:對於中國廣大的AI應用開發者而言,與其去適應一個全新的、不成熟的中國軟硬體平台,不如繼續留在熟悉的CUDA環境裡,即便硬件性能受到了一些限制。
這場防守反擊戰的成敗,將直接取決於中國本土的挑戰者們,能否提供一個真正具備吸引力的替代路徑。
但對於中國的政府、國企、甚至像字節跳動這樣的巨頭,採購中國晶片不僅是商業決策,也帶有「政治正確」和「供應鏈安全」的戰略考量。
他們有多大的決心和意願去承受遷移到中國平台的陣痛?這種來自客戶端的壓力,是Nvidia的CUDA護城河在中國市場面臨的最大侵蝕力量。
第四章:中國國家隊的王牌——華為的全棧式豪賭
在美國制裁切斷其手機業務的命脈之後,華為將其驚人的研發能量和求生本能,全部注入了雲計算和AI這兩個新戰場。
與市場上其他晶片設計公司不同,華為的目標從一開始就不是設計一顆能單獨出售的晶片,而是要打造一個能與Nvidia生態系全面抗衡的「平行宇宙」。
這是一場從底層晶片、到伺服器、再到軟體框架的全棧式(Full-Stack)豪賭。
4.1 昇騰(Ascend)架構與HCCS高速互連
華為的底氣,來自其「昇騰」(Ascend)系列AI晶片。從910B到最新的910C,其單卡算力在理論上已經達到了可以與Nvidia降規版晶片一較高下的水平。
但華為深知,單卡的性能競賽已非戰場的全部。在大型語言模型(LLM)的時代,真正的決勝點在於「叢集擴展能力」:
即能否將成千上萬顆晶片高效地連接起來,形成一個統一的超級計算機。
這正是華為與寒武紀等對手最顯著的區別所在。華為亮出的王牌是其自研的HCCS(Huawei Collective Communication Service)高速互連技術。
對標NVLink:HCCS是專為昇騰設計的高速互連,讓數據在數千晶片間高效傳輸。
系統級優勢:Nvidia合規晶片頻寬受限時,華為叢集可全速運行,系統優化勝過單點性能。
4.2 軟體生態的艱難破局:從MindSpore到擁抱PyTorch
華為從一開始就明白CUDA生態的強大之處。
為此,它也採取了「硬體+軟體」雙管齊下的策略,推出了對標CUDA的底層計算架構CANN(Compute Architecture for Neural Networks),以及對標TensorFlow/PyTorch的上層深度學習框架MindSpore。
然而,從零建立生態無異於愚公移山,開發者很難放棄PyTorch的便利。在認識到這個殘酷的現實後,華為做出了務實的戰略轉向:如果無法打敗它,那就兼容它。
華為投入巨大資源開發PyTorch適配器,讓開發者幾乎無需修改代碼就能在昇騰硬體上運行模型。
這步棋從「要求你用我的語言」變成了「我能聽懂你的語言」,極大降低了遷移門檻,其兼容策略也正從主流開源模型的支持度上得到驗證。
4.3 「Atlas」伺服器:從賣零件到賣「解決方案」
華為戰略的最有趣之處,在於它並不主要以「晶片供應商」的身份參與競爭,而是以「系統整合商」的身份出現。
其核心產品是Atlas AI計算解決方案——一個包含了昇騰晶片、伺服器、HCCS交換機、液冷散熱系統以及整套軟體的全功能「算力機櫃」。
這種「賣系統」而非「賣零件」的模式,帶來了無可比擬的優勢:
「交鑰匙」工程: 對於客戶(尤其是政府、國企、大型科研機構)而言,他們購買的不是一堆需要自行組裝和調試的零件,而是一套插上電就能運行的完整解決方案。這極大降低了部署的複雜性和風險。
性能保證: 通過全棧自研,華為可以在系統的每一個環節進行深度協同優化,從而保證整個叢集的穩定性和性能表現。這是由不同廠商零件「攢」出來的系統所無法比擬的。
戰略鎖定: 一旦客戶採用了Atlas系統,就等於進入了華為的生態圈。從硬體升級到軟體維護,都將深度綁定華為,這構建了一條比單純的CUDA更難撼動的護城河。
4.4 投資者視角:如何看待不可投資的華為
華為的AI晶片戰略,是一場典型的「非對稱戰爭」。
它避開了在公開市場上與Nvidia進行晶片對晶片的直接對碰,而是利用其在系統整合、網路技術和軟體開發上的綜合實力,開闢了一個「系統對系統」的藍海戰場。
它的目標客戶非常明確:
那些將供應鏈安全和系統級性能置於CUDA生態便利性之上的核心用戶。
憑藉其獨一無二的「國家隊」身份和全棧整合能力,華為正在中國的AI算力版圖上,劃出一個越來越大的、自給自足的勢力範圍。
華為在推動其生態時,不僅僅是一家公司,它還扮演了部分「行業標準制定者」和「政府項目承包商」的角色。
例如,它與頂尖大學合作開設MindSpore課程,主導國家級的AI計算中心建設。這種「自上而下」的推廣能力,是其他民營公司完全不具備的,也是其生態系統雖難用但仍能快速鋪開的關鍵。
由於華為非上市公司,投資者無法直接對其進行投資。
然而,在分析中國AI產業鏈時,必須將華為視為一個「不可投資的基準(Un-investable Benchmark)」和「行業變數(Industry Variable)」。
其成功與否,直接定義了所有其他中國玩家(寒武紀、阿里、百度)的生存空間和天花板。
華爾街如何利用華為的數據:
衡量競爭格局: 華為昇騰晶片的出貨量和市佔率,是評估Nvidia在華業務壓力、以及寒武紀等本土對手市場份額的「反向指標」。華為每多佔1%的市佔率,都意味著其他競爭對手潛在市場的縮小。
評估供應鏈機會: 華為的崛起,為其背後的本土供應鏈(如中芯國際、先進封裝廠、伺服器組件商)提供了最直接的增長動力。分析師會追蹤「華為概念股」作為投資中國半導體自主化主題的替代方案。
判斷生態成熟度: MindSpore的開發者活躍度和CANN生態的完善程度,是判斷中國AI生態能否「脫離」CUDA獨立行走的最重要風向標。
對其他公司的影響:
對寒武紀: 華為既是其在產能上的「爭奪者」(搶佔中芯國際產能),也是其在市場上的「頭號對手」。
對阿里/騰訊: 華為的全棧式解決方案,對雲巨頭們的企業客戶構成了直接競爭。
對Nvidia: 華為是唯一有潛力在中國市場從晶片、軟體到系統層面,對Nvidia構成全方位挑戰的對手。
總結: 對於投資者而言,追蹤華為的每一個動作——從晶片發布到生態建設——不是為了買入華為,而是為了更精準地為其競爭對手和合作夥伴進行定價和風險評估。
第五章:雲端巨頭的自救 - 從降本增效到算力自由
當外界的目光聚焦於華為的強勢崛起時,雲端運算巨頭們正在以一種更務實、更貼近商業本質的方式,開闢自己的求生之路。
他們的戰略核心並非在公開市場上與Nvidia一較高下,而是首先為自己龐大的商業帝國實現「算力自由」。
2025年8月底,華爾街日報報導阿里巴巴將會自研芯片,導致其股價飆升接近20%。
5.1 驅動力之變:從「降本增效」到「供應鏈自主」
要理解阿里巴巴為何要投入鉅資自研晶片,首先必須理解其商業模式的內在需求。
作為全球頂尖的雲服務商和電商平台,阿里巴巴的日常運營本身就是一個巨大的算力消耗機器。
它的第一步始於2019年,其內部晶片設計團隊「平頭哥」(T-Head)推出了含光800。
這款在當時採用台積電12奈米製程的AI推理(Inference)晶片,專為淘寶的商品搜索、圖像識別、個性化推薦等海量、高頻的場景而設計。
其驚人的能效比(每秒處理78,563張圖片)證明了自研晶片的巨大價值——用更低的成本,更高效地完成核心業務。
然而,從2024年開始,這條路的驅動力發生了質變。隨著美國出口管制收緊,台積電等全球頂尖晶圓代工廠被迫停止為中國客戶生產先進AI晶片。
這使得阿里巴巴的動機從單純的「降本增效」,升級為更具緊迫性的「供應鏈自主」。將核心業務的算力完全寄託於外部供應商,已成為不可接受的戰略風險。
5.2 新戰略:531億美元的豪賭與務實的「推理優先」
面對新局勢,阿里巴巴的應對是果斷的。
公司在上星期五宣布了一項為期三年的3800億人民幣(約531億美元)的龐大投資計畫。這筆資金的目標,是打造一個從晶片、到伺服器、再到雲端基礎設施的垂直整合AI生態系統。
這場豪賭的核心,是其2025年正在雲端數據中心進行測試的新一代AI晶片。
與華為試圖在訓練領域正面對决不同,阿里巴巴延續並深化了其務實的「推理優先」戰略。
戰略定位: 新晶片並非要挑戰Nvidia B300或H100在AI訓練上的王者地位,而是專注於處理更廣泛、更多樣化的AI推理任務。
這款晶片被設計得比舊款更具通用性,能服務於更廣闊的AI推理場景。對於雲端服務商而言,80%以上的AI算力需求來自於推理而非訓練,這是一個更龐大、更具成本效益的市場。
製造轉變: 最關鍵的變化是,這款晶片將從設計到生產,完全在中國本土完成。
這是一個里程碑式的轉變,意味著阿里為了供應鏈安全,願意接受在製程技術上(可能使用中芯國際的7奈米或更成熟的製程)暫時落後於全球頂尖水平的現實。
性能權衡: 在相對較舊的製程節點上製造,意味著其晶片在功耗和性能密度上可能不及台積電的3奈米產品。
但阿里巴巴的算盤是,通過系統級的優化和針對特定場景的設計,在真實的雲端推理應用中,依然可以獲得極具競爭力的成本和效率。
5.3 雙軌並行:擁抱開源RISC-V與兼容CUDA生態
阿里巴巴晶片戰略最有趣之處,在於其「雙軌並行」的軟體策略。這就像一個城市規劃師,他既要規劃一條通向未來的全新高速公路,又要修建一座能立刻解決當下交通擁堵的便橋。
軌道一:長期佈局,擁抱開源RISC-V(建一條屬於自己的新高速)
我們可以把主流的晶片指令集架構(如Intel的x86和手機上普遍使用的ARM)想像成由西方公司控制的「私有公路系統」。
而RISC-V則是一套開源、免費、全球共享的「公路設計藍圖」。
阿里巴巴旗下的「平頭哥」團隊,不僅用這份藍圖為自己設計了「玄鐵」系列晶片,還將自己優化過的設計圖也開源出去,希望吸引全球開發者共同建立一個不受任何人控制的全新生態。這是一條徹底實現自主可控的長遠道路。
軌道二:短期務實,無縫兼容CUDA(在對手的花園旁修一座便橋)
在「新高速」還未建好之前,開發者們依然擠在Nvidia那條名為CUDA的「私家高速」上。面對這個現實,阿里決定確保其新晶片與CUDA平台高度兼容。
這意味著什麼?如果說Nvidia的CUDA是蘋果的iOS生態,其他挑戰者就像安卓,需要勸說開發者為新平台重寫App。而阿里的策略則不一樣,它相當於推出了一款能直接完美運行所有iPhone App的新手機。
這就是「無痛切換」,它沒有試圖推倒Nvidia的圍牆,而是在牆邊巧妙地搭建了一座便橋,直接將牆內最寶貴的資產——開發者和他們的應用——吸引過來。
5.4 投資者視角:雲業務的價值重估
阿里巴巴的AI晶片之路,是一條典型的「由內而外」的垂直整合路徑。
它始於解決自身最迫切的成本和供應鏈安全問題,並通過一場531億美元的豪賭,將其自研的、以推理為核心的算力,深度整合進其佔據中國市場領先份額的雲端服務中。
它的戰場不在晶片貨架上,而在阿里雲的產品目錄裡——它不會直接出售晶片,而是將算力以雲服務的形式租賃給客戶。
通過將「中國國產、合規、低成本、且兼容CUDA生態」的自研算力轉化為雲服務產品,它不僅為自身的商業帝國築起了堅固的護城河,更在雲計算這個主戰場上,為自己打造出了一把用以吸引和留住客戶的、獨一無二的利器。
與此同時,騰訊(憑藉其「紫霄」晶片)和百度(憑藉其「崑崙芯」)也採取了類似的「自研自用、融入雲端」的垂直整合策略,共同構成了中國雲計算行業集體「自救」的圖景。
投資中國雲巨頭(如阿里巴巴),正從投資其「電商/社交業務的現金牛」邏輯,轉向投資其「雲端業務的價值重估(Re-rating)」。
自研AI晶片是實現這一價值重估的核心催化劑。市場開始意識到,自研晶片不僅僅是為了節省採購成本(降低Capex),更是為了在雲端主戰場上,打造一條不受地緣政治影響、具備長期利潤率優勢的戰略護城河。
華爾街關注的關鍵指標 (Key KPIs):
雲業務的營收增長與利潤率(EBITA Margin): 這是最核心的指標。如果自研晶片能帶來雲業務利潤率的持續改善,將直接提升整個公司的估值中樞。
資本支出(Capex)佔營收比重: 成功的晶片自研和部署,應能有效降低對外採購昂貴GPU的依賴,從而在中長期內降低資本支出強度。
自研晶片在內部業務的滲透率: 有多少比例的AI工作負載(特別是推理任務)運行在自研晶片上。
潛在催化劑 (Catalysts):
正面: 阿里雲宣布其核心AI服務(如大模型推理)的成本因自研晶片而降低了30%以上;其「兼容CUDA」的方案獲得大量開發者採用,形成新的生態吸引力。
負面: 自研晶片性能或穩定性不及預期,導致雲業務的競爭力下降;高昂的研發投入在數年內無法轉化為顯著的財務回報。
市場情緒與估值考量:
長期以來,市場對阿里等公司的估值受到監管壓力、宏觀經濟和激烈競爭的多重壓制。
AI晶片的「供應鏈自主」故事,為華爾街提供了一個全新的、具有想像空間的敘事。
如果阿里能證明其531億美元的投資能換來雲業務的「高質量增長」(即有利潤的增長),其估值有望從當前的「價值股(Value Stock)」邏輯,部分切換回「成長股(Growth Stock)」邏輯。
第六章:獨立挑戰者的豪賭
在中國AI晶片的版圖上,寒武紀(Cambricon)是一個迷人的存在。
它既是中國在AI晶片設計領域技術實力的巔峰代表,也是整個中國半導體工業「卡脖子」困境最真實的縮影。
其近期在資本市場上44倍的營收年增長和首次實現季度盈利的驚人表現,是由一個由地緣政治(制裁窗口)、戰略客戶(深度綁定)和務實策略(兼容生態)共同構成的「完美風暴」所催生。
但這耀眼的光環之下,是懸於設計、製造、客戶和軟體四條鋼絲之上的驚險一舞。
6.1 設計上的榮光:直面H100的雄心
寒武紀的故事,首先必須從其毋庸置疑的設計能力講起。這家由中科院「天才少年班」出身的陳氏兄弟創立的公司,已經用產品證明,在繪製AI晶片藍圖的競賽中,中國並不落後。
旗艦產品MLU370系列: 這款晶片採用先進的Chiplet(小晶片)技術,在台積電7奈米製程上集成了高達390億個電晶體,明確瞄準了高端訓練市場。
下一代思元(Siyuan)系列的野望: 其思元590據稱已能達到Nvidia A100約80%的性能。而正在開發中的思元690,其設計目標更是直接鎖定Nvidia的上一代旗艦H100。
6.2 製造上的枷鎖:看得見卻摸不著的性能
然而,一張再輝煌的藍圖,如果無法被完美地製造出來,也只是一張廢紙。
真正的噩夢,始於2022年12月——寒武紀被列入美國實體清單,這切斷了它與台積電的合作生命線,迫使其全面轉向中國本土的晶圓代工廠——中芯國際(SMIC)。
這一轉變,讓寒武紀一頭撞上了剛才提過的中國半導體工業最堅硬的「嘆息之牆」,面臨三重枷鎖:
良率的詛咒:中芯7奈米良率不足50%,製造成本數倍台積電。
成本的枷鎖:售價低但對於數據中心而言,它們計算的是總擁有成本(TCO),包括了電費和散熱成本。由於製程落後,寒武紀晶片要達到同樣的算力,功耗通常更高。功耗大增電費,蠶食價格優勢。
產能的爭奪:在中芯國際有限的先進產能中,華為是優先級最高的客戶,寒武紀作為「外部客戶」,容易陷入「有訂單,無產能」的困境。
6.3 戰略生命線:與字節跳動的「共生」及務實的軟體
在製造的絕境中,寒武紀之所以能上演營收暴增的奇蹟,關鍵在於它抓住了兩根戰略生命線。
第一根生命線:與字節跳動的「共生」,而非簡單的「依賴」
這段關係早已超越了簡單的客戶關係,也吸取了早期被華為拋棄的慘痛教訓(2018年,華為曾佔其收入的98%)。
訂單的規模與確定性: 在字節跳動2025年高達600億元人民幣的AI晶片採購計畫中,給予寒武紀的份額預計高達40%-60%。這提供了極其寶貴的、可預期的市場需求。
技術層面的深度鎖定: 這才是「共生」的核心。字節跳動內部已有數千個AI模型,是專門針對寒武紀的硬體架構和軟體指令集進行了深度優化。如果更換供應商,意味著巨大的遷移成本,這形成了一條強大的技術護城河和業務鎖定。
數據反哺設計: 字節跳動海量的真實世界工作負載數據,可以反哺給寒武紀,使其下一代晶片設計能精準地針對真實需求進行優化,形成設計-應用-反饋的良性循環。
第二根生命線:務實的軟體——最聰明的「兼容」策略
在軟體生態這座大山面前,寒武紀展現了高度的務實精神。它沒有像華為那樣執著於推廣一個全新的、被開發者詬病為「不穩定、文檔差」的CANN框架,而是選擇了一條更聰明的路:
擁抱兼容,降低「換軌成本」: 寒武紀大力投入其MagicMind推理加速引擎,並著力增強對Nvidia CUDA生態的兼容性。
這為何聰明? 強迫一個習慣了CUDA的開發者去學習CANN,就像強迫一個只會英語的程式設計師去用俄語寫代碼。而寒武紀的策略則是:「你可以繼續用你習慣的『語法』,我的平台能聽懂。」這極大降低了開發者的遷移成本,在國內市場,這種「對開發者友好」的策略,成為了它相較於華為的一個關鍵差異化優勢。
6.4 投資者視角:高風險、高回報的純粹標的
寒武紀的生存與爆發,源於一個精妙的平衡。但這種平衡也潛藏著四大致命風險:
客戶單一風險: 對字節跳動的深度依賴是一把雙刃劍。一旦字節跳動的戰略轉向(例如未來也決定自研晶片),寒武紀可能重蹈覆轍。
製造瓶頸風險: 它的命運,不掌握在自己手中,而取決於中芯國際何時能將那不足50%的良率,變成一個有商業競爭力的數字。
代際追趕風險: 即使思元690成功對標H100,Nvidia的下一代Blackwell系列已經全面鋪開。寒武紀始終在追趕一個不斷加速的目標。
內部競爭風險: 在有限的國內產能下,它必須與華為這樣的「巨無霸」爭搶資源。
寒武紀的故事,是中國AI晶片產業最真實的寫照:既有衝擊世界之巔的設計雄心,又被製造的現實牢牢鎖住腳踝;既有抓住戰略機遇的商業智慧,又時刻面臨著依賴單一大客戶的潛在危機。
它能否將這場驚險的鋼絲舞,最終走成一條康莊大道,將是未來幾年中國科技領域最值得關注的焦點之一。
投資寒武紀,是一場典型的「高風險、高回報」的豪賭。
它是在中國A股市場上,對「非華為系」中國AI晶片龍頭最直接的「純粹投資(Pure-play)」。其股價表現是多個極端變數的函數,包括單一大客戶的依賴、製造良率的瓶頸以及與巨頭的技術競賽。
華爾街關注的關鍵指標 (Key KPIs):
客戶集中度: 來自字節跳動的收入佔比。任何關於字節跳動尋找替代供應商(包括自研)的跡象,都將對其估值構成致命打擊。
毛利率與淨利潤: 首次實現季度盈利是一個重要的里程碑。市場將密切關注其盈利的可持續性,以及毛利率能否在中芯國際產能爬坡後得到改善。
出貨量與庫存: 實際出貨量證明其將訂單轉化為收入的能力,而庫存水平則反映了製造端(良率)和需求端是否存在問題。
潛在催化劑 (Catalysts):
正面: 成功開拓除字節跳動外的第二個「億元級」大客戶,打破單一依賴風險;中芯國際宣布其7奈米良率取得重大突破;其軟體兼容策略吸引到一批原CUDA生態的中小企業客戶。
負面: 字節跳動大幅削減訂單;華為昇騰晶片憑藉系統優勢和產能優先級,搶走其潛在客戶;新一代晶片(如思元690)性能評測不及預期。
市場情緒與估值考量:
寒武紀的估值極具波動性,PE Ratio並不算是一個好的指標,始終他們才剛剛成功扭虧為盈。其股價對政策風聲、行業傳聞和客戶訂單消息極其敏感,是典型的「事件驅動型」股票。
投資者必須清楚,自己投資的不是一家成熟的企業,而是一個在鋼絲上奔跑的潛力選手,其未來存在歸零和翻倍的雙重可能。
終章:終局推演——場景、變數與最終的判決
綜合以上對賽局規則、共同枷鎖以及各方玩家策略的分析,我們可以對這場中國晶片戰爭的未來,做出更清晰的場景推演。
7.1 賽局推演:未來1-5年的場景分析
1-3年內(2025-2027):混亂的「中國國產替代」期
場景: 市場將呈現「高端靠走私,中端用降規,低端中國國產」的混亂格局。Nvidia的降規版晶片(如B30A)和通過灰色市場流入的高端晶片,仍將是大型模型訓練的主力。華為和寒武紀將在中國政府、國企及部分頭部互聯網公司的「國產化」訂單中搶佔份額,但規模受限於製造瓶頸。
關鍵催化劑/風險: 美國是否會進一步收緊對降規版晶片的限制;中芯國際7奈米良率能否突破50%。
核心KPI: 華為/寒武紀的實際出貨量和市場份額;中芯國際的良率和產能擴張速度。
3-5年內(2027-2029):生態的「鞏固與分化」期
場景: 中國的AI應用將出現明顯分化。追求極致性能和全球通用性的公司,將繼續想方設法使用Nvidia產品。而更看重供應鏈安全和成本效益的應用(尤其是在推理、政務、金融等領域),將大規模遷移至以華為為核心的中國軟硬體棧。中國的HBM和先進封裝技術有望取得初步突破,緩解部分瓶頸。
關鍵催化劑/風險: 中國國產HBM是否能量產;華為CANN生態的易用性是否得到根本性改善。
核心KPI: 中國國產AI晶片在推理市場的佔有率;華為MindSpore的開發者社群活躍度。
5年以上(2030+):走向「技術分岔」
場景: 全球AI技術生態可能走向事實上的「技術分岔」。一個是以Nvidia-CUDA為核心的全球生態,另一個是以華為-CANN為核心的、主要在中國及部分「一帶一路」國家運行的獨立生態。屆時,中國可能在某些特定領域形成非對稱優勢,但在尖端製程上可能依然落後。
非對稱優勢體現:
成熟製程的規模優勢: 利用龐大的28/14奈米產能,在物聯網、汽車晶片等領域形成絕對的成本和規模優勢。
應用場景的數據優勢: 憑藉海量數據,在人臉識別、智慧城市等應用上,通過「應用層的創新」來彌補「硬體層的不足」。
關鍵催化劑/風險: 中國在光刻機等核心半導體設備上能否取得顛覆性突破。
核心KPI: 中國半導體的整體自給率;兩個生態系統之間的軟體兼容性。
7.2 灰色市場(Grey Market)的「萬能牌」
在所有分析中,必須承認「灰色市場」這張萬能牌的存在。通過各種渠道走私或拆解再利用的Nvidia高端GPU,如同一個壓力釋放閥。
這是一把雙刃劍。
它一方面讓中國的頂尖AI研發不至於完全停滯,但另一方面,也削弱了中國國內企業轉向中國本地方案的緊迫性,在一定程度上延緩了中國軟體生態的建設進程。
7.3 最終想法:一場沒有終點的平行賽跑
綜上所述,中國的AI晶片之戰,其最終結局可能並非是傳統意義上的「追趕」或「超越」。由於在製造設備這一根源上被「釜底抽薪」,中國極難在同一條跑道上追上對手。
更有可能的未來是,中國將被迫另闢蹊徑,開闢一條平行的賽道。
在這條賽道上,中國將利用其巨大的市場、國家級別的投入和在系統應用上的創新能力,去彌補其在底層硬體上的短板。這將導致一個與世界主流不同的、自成一體、但功能「夠用」的技術體系的誕生。
這不是一場百米衝刺,而是一場沒有終點的、在不同規則下的平行賽跑。這場賽跑的結果,將深刻地重塑未來數十年的全球科技版圖。
最後,宣傳一下自己,我在Threads,Facebook和IG都有定期發文,另外Telegram有頻道,每天早上我會發當天重要新聞摘要,有興趣可以追蹤一下我,鏈結是:
當然,如果你都看到這裡,這麼精彩的文章,給個讚也不過份吧哈哈。
KP










每次看完FOMO的文章都總能引起更多思考,實在是讀者之福。有幾個問題希望和各位有緣人討教一下。
1. 為什麼晶片研發需要如此重視製程之間的差異。事實上,雖然更先進的制程可以容許更有效率的運算(能源效益、空間效益和時間效益),但假如在中國能大量採用再生能源,而土地空間並非一個問題,採用上一代甚至幾代的制程對阿里巴巴這種並非以開發AI為核心的運算是否影響有限?反之在未來是否可以有潛力輸出這種雲端算力?
2. 事實上中國一直都在走一個相對西方更不同的路線。Deepseek的出現再一次展示了中國全方位整合供應鏈的優勢。撇除是否在ChatGPT釣魚學習等因素,單純以結果論,Deepseek可以說是「利用三分一的資源做到別人80%的效果」。而這種小型、以效率為先的AI模型在日常應用中可以發揮很大功效,甚至可能比需要龐大算力的GPT模型更受中小企業和發展中國家青睞。承上第一點,中國在未來的全球AI市場是否依然可以有一席位?還是你認為像NVDA這種公司終歸較容易透過壟斷市場+超深的護城河而雄霸全球市場(當中包括將部分低端技術透過以廉價輸出到發展中國家以搶佔市佔率和更重要的:防止他們採用中國規格的軟硬體)?
3. 像阿里巴巴這種追求「垂直整合」的公司越來越多,失敗的有Tesla,相對成功的有Google的Tensor。文中提及的「技術分岔」推演我也是十分認同的。在我看來也算是這時代因地緣政治問題而被迫妥協的一種做法吧。科技發展到這個地步也是相當可惜。
4. 好奇一問,會否考慮從中芯科技這一所公司開首,深入探討一下整個中國晶片產業鏈的未來(其實我就是懶哈哈)。
看完長文,只覺得這是可以免費看的嗎,感謝分享!