長端利率上升怎麼辦?Cerebras上市,對Nvidia,台積電,記憶體廠有甚麼啟示?- KP思考筆記(第42期)
科技股在連漲了將近一個月後,這個星期終於迎來了一些波動。市場上有很多聲音,試圖為這次回調找理由,但老實說,最簡單也最真實的原因往往只有一個:
漲太多了。
作為投資者,我們天生喜歡為每一波漲跌尋找確鑿的因果關係。這很正常,因為人類的本能需要「確定性」來安撫焦慮。
如果我告訴你,市場很多時候的波動其實並沒有特定原因,純粹是情緒與籌碼的隨機碰撞,你可能很難接受。
相反地,那些聽起來頭頭是道、甚至帶點驚悚色彩的宏觀敘事,往往最能觸動人心。但大家要記住:
投資是反人性的,或者說,要投資成功,你必須學會「反人性」。
當大家還在為美伊局勢戰戰兢兢時,我曾說過「最壞的情況已經過去」,即便當時看起來並非如此;當大家在半導體的狂歡中不能自拔時,我選擇連續兩週不寫半導體,轉向更冷門的主題。這不是為了標新立異,而是為了在情緒過熱時保持那份必要的清醒。
漲了這麼多,你問我會不會繼續漲,還是要調頭下跌?老實說,我也不知道。
而「承認自己不知道」,正是一個成熟投資者最珍貴的品質。
因為知道自己的邊界,所以我不會耗費精力去猜測精確的轉折點,或是試圖抓準每一次的「頂」與「底」。
我會做的,是「動態調整倉位」。當某個標的漲幅過大、導致倉位佔比過高時,我會適度減碼。這不是因為我不看好它,而是因為我對未來保持敬畏。
我會將贏來的利潤,重新配置到那些經過深度研究、我認為價值被低估、但近期表現平平的標的上。比起總是試圖精準預測 Market Timing(市場時機),這種做法對我來說要踏實得多。
當然,要做到這一點,「深度研究」是唯一的門檻。
只有研究得夠深,你才能在波動中辨別出:這家公司是被市場「錯殺」了,還是真的「不行」了。就像我這幾個月一直強調的資安板塊,就是這種邏輯的體現。
本期的《週末思考筆記》,我們延續「一個大主題 + 兩個小主題」的架構:
大主題:Cerebras 的上市,掀開了芯片戰爭的新篇章。
我並不打算探討它的投資價值,而是想透過它的上市,解析背後的「芯片格局」。
為什麼 Cerebras 堅持要做「大芯片」?這對台積電、記憶體廠、甚至 NVIDIA 的護城河有什麼深遠影響?
這個主題的深度,遠超你能在市面上看到的常規分析,我將帶領大家看穿物理極限背後的商業博弈。
另外兩個小主題也同樣精彩:
美債殖利率持續攀升,背後隱藏的信號是什麼? 這是宏觀環境中不可忽視的灰犀牛。
Neoclouds(新興雲端商)雙雄業績大對比: 為什麼在同樣的 AI 浪潮下,兩者的表現卻天差地遠?
這是一期含金量極高的筆記,如果你覺得這些分析對你有啟發,歡迎留言討論或給我一個讚,這對我來說是最大的支持。
讓我們開始吧。
主題一:殖利率突破新高,「泡沬」要爆破了嗎?
Trump和習近平握手、拍照、吃國宴,Trump說習近平是「偉大的領導人」,習近平邀請Trump明年秋天回訪。波音拿到了兩百架飛機的訂單,一票科技大佬跟著去北京露臉。
聽起來不錯對吧?
但如果你去看債券市場在峰會期間做了什麼,你會看到一個完全不同的故事。
十年期美債殖利率衝到 4.5% 以上。三十年期破了 5%,這是 2007 年以來第一次,這是市場在說:「我們沒拿到我們需要的東西。」
市場真正在等的是什麼?
不是波音訂單。不是「穩定的中美關係」。
市場在等的是伊朗。
更精確地說,市場在看中國會否出手幫忙解決荷姆茲海峽的問題。
這條海峽承載全球約 20% 的石油貿易。自從美國和以色列與伊朗開戰以來,這條航道一直處於半封閉狀態。油價因此維持在每桶一百美元以上,而這個價格正在滲透到經濟的每一個角落。
四月的生產者物價指數(PPI)年增 6%,月增 1.4%,這是 2022 年以來最強的數字。消費者物價指數(CPI)同期跳到 3.8%,逆轉了之前好幾個月的降溫趨勢。
能源成本是主因。汽油、運輸、全部都在漲。
市場原本抱著一絲希望:也許習近平會在峰會上承諾幫忙斡旋伊朗,也許中國會減少從伊朗進口石油,也許會有某種訊號讓油價有理由下來。
結果呢?什麼都沒有。Trump自己說停火協議「命懸一線」。習近平專注在台灣問題上發出警告。伊朗的事,基本上沒進展。
於是債券市場做出了它的判斷:通膨不會很快消失。
華爾街的新暗語:NACHO
如果你關注交易圈的討論,最近會聽到一個新詞:NACHO。
這是 “Not A Chance Hormuz Opens” 的縮寫,「荷姆茲海峽開放?門都沒有。」
NACHO(Not A Chance Hormuz Opens)代表的是一個具體的交易方向:押注海峽持續受阻,油價維持高位,通膨居高不下。
這是繼之前「TACO」(Trump Always Chickens Out,Trump總是會退縮)之後,交易員發明的又一個押韻暗語。
NACHO 交易怎麼做?做多原油期貨,做多能源股,做空長期國債。你也會看到人們買進抗通膨債券(TIPS)、黃金、油輪股,任何在「油價不會跌」這個假設下受益的東西。
美中會的結果強化了這個交易。當市場看到峰會沒有帶來任何伊朗方面的突破,NACHO的邏輯就更站得住腳了。
這對聯準會意味著什麼?
波士頓聯儲主席 Susan Collins 最近說得很直接:2026 年不會有降息。通膨不會那麼快消退。要看到真正的緩解,可能要等到 2027 年。
這是目前聯準會官員公開發言中最鷹派的一位。
但大家要理解的是,升息也不是聯準會的主流意見。為什麼?
因為他們認為這是供給面衝擊,不是需求過熱。
油價高是因為伊朗戰爭,不是因為美國人突然都變得很有錢拼命消費。工資在漲,但不是那種會讓聯準會恐慌的速度。房價和租金還是高,但那是結構性問題,不是新的需求爆發。
面對供給面衝擊,教科書式的反應是:觀望。等衝擊過去。因為升息解決不了中東地緣政治問題,降息也不會讓油價下來。
所以現在的狀態是「Higher for longer」,利率會維持高位,但不一定會更高。聯準會在等。等油價的方向,等通膨的下一個數據點,等看看伊朗的局勢會不會改變。
對投資人來說,這意味著什麼?
當長期殖利率上升,高估值成長股會受壓。未來現金流的折現率變高,今天的股價就得往下調。
對於已經漲了很多的股票來說,這就夠了。
你不需要世界末日才有理由賣股票。你只需要一個敘事的轉變。「降息很快會來」變成「降息不知道什麼時候會來」,這就足以讓估值承壓。
如果你在過去一個月的半導體大漲中賺了很多,現在的環境給了你一個合理的理由去減碼、鎖定一些利潤。
我們現在面對的不是「牛市結束了」或「熊市開始了」的二元選擇。我們面對的是「不確定性增加了,但基本面沒有崩壞」。
在這種環境下,減少部位、鎖定利潤、等待更好的機會,是合理的選擇。不是因為你看空,而是因為風險報酬變了。
什麼樣的公司能撐過這個階段?
如果你不想全部賣掉(你也不應該需要),那就專注在對的地方。
有真實現金流的公司比依賴未來成長故事的公司安全。
有定價權的公司比競爭激烈、利潤率薄的公司安全。
資產負債表乾淨的公司比負債累累需要再融資的公司安全。
這些公司在利率上升的環境下,不會突然變成好公司,它們本來就是好公司。但現在是它們相對優勢會顯現的時候。
但更重要的是,你持有的每一個部位,都問自己一個問題:如果利率在這個水位維持一年,這家公司會怎樣?
如果答案是「沒什麼問題」,那就繼續持有。如果答案是「會很辛苦」或「我不確定」,那可能就是該動手的地方。
主題二:Cerebras 狂飆千億市值,但年營收只有 5 億?
2026 年 5 月 14 日,Cerebras在 Nasdaq 首日收盤飆漲 68%,這家公司的市值在一天之內從 560 億美元的發行估值,衝向近千億美元大關。
這是 2026 年迄今為止全球規模最大的科技 IPO,我們一起來看看它招股書(S-1 文件)中揭露的數字:
2025 年營收:5.1 億美元,較前一年增長 76%。
淨利:由虧轉盈,從 2024 年虧損 4.8 億美元,轉為 2025 年實現 2.37 億美元的利潤。
未來訂單(Backlog):高達 246 億美元。
看起來的確不錯,但問題來了:
一家年營收剛跨過 5 億美元門檻的公司,憑什麼能支撐近千億的市值?
那 246 億美元的未來訂單,又是從何而來?答案,藏在這家公司反其道而行的瘋狂哲學裡。
反其道而行的矽谷異類
半導體產業過去五十年的故事,是一個不斷把東西做小的故事。更小的電晶體、更密集的電路、更精密的切割。每一塊晶圓被切成幾百顆小晶片,這是摩爾定律的標準劇本。
然後 Cerebras 出現了,說:我們不切。
這家 2015 年成立的公司做了一件所有人都認為不可能的事:把整塊 300 毫米的矽晶圓,做成一顆晶片。不是比喻,是字面意義上的「一整塊晶圓 = 一顆晶片」。
他們最新的 WSE-3 有將近 4 兆個電晶體,是 NVIDIA Blackwell B200 的 19 倍,90 萬個 AI 專用運算核心,44GB 的晶片內建記憶體,面積是 NVIDIA H100 的 57 倍。
要理解這有多瘋狂,你得先理解為什麼這麼做。
為什麼大就是好?記憶體頻寬的戰爭
大型語言模型的問題不只是運算不夠快,而是資料搬運不夠快。
模型的參數存在記憶體裡,每次運算都要把資料從記憶體搬到運算核心,算完再搬回去。這個來回的速度,就是記憶體頻寬。
傳統 GPU 的做法是:晶片很快,但記憶體在晶片外面。資料要透過匯流排傳輸,這條路就是瓶頸。
你可以想像成一個超級快的廚師,但食材放在隔壁大樓的倉庫,每做一道菜都要跑一趟。
Cerebras 的解法是:把倉庫搬進廚房。44GB 的 SRAM 直接做在晶片上,跟運算核心緊緊貼在一起。資料不用出門,頻寬問題直接消失。
這就是為什麼他們在推論(inference)上特別強。生成式 AI 的推論是一個 token 一個 token 地吐出來,每吐一個字都要讀取模型參數。記憶體頻寬越大,吐字就越快。Cerebras 在這件事上,有結構性的優勢。
貨運列車 vs 法拉利
市場上另一個專攻推論加速的玩家是 Groq。2025 年 12 月,NVIDIA 用大約 200 億美元把它收購了。不是完整的收購,而是技術授權加上核心團隊的收編,包括創辦人 Jonathan Ross。
Cerebras 和 Groq 解決的是同一個問題:讓大型語言模型的推論變快。但他們的路徑完全不同。
Groq 的 LPU(Language Processing Unit)走的是「極致低延遲」路線。它讓單一使用者的體驗感覺瞬間回應,打一個字,答案馬上出來。對於寫程式的 AI 助手、即時翻譯這類應用,那種「秒回」的感覺很重要。
Cerebras 走的是「極致吞吐量」路線。它不是讓一個人感覺快,而是讓一萬個人同時用的時候,總輸出量最大化。在多數基準測試上,Cerebras 的總吞吐量是 Groq 的三到六倍。
Groq 是法拉利,直線加速無敵,讓駕駛感覺飛快。Cerebras 是貨運列車,單趟可能沒那麼刺激,但它一次能拉的貨量大得多。
選擇 Cerebras 的場景是,你需要最大化生成速度,特別是長輸出或高吞吐量的工作;你在跑大型或前沿模型;你需要更高精度、更好的推理品質;你想在同一套硬體上同時做訓練和推論。
選擇 Groq 的場景是,你要最靈敏的對話體驗,最低的延遲;你重視開發者體驗和成熟的 API;你需要極度可預測的效能表現。
Groq 讓複雜任務「感覺瞬間完成」,Cerebras 讓複雜任務「實際上更快完成」。而且因為速度優勢,模型可以在相同時間內執行更多推理步驟,這對 agent 工作流程特別重要。
如果你是一家大銀行,要跑 24 小時的客服機器人,同時處理幾千個對話,你要的是列車。如果你是獨立開發者,要一個打字時秒回的程式碼助手,你可能更喜歡法拉利。
這個差異很重要,因為它解釋了為什麼 Cerebras 的估值是 Groq 被收購價格的將近三倍:企業級應用大多是高併發場景,而高併發場景需要的是吞吐量,不是單一延遲。
當然,在 Nvidia 將 Groq 併入公司中之後,我們也可以期待一下他們會如何將整個體驗再向上提升。
「推論翻轉」——AI 產業正在經歷的地殼變動
要理解 Cerebras 的機會,你得先理解 AI 產業正在經歷的一個結構性轉變。
過去幾年,所有人都在談 AI 訓練。訓練 GPT 花了多少錢?用了多少顆 GPU?算了多久?這些是頭條新聞。
但訓練是一次性成本,推論才是持續性成本。
2026 年初,產業界迎來了所謂的「推論翻轉」,全球在運行 AI 模型上的累計支出正式超過訓練。推論現在佔全球 AI 算力支出的三分之二。
而 AI agent 正在讓這個問題變得更加嚴峻。
單一聊天機器人的 API 呼叫可能花費 0.001 美元。但一個多步驟的 agent,規劃、檢索上下文、調用工具、反思輸出、自我修正,每次任務完成可能花費 0.10 到 1.00 美元。這是 100 倍到 1000 倍的乘數。
當你只是聊天時,幾秒鐘的延遲是可以接受的。微軟或 OpenAI 的 AI agent 試圖解決一個需要在背景中進行二十步「思考」的複雜問題時,這需要標準硬體難以高效提供的速度水平。
這正是 Cerebras 的機會所在:專門為推論優化的硬體,在推論成本爆炸性增長的時代。
OpenAI 的超級大單
理解了推論的重要性,你就能理解為什麼 OpenAI 簽下了這筆合約。
2025 年底到 2026 年初,Cerebras 拿下了他們最大的單一合約:到 2028 年,高達 750 百萬瓦(megawatts)的 AI 算力容量。估計價值超過 100 到 200 億美元。而且還有一個選項:到 2030 年可以擴展到將近 3 吉瓦(gigawatts)的額外容量。
但這只是開始。就在 IPO 前夕,OpenAI 進一步擴大了這段關係:總投入超過 200 億美元,附帶認股權證,可讓 OpenAI 逐步獲得 Cerebras 約 10–11% 的股權。。
OpenAI 不只是在買算力。它正在買進提供算力的公司本身。
這跟 Apple 自研晶片的邏輯類似:當你是全球最大的 AI 模型營運商之一,你不會想讓核心基礎設施完全掌握在別人手中。
更有趣的是,在 Elon Musk 與 OpenAI 訴訟案中曝光的內部郵件顯示,2017 年 OpenAI 就曾考慮與 Cerebras 合併,認為這家晶片公司可能有助於追求通用人工智慧(AGI)。九年後,這段關係終於以另一種形式落地了。
進入 AWS——從邊緣玩家變成主流基礎設施
Cerebras 過去有一個讓投資人擔心的問題:客戶太集中。很大一部分營收來自阿聯酋的 G42 和 MBZUAI。這讓它看起來像是「主權 AI」的專家,而不是全球性的基礎設施供應商。
2024 年 9 月,Cerebras 第一次申請上市,但招股書受到嚴格審查,主要就是因為這個客戶集中度問題。申請被擱置了超過一年。
2026 年 3 月,故事改變了。AWS 開始在自己的資料中心部署 Cerebras 系統,預計 2026 年中會透過 Amazon Bedrock 對外開放。
這是一個很大的轉變。
過去,你想用 Cerebras,要自己買整套系統、自己管理、自己維運。現在,任何已經在用 AWS 的公司,都可以直接透過 Bedrock 使用 Cerebras 驅動的高速推論,就像用其他 AWS 服務一樣。
更重要的是,AWS 和 Cerebras 發展出了一種「分拆式推論」的混合架構:AWS 的 Trainium 晶片負責「預填充」階段,處理使用者的提示詞,這部分是高度平行、運算密集的工作。
Cerebras 的 WSE-3 負責「解碼」階段,一個一個 token 地生成輸出,這部分是記憶體頻寬密集的工作。
這讓 Cerebras 從一個需要特殊採購流程的小眾硬體,變成了 AWS 生態系的一部分。對企業客戶來說,摩擦力大幅降低。對 Cerebras 來說,客戶集中度的敘事被解決了一部份。
說了這麼多好處,但這裡有一個問題:如果大晶片這麼好,為什麼過去五十年沒人做?
主題三:一個「不可能」的晶圓級運算,如何化為現實?
五十多年來,晶圓級晶片被視為半導體產業的不可能。1980 年代,一家叫 Trilogy Systems 的公司曾經嘗試過,燒掉了大量資金後以失敗告終。
問題很簡單:在矽晶圓上只要有一個微小的灰塵或瑕疵,晶片就可能壞掉。
傳統作法是將一片晶圓切割成數百個獨立的小晶片(die)。壞掉一塊就丟掉,剩下的良品則根據性能高低進行「良率分箱」(binning),分門別類地出售。
這就像從一籃蘋果中挑出壞果,剩下的依然能賣個好價錢。這是半導體產業數十年來的基本經濟模型。
但 Cerebras 的路線是「整塊不切」。一片 300mm 的晶圓就是一顆完整的晶片,面積超過 46,000 平方毫米。根據台積電 5nm 製程的缺陷密度估算,這樣一片晶圓上大約會隨機出現 40到 50個製造缺陷。
傳統的良率數學很簡單:這麼大的晶片,有效良率趨近於零。
他們怎麼解決的?
Cerebras 並沒有發明消除缺陷的魔法,他們選擇了另一條路:讓缺陷變得便宜且可忽略。
關鍵在於徹底顛覆的架構設計。傳統 GPU 的一個核心運算單元(如 NVIDIA GPU 的 SM)大約 6 平方毫米,一個缺陷就足以摧毀整塊功能區域。
Cerebras 則將核心縮小到約 0.05 平方毫米,體積縮小了近 100 倍。這意味著,一個缺陷如今只會「殺死」一個微不足道的核心,而非整片晶圓。
下一步,是海量的內建冗餘。
在 WSE-3 晶片上,密布著超過 97 萬個核心,而 Cerebras 保證實際可用的超過 90 萬個。
這就像一間有 100 個座位的教室,卻預先準備了十幾個備用座位。如果某個位置的電路壞了,系統會自動將運算任務切換到備用核心上。
最有趣的部分,是其「智慧片上互連網路」(Smart On-Chip Fabric)。
你可以把它想像成一個內建在晶片上的、具備自我修復能力的交通網路。這套系統能即時偵測到故障核心,立即將其從網路中隔離,然後像 GPS 重新規劃路線一樣,將數據流無縫地繞道至備用路徑,整個過程對上層軟體完全透明。
結果是,良率這個「攔路虎」被徹底解決了。Cerebras 將過去足以判處整片晶圓死刑的製造缺陷,轉化為一個可控的、約 7%的性能開銷。
這正是晶圓級運算從一個「不可能的夢想」,變成擁有真實客戶(如 OpenAI 的 750 MW 超級電腦訂單)和成功 IPO 現實的根本原因。
良率之外的工程挑戰
解決良率只是第一關。巨大的體積還帶來了兩個極端的工程挑戰。
熱膨脹:
晶片運作時會急遽升溫。對於餐盤大小的晶片,邊緣和中心的溫差會造成明顯的物理變形,就像一塊被加熱不均的鐵板會翹曲一樣。
這種應力足以扯斷內部精密的連接點。Cerebras的解法是一整套精密機械工程,他們研發了特殊的封裝材料和「垂直壓緊」技術,確保晶片在劇烈的冷熱循環下依然保持結構穩定和電氣連接。
散熱與供電:
一顆 WSE-3 晶片的功耗高達23 到 25 千瓦(kW)。傳統風扇對此杯水車薪。Cerebras 的伺服器內部不像普通電腦,更像是一台為單一器官打造的精密維生系統。
冷卻液直接流過晶片背面,帶走相當於二十幾台家用電暖器同時運作所產生的熱量。
這些解決方案聽起來或許不夠「性感」,但它們才是Cerebras 真正的護城河。其競爭優勢從來不是「晶片很大」,而是「解決了一個所有人都認為不可能解決的製造與工程問題」。
為什麼 NVIDIA 和其他人不複製?
如果晶圓級真的這麼好,為什麼 NVIDIA、AMD、Intel 不跟進?
答案有幾層。
第一,Chiplet 模式正在大獲成功。當你的現有方案正在印鈔票時,沒有理由冒險換跑道。
第二,軟體生態系統的鎖定效應。 NVIDIA 的 CUDA 是一個龐大的軟體堆疊,幾乎所有 AI 開發者都在上面寫程式。
第三,晶圓級需要極高的前期投入和風險承受能力。
第四,設計假設完全不同。 傳統 GPU 的整個架構都建立在「晶片是小的」這個前提上:記憶體層級、核心佈局、電源管理。你不能簡單地把一個 GPU 設計「放大」成晶圓級。那需要從頭設計,拋棄幾十年的架構假設。
NVIDIA 的 B200 實際上是一個「先進封裝」的產物:將多個 GPU 晶片和 HBM 記憶體透過CoWoS 技術堆疊在一個矽中介層上。整個行業的趨勢是將複雜性推向封裝。
Cerebras 則反其道而行,將所有複雜性推回矽本身,從而避開了 CoWoS 產能受限、HBM供應緊張的產業瓶頸。
單一供應商的風險:台積電依賴
Cerebras的創新之路上,也埋藏著一個投資者無法忽視的巨大風險。
其所有晶片生產都依賴台積電,這並非「選擇最好」的結果,而是「技術鎖定」的必然。從 WSE-1 到 WSE-3,從 16nm 到 5nm,全部由台積電獨家生產。
原因就在於它們的「跨光罩互連」技術,這是 Cerebras 與台積電多年聯合開發的專有製程,深度整合在台積電的特定流程中。三星、英特爾等其他晶圓廠,根本沒有這個現成的能力。
問題在於,台積電的先進製程產能,特別是 5nm,依然嚴重供不應求。其 CEO 魏哲家反覆強調,先進產能「仍然不夠」,缺口可能是 AI客戶總需求的三分之一。
Cerebras 沒有長期供應協議,只能按訂單與 NVIDIA、蘋果、AMD 這些巨頭競爭稀有的晶圓配額。在產能緊張時,小客戶的優先級往往會被降低。
這成為 Cerebras 在試圖履行其數十億美元積壓訂單時,最大的近期執行風險。
好處是,Cerebras 用的是 5nm,不是 NVIDIA 和其他人爭搶最激烈的 3nm/2nm 製程。但 5nm 仍然是受限的。
當Cerebras試圖從 2025 年約 5.1 億美元的營收擴張到履行數十億美元的承諾時,這是最大的近期執行風險之一。
這對台積電意味著什麼?
從台積電的角度來看,Cerebras 這位客戶的生意,是一道有趣的數學題。
一方面,從產能機會成本的角度來看,賣一整片晶圓給 Cerebras 似乎顯得有些奢侈。你想想,一片完整的 300mm 晶圓,最後只變成一個產品。
而同樣一片晶圓如果賣給 NVIDIA,可以切割成數百個小晶片,讓 NVIDIA 根據體質分級包裝、最大化每片晶圓的商業價值。
但從另一方面來看,這筆生意對台積電而言,反而是一筆「結構極度乾淨」、商業變數極少的高毛利訂單。
要理解這點,得先講一下晶圓代工的計價方式。
計價模式:wafer base 與 die base
晶圓代工歷來有兩種主要計價方式:
Wafer base(按片計價):不論晶圓上最後有幾顆良品 die,整片就是一個價錢。客戶承擔良率風險。
Die base(按良品晶片計價):只算良品 die 的顆數,30% 良率就只付 30% 的錢。晶圓廠承擔良率風險。
實務上,成熟製程、高良率節點通常採 wafer base;而先進製程剛導入時、或大客戶議價能力強時,會傾向 die base、混合計價,或在合約裡塞進各種良率連動條款。
換句話說,「良率」從來不只是技術問題,它更是一個會被反覆放上談判桌的商業變數。
在傳統大晶片的世界裡,這個變數的份量極重。晶片面積越大,致命缺陷打中它的機率就呈指數型上升,也就是所謂的「面積殺手」效應。
如果一家公司想打造餐盤大的單一晶片,幾顆隨機塵埃落下,整片晶圓的良品數可能就掉到個位數。這時不論用哪種計價,雙方都得在合約裡費盡心思去分攤這個風險。
而Cerebras 的「晶片內置容錯機制」,從根本上拆掉了這個變數。
他們在設計裡預留了大量備用核心(redundancy),出廠時透過軟體自動繞過瑕疵點。每一片晶圓——不論上面有多少微小的隨機缺陷——對 Cerebras 而言都是「功能完整、規格達標」的成品。
這帶來一個有趣的結果:「良率」這個變數,從台積電與 Cerebras 的談判桌上變得不再重要。
它迫使代工廠的經濟思維,從過去優化「每片晶圓能切出多少晶片、良率怎麼分攤」,轉向思考「每片晶圓能創造多少個系統價值」。
如果「晶圓級系統」的設計繼續保持小眾,台積電可以把它當作一個有利可圖、商業條件極乾淨的特殊高階訂單。
但隨著這種模式展現潛力,台積電甚至已經順勢推出了專屬的 TSMC-SoW(System-on-Wafer,晶圓級系統)平台來全力支援。
Cerebras 的成功對台積電來說,就像一個活生生的實驗,用來回答一個關鍵問題:
「當良率不再是談判變數時,把整片晶圓當作一個產品來賣,到底能帶來多高的技術溢價?」
先進封裝的「反向思考」
這裡有一個關於晶片設計的有趣故事,能幫助我們理解 AI硬體的不同流派。
現代的 AI GPU,本質上已經是一個極其複雜的「三明治」。你把兩塊 GPU 小晶片(Chiplet)放在一片矽中介層(Interposer)上,周圍再環繞 8 到 12 疊高頻寬記憶體(HBM)。
整個系統的性能瓶頸、成本和良率挑戰,都集中在如何把這個三明治完美地「疊」起來。這就是所謂的先進封裝(如 CoWoS)。
整個行業都在朝著同一個方向狂奔:將複雜性推向封裝,用越來越複雜的堆疊技術,把越來越多的小晶片黏在一起。
問題是,CoWoS的產能,和HBM正正就是現在最大的瓶頸。 Cerebras 的做法恰恰相反。
他們說:「我直接烤一個巨大的麵包!」
它們將所有功能都整合在同一塊晶片上,將記憶體也放在晶片上。
當然,烤這麼大一個麵包,本身就是一件極度困難的事。Cerebras 只是把一種痛苦,換成了另一種自己更擅長解決的痛苦。
他們避開了「把小零件精準疊起來」的痛苦,卻迎來了另一個物理極限的挑戰:
這塊「大麵包」是個超級吃電獸,功耗高達23,000 瓦,像個小暖爐一樣燙。你不能把它放在普通盤子上,盤子會融化。
而巨大的晶片在極熱和極冷之間切換時,會像餅乾一樣熱脹冷縮,一不小心就會裂開。
為了解決這個問題,台積電為它量身打造了InFO-SoW 封裝技術。這個托盤自帶冷卻水管 and 垂直供電網路,像一個精密的維生系統,才能讓這塊巨型麵包穩定工作。
Cerebras向世界證明了:通往更高性能的路徑,並非只有「更多小晶片 + 更複雜封裝」這一條。
當頻寬和延遲成為最重要的性能指標時,回歸單片整合(Monolithic Integration),打造一塊巨大而智慧的晶片,是一種不被主流供應鏈卡脖子的流派選擇。
然後,我們下一個問題自然就會是,這對Nvidia和記憶體廠會有影響嗎?
主題四:Cerebras 能撼動 NVIDIA 的王座嗎?能改變記憶體生態嗎?
當我們理解了 Cerebras 如何將「不可能的晶圓級運算」化為現實後,下一個更深層次的問題自然浮現:
這種「把倉庫蓋進廚房」的瘋狂設計,究竟會對 NVIDIA 主導的 GPU 帝國,以及背後的三星、SK 海力士等記憶體巨頭,帶來什麼樣的衝擊?
記憶體頻寬的本質差異
讓我們再次複習一下 AI 晶片為什麼這麼需要「記憶體頻寬」。
想像一下,AI 模型就像一位需要查閱大量資料才能回答問題的超級學者。
HBM的做法,就像把這位學者的所有參考書(模型參數)放在一個位於城市另一端的大型圖書館 (HBM)。
這個圖書館非常大,能裝下 288GB 的書,但每次學者需要查資料,都得派人開車去圖書館拿回來。
這趟路程就是瓶頸,限制了學者回答問題的速度。這趟路的最高時速,就是所謂的 8 TB/s 頻寬。
Cerebras 的作法則是SRAM記憶體。
他們說:「為什麼要蓋圖書館?我們直接在學者的書桌旁,打造一個巨大無比、伸手可及的智慧書架 (SRAM) 吧!」
這個書架雖然只能放 44GB 的書,看起來比圖書館小很多,但學者只要一伸手就能拿到任何一本書,幾乎沒有延遲。
這個「伸手」的速度,就是 21 PB/s 的頻寬。
現在,讓我們比較一下速度:8 TB/s vs 21 PB/s。Cerebras的記憶體頻寬大約是 NVIDIA 的 2,600 倍。
這個速度的差別,已經是「開車去拿 vs 伸手就拿」的本質差異。
HBM的金飯碗會被打破嗎?
對三星、SK 海力士、美光這三大記憶體巨頭來說,末日要到來了嗎?
過去幾年,HBM 記憶體是他們的明星商品,因為 NVIDIA 的 AI 晶片對它需求若渴,導致供不應求,價格水漲船高。
現在,Cerebras 和 Groq 這種「書架蓋在書桌旁」的設計出現了。它們的核心觀點是:對於日常的問答工作(推論),把記憶體直接做在晶片上,遠比從外部的圖書館搬書更有效率。
這是否意味著 HBM 的好日子要到頭了?
答案是:沒那麼簡單。
在 AI 模型最初的「學習階段」(訓練),以及處理那些大到連 Cerebras 的書架都塞不下的超大型模型時,你仍然需要那個巨大的外部圖書館 (HBM)。
即使是 Cerebras,也需要外部的 DRAM 記憶體池。晶片上的 44GB SRAM 只是作為「超快速的工作區」,而不是取代所有記憶體需求。
但在部份的「問答工作」(推論)上,特別是模型可以塞進 SRAM 的情況,SRAM 架構確實可以減少對 HBM 的依賴。
因此,AI 記憶體市場上將會劃出一道分水嶺:
訓練和超大模型:繼續依賴 HBM 這個「大型圖書館」。
高效率問答:可以使用 SRAM 架構這種「智慧書架」。
對記憶體廠商的風險在於:如果越來越多的客戶選擇「智慧書架」來處理日常問答,那麼 HBM 需求中利潤最高的那一塊市場就會被削弱。
不過短期內,HBM依然嚴重缺貨,所以 Cerebras 更像是一個「需求洩壓閥」,讓某些推論部署能在 HBM 配額受限的情況下繼續進行,而不是立即的威脅。
記憶體廠商的戰略選擇
Cerebras 的成功向三大記憶體供應商發出了兩個信號。
長期來看,AI 領域存在一個可信的細分市場,在那裡「更多晶片內 SRAM」比「更多 HBM 堆疊」更有效。這意味著,記憶體廠商不應該只是做HBM,而應該考慮與 SRAM 密集型加速器共同開發,或提供緊密共設計的記憶體子系統。
短期來看,HBM 在訓練和超長上下文模型中的角色是穩固的。但未來的推論優化產品可能會使用更小的 HBM 配置來達到同樣的 Token 吞吐量,這會改變需求的彈性。
記憶體大廠可以與 SRAM 密集型新創合作,開發混合架構。比如用較小的 HBM 存儲「冷權重」,用大型 SRAM 處理「熱工作集」,同時利用兩者的優勢。
為什麼 Cerebras 註定只能是利基玩家?
說到這裡,一個自然的問題浮現:如果 Cerebras 的技術這麼厲害,它會取代 NVIDIA 成為主流嗎?
答案是不會。
第一道關卡:系統級成本難以攤薄
NVIDIA 的 Chiplet 系統就像用標準化的樂高積木來蓋房子。你可以用同樣的積木蓋小房子或大城堡,增加一個房間的成本相對較低,因為你只是在增加更多的標準積木。
電源、散熱、機架這些基礎設施可以被許多小晶片共享,規模越大,單位成本越低。
Cerebras 的晶圓級系統則像用一塊巨大、完整、客製化的大理石來蓋房子。每一棟房子就是一塊大理石。
這意味著每一棟房子都需要自己專屬的重型起重機(供電系統)、特製的冷卻水管(散熱系統)和獨一無二的地基(封裝)。
關鍵問題在於:這些昂貴的「基礎設施」成本很難被分攤。部署的每個額外系統仍需要自己的完整重型電源硬體、客製化液冷基礎設施和專業封裝。
這些成本是按系統計算的,無法輕易地在多個單位之間共享。
結果是,即使你購買數百個系統,高系統級成本也不會顯著攤薄。
第二道關卡:TCO 只在特定場景勝出
總擁有成本(TCO)不只看硬體價格,還包括電費、散熱、維護等一切開銷。
Cerebras 更便宜的情況是「速度就是金錢」的時候。例如,需要即時回應的 AI 助理、高頻交易、複雜推理任務。
在這些場景下,Cerebras 用驚人的速度換來的價值,遠超過其高昂的系統成本。數據顯示,在特定模型上,它的 TCO 能比 NVIDIA 低近30%。
但傳統 GPU 更便宜的情況是通用、靈活的任務。如果你需要一個能應對各種不同工作的平台,並且希望輕鬆擴展,那麼 NVIDIA 的「樂高積木」模式因其靈活性和更低的基礎設施門檻而勝出。
大多數企業的 AI 工作負載是混合的:有些需要極致速度,有些需要靈活性。在這種情況下,他們會選擇能兼顧兩者的平台,而不是為了某一類任務買一套專用系統。
第三道關卡:NVIDIA 的生態系統護城河
這是最難跨越的一道牆。
NVIDIA 最大的王牌不是硬體,而是 CUDA 軟體平台。全世界的 AI 開發者都習慣了在 NVIDIA 的「道路系統」上開車。
幾乎所有的 AI 框架、函式庫、工具鏈都針對 CUDA 優化。企業裡的工程師們熟悉它、信任它、依賴它。
換到 Cerebras 意味著什麼?重新學習、重新測試、重新驗證。對於追求穩定的企業來說,這是巨大的隱性成本和風險。
這就像一座城市的所有道路都是為左駕車設計的。即使有人發明了一輛性能驚人的右駕車,大多數人還是會選擇繼續開左駕車,因為整個基礎設施都是為它而建的。
NVIDIA 會如何反擊?
理解了 Cerebras 的結構性限制,我們就能理解為什麼 NVIDIA 有充足的時間和空間來應對。他們有三種主要的策略。
第一,把自己的優勢做到極致。繼續擴建那個「大型圖書館」,讓它更大、拿書的路更寬。Blackwell 路線圖已經從 192GB 升級到 288GB 的 HBM3E,最終會走向 HBM4。更大、更整合的機架級系統如 NVL72 和 Vera Rubin 也在路上。
第二,採納對手的策略。NVIDIA 也在考慮「在學者書桌旁蓋個小書架」。他們收購Groq,也是為了做出類似的 SRAM 加速器,並將其整合為 GPU 的「推論副駕」。
第三,利用無可匹敵的生態系統。他們可以透過優化 CUDA、TensorRT-LLM等軟體,讓自己的平台跑得更有效率,在一定程度上模擬出對手的優勢,而無需立即改變硬體設計。
Cerebras 的出現,侵蝕的不是 NVIDIA 的市佔率,而是挑戰「只有 GPU 才能引領 AI 效能」這個假設。但假設被挑戰和市場被顛覆之間,還有很長的路要走。
Cerebras 真正改變的是什麼?
Cerebras 的真正影響力,不在於它賣了多少套系統,而在於它改變了人們對「可能性」的認知。
它證明了「烤一整塊大麵包」的晶圓級設計,不只是實驗室裡的瘋狂想法,而是可以商業化量產的產品。
它告訴世界,晶片的物理尺寸限制,可以透過聰明的設計來克服。
它改變了競爭的賽道:現在,NVIDIA 不僅要回答「你的晶片有多快」,更要回答「在耗電相同的情況下,你的系統每秒能吐出多少個字?」
未來的 AI 硬體版圖
未來十年,AI 硬體市場不會是「GPU vs 其他所有人」的單極世界,而會更像一個組合。
GPU 會繼續主導需要靈活性的訓練和大部分通用任務,如同功能全面的 SUV。
SRAM 密集型加速器如 Cerebras、Groq、SambaNova 則會在追求極致效率和速度的「推論」市場佔據重要份額,如同專為賽道而生的 F1 賽車。
從這個意義上說,Cerebras 不是一個挑戰者,而是一個「探路先鋒」。它為之後的 AI 硬體發展,開闘了一條全新的、以記憶體和功耗效率為核心的道路。
即使它的長期市場份額停留在個位數,它的架構賭注已經在重塑半導體產業如何思考整合的極限、HBM 的角色,以及 AI 運算的經濟學。
主題五:新雲霸主CoreWeave 與 Nebius為何財報後走勢大不相同?
同樣是「新雲端」AI 基礎建設的當紅炸子雞,同樣在五月中旬交出超越預期的營收財報,市場卻給了 CoreWeave 與 Nebius 截然相反的反應:一個股價重挫,一個飆升。
這背後的關鍵,不僅在於規模與預期的差異,更深刻地揭示了在當前市場環境下,投資人如何權衡「成長潛力」與「獲利確定性」,而這一切,都藏在兩個關鍵的利潤率數字裡。
CoreWeave的困境:1%營業利潤率是短期陣痛還是長期趨勢?
本季最讓市場失望的,莫過於CoreWeave的營業利潤率 (Adjusted Operating Margin) 從去年同期的17%和上季的6%,斷崖式下跌至僅剩1%。
管理層將此歸因於「時間差,而非經濟因素」。財務長 Nitin Agrawal 解釋,新產能的快速擴張,導致成本(租賃、電力、折舊)在裝機期間立即產生,而收入卻需要 1 至 3 個月才能完全體現。他明確表示:
「第一季是我們利潤率的谷底。」
然而,市場的疑慮並非空穴來風,因為公司給出的第二季財測,恰恰印證了這段陣痛期的漫長與艱難:
• 營收指引不及預期: Q2 營收預測中值約 25.3 億美元,低於市場普遍預期的 26.9 億美元。
• 利潤指引嚴重失色: Q2 營業利潤預測僅為 3000 萬至 9000 萬美元,遠低於市場期待的 1.54 億美元。
這意味著即使達到指引高標,利潤率也僅回升至約 3.7%,證實了 Q2 只是「觸底」,而非「強力反彈」。
這份疲弱的財測,疊加在僅 1% 的當季利潤率之上,讓投資人對其下半年的執行力打上巨大問號。
要達到全年 7-9% 的營業利潤率目標,意味著約 70-80% 的利潤必須在下半年實現。
核心問題在於,CoreWeave 坐擁近千億美元的驚人積壓訂單 (Backlog),但市場始終有保留,它能否順利地將這些訂單轉化為實質利潤。
Nebius 避開了同樣的問題嗎?
相比之下,Nebius 則像一個「效率玩家」,在某程度上避開了這場利潤風暴。
關鍵差異在於「利用率」和「預售」。Nebius 連續多個季度產能售罄,管理層自豪地表示:
「我們建的一切都賣出去了」
這種「先接單、後擴產」的模式,確保了新設備一上線便能立刻產生收入,完美對齊了成本與回報,避免了產能閒置對利潤的侵蝕。
因此,儘管 Nebius 的 AI 業務 EBITDA 利潤率 (45%) 略低於 CoreWeave,但它能將大部分現金流高效地轉化為實質的營業利潤,向市場證明了其商業模式的健康與高效。
當然,Nebius 並非完全免疫,管理層也預告了未來季度可能出現類似的利潤波動。但因為其產能高度預售、財務槓桿較低,市場相信其面臨的挑戰將「痛苦更小、持續更短」。
市場對這兩種情況的解讀完全不同。
對於 CoreWeave:「成長很好,但利潤率什麼時候改善?」
對於 Nebius:「超高速成長加上獲利路徑確認。」
EBITDA vs. 營業利益率
要理解市場為何對這兩家公司做出天壤之別的判斷,關鍵在於看懂兩個核心財務指標:EBITDA利潤率與營業利益率。它們共同揭示了一家公司真實的獲利光景與潛在的財務壓力。
在本季財報中,其實CoreWeave 的 EBITDA 利潤率(56%)其實遠高於 Nebius 的 AI 業務 (45%)。
這代表 CoreWeave 的「單位經濟效益 (Unit Economics)」極其出色。每提供 100 元的算力服務,扣除電費、網路和基本維護後,能產生 56 元的毛現金流。
這證明其技術、定價或客戶結構非常強健。
然而另一面卻是,CoreWeave 的營業利益率僅有 1%。
這代表著這 56 元的現金流還沒在口袋裡捂熱,就幾乎全數被拿去扣掉兩大開銷:龐大設備的「折舊費用」和舉債擴張的「利息支出」。
扣掉之後,真正屬於公司的營業利潤,竟然只剩下 1 元。
為何兩個數字的差距如此巨大? 這個從 56% 到 1% 的巨大落差,正是市場不安的根源。
我們可以將兩家公司的擴張策略想像成兩種不同的開店模式:
CoreWeave就如同一次在全世界開了 1000 家直營旗艦店,採購了數萬台最頂級、最昂貴的設備 (GPU)。
這些設備一落地,無論是否已開始滿載賺錢,會計上就必須開始計算龐大的折舊。
由於擴張速度太快,許多新場館還在裝機或等待客戶進駐,但全公司的折舊費用已如海嘯般襲來。
為了支撐這種史詩級的擴張,CoreWeave 承擔了巨額債務,導致利息支出極為沉重。
結果是,雖然單一服務的毛利極高 (EBITDA 56%),但利潤幾乎被「養設備」和「還利息」的成本完全吞噬。
相反,Nebius策略是奉行「店還沒開,訂單就已滿」的原則。
設備一進場就幾乎立刻滿載運作,成本與收入完美對齊,避免了產能閒置的拖累。 他們保持相對輕盈的擴張步伐,使其無需背負如 CoreWeave 般沉重的債務與利息。
雖然單一服務的毛利略低 (EBITDA 45%),但因為折舊和利息控制得宜,能將大部分現金流高效地轉化為實質的營業利潤。
潛力 vs. 現實,誰更誘人?
這份財報再次告訴我們,這兩家公司的風格完全不一樣。
• CoreWeave 代表「高槓桿、高風險、高潛力」的規模化路線。
• Nebius 代表「高效率、低風險、穩健成長」的精準化路線。
此刻,市場的選擇非常明確:在充滿不確定性的環境中,「能穩穩將現金放進口袋」的務實能力,遠比一個關於未來的宏大敘事更令人安心。
Nebius 在「將生意轉化為利潤」這項關鍵能力上,暫時取得了領先。
然而,這並不意味著 CoreWeave 的故事已經失敗。
恰恰相反,如果 CoreWeave 能夠挺過當前的利潤陣痛,完美執行其擴張計畫,讓數萬片頂級 GPU 全面運轉起來,其 56% 的超高 EBITDA 利潤率所帶來的規模效應和潛在回報,將是 Nebius 難以比擬的。一旦成功,CoreWeave的潛力會比Nebius高。
最終,在 AI 算力這個極度燒錢的行業,EBITDA 決定了「潛力天花板」,而營業利益則守住了「生存地板」。
市場對 Nebius 的青睞,是對當下確定性的獎勵;而對 CoreWeave 的質疑,則是對其宏大野心能否兌現的考驗。
下一個問題,就要看CoreWeave 能否證明,它的執行力配得上它的夢想。
謝謝你閱讀到這裡,如果你覺得這份筆記為你帶來了價值,請不吝按下一個讚,這是我持續分享的最大動力。
我在Facebook和Threads都有每天發佈當天對市場的觀察,大家也可以考慮追蹤我的社交媒體。
另外我在Telegram有頻道,每天早上我會發當天重要新聞摘要。
同時,如果想開戶的話,可以考慮用我的富途/口袋證券獨家推薦碼,會有更多優惠。
全部資訊在以下鏈結:
另外,如果你已經加入付費會員,不要浪費了群組的功能,進入我們Substack的Chat功能一起討論市場!
· KP








兩個大主題都把複雜故事清楚講解,又有insight,閱讀開啟一個好周末
記得以前wafer計價方式有兩種,wafer base & die base。良率低時用die base,30%良率就算30%的顆數。高良率用wafer base,也就是一片wafer不管90% or 95%,都是同一個價錢。現在計價方式改變了嗎?