今年要加息了?記憶體需求減半?AI PC時代到來? - KP思考筆記(第45期)
大家好,我是 KP,歡迎來到第 45 期的《週末思考筆記》。
星期五,市場風雲突變,基本上呈現了全線下挫的態勢。這種下跌是典型的「Beta 式下跌」,高 Beta 的標的跌幅深一些,低 Beta 的則相對抗跌。
這種「無差別下跌」顯然是由宏觀因素驅動的。由於非農就業數據異常強勁,市場情緒迅速轉向,開始對年底可能發生的「加息」進行定價。
提到加息,最近期的肯定是慘烈的 2022 年。
但我們要明白,2022 年之所以是災難性的,是因為加息的幅度與持續時間都超出了預期。
這裡我們需要做一個邏輯拆解:
如果你判斷這將是另一場漫長且劇烈的加息週期,那麼 2022 年的教訓就是最好的教科書。
但如果你認為這可能只是一次性的微調,甚至根本不會發生,那麼下一個問題就是:
你覺得市場會怎麼想?而你打算如何反應?
在市場處於超買區間這麼長一段時間後,任何風吹草動都可能引發劇烈的短期回撤,很多資金都在尋找一個合理原因獲利了結。如果要我猜的話,進一步下探尋找支撐的機會確實不小。
這時候,投資者最常面臨的抉擇就是:到底要不要「擇時(Timing the market)」?還是選擇「硬扛」?
「擇時」聽起來很美好,如果你精準逃頂,確實能避開跌幅。但現實是,「何時重新進場」往往比「何時離場」更難。
如果你判斷錯誤,市場只是經歷了一個極短暫的小回撤就迅速 V 轉,你很可能會陷入更痛苦的 FOMO(恐懼錯過)情緒中,最終被迫在高位追回來。
事實上,波動(Volatility)是每一位權益投資者必須支付的「入場券」。
這是投資股票的本質,你不可能在拒絕接受 10% 甚至更多回撤的同時,卻期待獲得 50% 甚至 100% 的回報。
如果你持倉相對集中,那麼過去兩個月你應該斬獲頗豐,現在的回調不過是將部分利潤「還給」市場。這很正常,無需恐慌,關鍵是決定下一步怎麼走。
關於下一步,你必須先釐清自己的「投資身分」:你是一個交易者(Trader),還是一個投資者(Investor)?
如果你是交易者,你的核心是趨勢、動能與止損。當宏觀邏輯改變、技術面破位時,嚴格執行紀律、保護本金是你的首要任務。
但如果你定義自己為投資者,那麼現在正是你進行「深度體檢」的最佳時機。你必須認真重新審視你的部位:
集中度: 你的心臟是否能承受目前集中度帶來的淨值波動?
信念感: 你對這家公司的信心,是來自於它上漲的股價,還是來自於你對它業務競爭力的理解?
估值與安全邊際: 在利率可能更高、環境更嚴峻的假設下,現在的股價是否依然具備吸引力?
因果邏輯: 你是否真的清楚它過去為什麼漲,現在又為什麼跌?
對於我自己的部位,我暫時的選擇是硬扛,但收縮戰線,將資金從「衛星標的」撤出,轉而加碼到「高信念」的核心標的上。(這不是投資建議,之後可能也會根據情況調整哈哈)
之所以有底氣留在場內,是因為我的核心持倉大多擁有足夠的獲利緩衝,且我確保手中沒有槓桿,而我對每一個持倉都十分清楚背後投資邏輯。
在動盪時期,留在場內(Stay in the market)是為了不遺漏長期的複利,但留在哪些標的裡,決定了你是否能睡得好覺。
只要你的公司基本面依然強勁,且你的財務結構是健康的,那麼短期的股價回撤不過是帳面上的數字跳動。
當然,那些預言家又紛紛現身了。你會聽到很多聲音說:「看吧,我就說會跌。」
但事實是,即便經歷了這波回撤,許多股票的價格也只是回到了大約兩三週前的水準。除非你能在過去幾天精準地預測到頂部並全身而退,否則這些「事後諸葛」式的預言,對於真正的財富增長並沒有實質幫助。
投資是一場關於「勝率」與「賠率」的遊戲,更是一場關於「心理韌性」的考驗。
FOMO研究院的Substack Chat每天有很多高質的交流,在不確定的時刻,尤其歡迎大家一起來參與討論。
在宏觀不確定的情況下,倒不如繼續花時間思考基本面。這個星期的思考筆記將會有5個主題,包括:
主題一:當 Windows 遇上 CUDA,AI PC 如何權力重組?
主題二:當 AI 走向「代理人」時代,Intel 如何用 CPU 奪回系統調度權?
主題三:從回購王變成融資王,Google 為什麼突然募資 850 億美元?
主題四:拒絕賺快錢,從 Build 2026 看微軟的策略
主題五:Nvidia 對記憶體需求減半?
不妨考慮先讚後看,我們立刻進入主題!
主題一:當 Windows 遇上 CUDA, AI PC 如何權力重組?
黃仁勳在 Computex 台北正式揭曉了 RTX Spark 平台(搭載 N1/N1X 晶片)。Dell、Lenovo、ASUS、MSI、HP,甚至傳聞中的 Surface 都會在今年秋天到 2027 年初推出搭載這顆晶片的筆電。
大家可能會想,發佈看起來很強,但這對 NVIDIA 未來幾季財報有什麼貢獻?
答案是:幾乎沒有。
N1/N1X 的筆電要到今年秋天才會上市,初期出貨量小、定價高、目標客群窄。如果你期待這顆晶片在 2026 或 2027 年的財報上看到爆炸性的收入貢獻,你會失望的。
但這個發佈真正的意義,是 PC 產業的「時代分水嶺」可能正在發生。
微軟與 NVIDIA 的共生博弈
在過去,PC 產業的規則非常簡單。微軟定義作業系統,Intel 與 AMD 提供晶片,NVIDIA 則是強大的配件。但進入 AI 時代,這個行之有年的邊界開始模糊。
微軟執行長 Satya Nadella 公開宣示要把無限制的智慧帶到每個家庭與每張桌面,黃仁勳則強調雙方深度的技術整合。兩家公司聯合喊出「PC 的新時代」,從 Prism 模擬器的優化、異質架構的調度,到專為 AI Agent 設計的全新 Windows 安全機制,微軟正在為 NVIDIA 的硬體量身雕琢作業系統。
這是一場雙方在戰略上高度互補、彼此需要的雙向奔赴。
微軟非常需要 NVIDIA。微軟對未來 PC 的終極願景是 Agentic AI,讓每台電腦都能在本地端流暢運行自主的 AI 代理。
高通的 Snapdragon X 雖然證明了 Windows on Arm 的可行性與省電優勢,但在面對真正吃重、需要極高算力與記憶體頻寬的本地端大模型時,高通的 GPU 與生態依然顯得力不從心。
為了對抗 Apple Silicon 的強勢威脅,微軟急需一個在硬體與軟體生態上都能一拳定音的盟友。
與此同時,Apple 已經用 M 系列晶片搭配統一記憶體與 macOS,建立了一個讓微軟羨慕的整合典範。蘋果用戶在自己的 MacBook 上跑大型語言模型已是日常,微軟如果不能在 Windows 陣營端出對應的方案,它在 AI PC 這個品類的話語權將會被結構性侵蝕。
反過來,NVIDIA 同樣深切地需要微軟。
如果 NVIDIA 不跟微軟合作,它在消費端幾乎沒有其他具備規模的舞台。macOS 是蘋果的禁地,不允許第三方晶片;Linux 雖然技術上可行,但消費端桌面市佔常年低於百分之五,若只在 Linux 上推 N1X,這顆晶片只會變成資料科學家的小眾玩具;至於 ChromeOS 與 Android,則完全不適合 NVIDIA 鎖定的高階 AI、創作與遊戲市場。
NVIDIA 想把 CUDA 從資料中心延伸到客戶端,Windows 是唯一能提供足夠規模的舞台。沒有微軟的配合,這顆晶片在大眾市場將失去影響力。
CUDA 的生態滲透
在這場看似雙贏的合作背後,產業的權力天平有可能會被悄悄重組。
微軟依然是作業系統的所有者,定義著安全模型、API 與開發者規則。但是,當 CUDA 成為 Windows on Arm 上 AI 工作負載的事實標準時,未來幾年 Windows 上的 AI 創新,將會越來越深地綁定在 NVIDIA 的軟體棧上。
當所有的 AI 開發者都在 CUDA 上寫程式,所有的 AI 應用都在 TensorRT 上做推論優化,所有的開源模型都優先支援 NVIDIA GPU 時,微軟未來的轉換成本就會變得極高。
如果 Agentic AI 真的變成 PC 的主要互動介面,用戶不再頻繁點開個別軟體,變成了與一個 AI Agent 對話,那麼傳統作業系統體驗的能見度有可能會下降。
作業系統可能會變成 AI Agent 的底層基礎設施,而不再是用戶感知的主體。在這個情境下,作業系統是什麼牌子變得不再那麼關鍵,跑在上面的 AI Agent 用的是誰的算力與模型反而變得更重要。
這就是 NVIDIA 真正在玩的長線遊戲。
它不是要取代 Windows,是要在 Windows 之上,建立一個由 CUDA 定義的 AI 計算層。
微軟依然是房東,但 NVIDIA 變成了所有租客都必須打交道的水電公司。
雖然 AMD 的 Strix Halo 已在 unified memory 與 iGPU 性能上展現實力,但其軟體生態與開發者習慣仍與 NVIDIA 有明顯差距。
這與 NVIDIA 在資料中心的策略本質上是一樣的,它從不取代雲端業者,但所有雲端業者要做 AI 都繞不開它。現在,它想在 PC 端複製這個模式。
協同設計時代的開端
傳統的 PC 模式是鬆散模組化的。Intel 與 AMD 做 CPU,NVIDIA 做 GPU,微軟做作業系統,大家相對獨立地演化,靠標準介面拼湊起來。這個模式在 PC 的成熟期非常有效率,任何一塊都可以被單獨替換與升級。
但這個模式在 AI 時代正在失效。
AI 工作負載對整個系統協同運作的要求遠高於傳統工作。記憶體頻寬、延遲與容量必須跟 GPU 算力匹配;作業系統排程器要懂得怎麼分配 AI 工作給 CPU、GPU 與 NPU;安全模型要重新設計,因為 Agent 是會自主執行的;電源管理也要懂得 AI 工作負載的爆發特性。
這些事情都需要硬體、作業系統與軟體棧一起設計才能做好。鬆散模組化的結果,往往是每個元件單獨看都不錯,加起來體驗卻不盡人意。
蘋果靠垂直整合解決這個問題已經做了許多年。Windows 陣營過去一直無法走這條路,因為微軟必須照顧多個硬體夥伴。
但現在 NVIDIA、微軟與聯發科的組合,提供了一個有趣的折衷方案。
接下來幾年,我們應該會看到 Qualcomm 與微軟、AMD 與微軟、Intel 與微軟也會出現類似深度的協同設計關係,每個組合針對不同的市場區隔。鬆散模組化的時代不會完全結束,但高階 AI PC 這個品類,會明顯地走向更緊密的協同設計。
鬆散模組化的時代不會完全結束,但高階 AI PC 這個品類,會明顯地走向更緊密的協同設計。
這對整個 PC 供應鏈的意義很深遠。過去 OEM 廠商只要會組裝就能賣機器,未來能不能提供真正好的 AI PC 體驗,會越來越取決於它跟晶片商、作業系統商的整合深度。有能力做深度客製化的廠商會受益,純組裝廠的價值則會被進一步壓縮。
128GB 統一記憶體的現實與未來
除了軟體生態的角力,RTX Spark 採用的統一記憶體架構也是一項結構性變革,最高支援達 128GB 的 LPDDR5X。
這在技術上是一次巨大的飛躍,但也伴隨著極高的物理挑戰。為了讓 CPU、GPU 與 NPU 共享超高頻寬與極低延遲,記憶體顆粒必須極度靠近 SoC。
這意味著傳統插槽式記憶體在高端 AI PC 上將不復存在,取而代之的是極其複雜的封裝技術。當容量拉高到 64GB 甚至 128GB 時,散熱、訊號完整性與良率控制的難度呈指數級上升。
這無疑為高階、高密度的 LPDDR5X 乃至未來的 LPDDR6 市場注入了強心針。對於在先進封裝與高密度記憶體領先的廠商如三星與 SK 海力士而言,這是一個長期的結構性藍海。
但我們必須保持理性,這不會在一夜之間改變記憶體市場的供需與價格。
在 2026 到 2027 年的初期階段,搭載 128GB 統一記憶體的旗艦級 AI 筆電,售價極可能突破兩千美元。這注定是一個屬於極客、專業開發者與創作者的小眾高階市場,出貨量在短期內難以與主流 PC 相比。
因此,當前的記憶體價格循環依然由資料中心的 HBM 需求主導。RTX Spark 對記憶體產業的實質營收貢獻,更像是一顆埋在 2027、2028 年之後的種子,當這種架構逐漸下放到主流價位帶時,才會迎來真正的爆發。
營收的「雜音」,生態的「強音」
退一步從商業現實來看,我們必須理解一個事實:在當前的 AI 狂潮中,消費級 PC 的市場規模,在 NVIDIA 龐大的資料中心版圖面前,不過是滄海一粟。
今天推動 NVIDIA 股價與千億美元營收的,是資料中心裡成千上萬顆、單價數萬美元的 Hopper 與 Blackwell 晶片。
相比之下,筆電晶片的客單價與利潤率根本不在同一個量級。這也是為什麼,RTX Spark 平台在短期內絕對無法成為左右 NVIDIA 財報的關鍵因子。
那麼,我們為什麼還要高度關注這件事?
因為這是一場關於「防禦」與「延伸」的長線佈局。
資料中心的算力是「集中式」的,它解決的是大模型的訓練與雲端大規模推論;但 AI 的終極形態,必然會走向「分佈式」的邊緣端(Edge)。
如果 NVIDIA 只守在雲端,那麼當未來的 AI 應用逐漸向終端轉移、當輕量化模型(SLM)在個人裝置上就能流暢運行時,NVIDIA 就有可能失去對終端生態的控制權。
PC是Nvidia將 CUDA 生態系「實體化」到每個人桌面上的特洛伊木馬。
這是一個需要慢火細熬、甚至需要數年時間去觀察的指標。我們不該用「這季賣了幾顆晶片」來衡量 RTX Spark 的成功,我們要觀察的是:
開發者是否開始習慣在 Windows 筆電上,直接調用本地端的 TensorRT 進行日常開發?
微軟的 Copilot 與各類 AI Agent,是否在搭載 NVIDIA 晶片的系統上運行得最為流暢?
這種「軟硬一體」的體驗,是否逐漸拉開與傳統 x86 筆電的差距,進而重塑消費者的購買決策?
NVIDIA 與微軟在 PC 上的聯手,更像是在為五年、甚至十年後的運算生態買一張「保險票」。
它現在不負責賺大錢,但它負責確保在未來的某一天,當雲端算力向終端分流時,NVIDIA 依然是那個唯一的遊戲規則制定者。
主題二:當 AI 走向「代理人」時代,Intel 如何用 CPU 奪回系統調度權?
在 Computex 2026,NVIDIA 的 RTX Spark 搶走了大部分頭條。
但Intel 想告訴市場的是:隨著 AI 從簡單的「單次問答(Single-turn Q&A)」進化到複雜的「多代理人協作(Agentic AI)」,CPU 正在重新奪回系統的核心主導權。
這不僅僅是關於 18A 先進製程量產、設計定案(Tape-out)超過 300 個、或是 Xeon 6+(Clearwater Forest)與新一代 Core Ultra 的硬體發表;這是一場關於 AI 系統架構的重新定義。
「編排層」的論述
過去幾年,在 GPU 主導的生成式 AI 時代,CPU 常常被邊緣化為一個「即插即用(Plug-and-Play)」的通用組件,彷彿只要負責把數據「餵」給 GPU,它的任務就完成了。
但 Intel 正在打破這個膚淺的定位。
傳統的聊天機器人,其瓶頸在於高密度的矩陣運算,這確實是 GPU 的天下。然而,當企業開始部署 Agentic AI(代理人系統)時,運算邏輯發生了根本性的轉變。
一個能夠自主完成複雜任務的 AI Agent,必須經歷「目標拆解 → 制定計畫→ 呼叫外部工具與 API→ 跨系統擷取上下文→ 在多次互動中維持狀態 → → 處理錯誤恢復與分支邏輯」的繁複過程。
這些任務本質上並非矩陣乘法,其高度依賴分支邏輯判斷、記憶體管理、狀態維護與任務調度。
在一個 agentic 系統裡,你需要一個「大腦」來協調 GPU、記憶體、網路和分散式推論之間的工作。這個大腦最適合由 CPU 來扮演。特別是 Xeon。
Perplexity 的動態調度學
為了讓這個論述更具體,Intel 把 Perplexity 的 CEO Aravind Srinivas 請上台做了一個現場示範。
Perplexity 展示了其「Perplexity Computer」作業系統,在處理敏感的企業槓桿收購(LBO)財務模型時,系統如何進行動態調度:
本地處理(隱私與速度):敏感的財務數據與初步分析,直接在搭載 Intel Core Ultra 3 的本地裝置上運行,確保數據不出關。它自動標記出哪些內容是敏感的、需要保持隱私,然後把這些保留在設備上。
雲端協同(深度推理):當遇到需要極大參數模型進行深度邏輯推理的步驟時,調度器會自動將去隱私化的任務發送至雲端。
這種「端雲協同」的架構,打破了過去「全面上雲」或「純端側運行」的極端二分法。Intel 的晶片(端側的 Core Ultra 與伺服器端的 Xeon)正是為了這種動態路由設計的。這不僅大幅降低了企業調用昂貴雲端 GPU 的成本,更在物理層面解決了數據合規與隱私的痛點。
Intel 與 SambaNova 的「解耦式推理」
如果說 Perplexity 展示的是端與雲的協同,那麼 Intel 與 SambaNova 的深度合作,則是對資料中心異質運算(Heterogeneous Computing)的實踐。
在雙方展示的「Vector Core Compute」企業推理雲與機櫃級(Rack-scale)系統中,Xeon 處理器展現了其獨特價值。這套系統呈現了高度的解耦(Disaggregated)特徵:
Xeon 6+(18A) 擔任主機與調度大腦,負責工作負載調度、加速器之間的數據移動、網路與記憶體協調,以及全局系統編排。
SambaNova SN-50 RDU 負責推理中高頻率的「解碼(Decode)」階段。
甚至在部分環節中,還能協同 NVIDIA Blackwell GPU 處理「預填充(Prefill)」階段。
Intel 不再強求客戶在每一個環節都使用 Intel 的晶片。相反地,他們承認異質運算(混合使用不同晶片)才是未來的常態。
Intel 的戰略是:「不論你用誰的加速器(SambaNova 或是 NVIDIA),你都需要一個最優秀的協調者來把這些硬體完美縫合在一起。而 Xeon 就是那個最完美的黏著劑。」
18A 節點落地與 x86 的防禦反擊
Intel 表示,現在有多個產品(客戶端的 Core Ultra Series 3 和伺服器端的 Xeon 6+)正在 18A 上出貨或 ramp up。設計定案數超過 300 個。良率在改善中。
如果 18A 真的如他們所說的那樣成功,這對整個「編排層」敘事是很大的加分。因為這意味著 Intel 可以在自己的先進製程上製造高效能、低功耗的 CPU,而不是依賴外部代工。
但這也是一個大「如果」。市場見過太多 Intel 的 roadmap 在執行中出問題。現在的態度基本上是「先看到持續交付再說」。
同時,面對 NVIDIA 積極推動 Arm 架構(如 Grace 處理器)進入資料中心與客戶端,Intel 選擇用 x86 的生態積澱進行回擊。
他們的定位是,數十年來優化的企業級程式碼、編譯器與安全協議,在 x86 架構上運作最為穩定。在導入 AI Agent 時,它必須與企業既有的資料庫、ERP、安全性協議深度整合。這正是 Intel Xeon 展現「系統指揮官」價值的舞台。
紙上談兵終覺淺,市場數據定乾坤
Computex 2026 雖然為我們描繪了兩種截然不同的未來藍圖,但它並無法為「x86 與 Arm 誰才是 AI 時代的終極解答」給出標準答案。
NVIDIA 的 Arm 路線:試圖證明透過高度整合的 Arm CPU 與 GPU,能打破傳統架構的記憶體瓶頸,實現前所未有的能效比,並藉此徹底顛覆 Windows PC 與資料中心的既有格局。
Intel 的 x86 路線:則極力證明在複雜的「多代理人(Agentic AI)」時代,系統的穩定度、軟體相容性以及 CPU 作為「編排層大腦」的調度能力,才是決定 AI 落地成本與效率的關鍵,而這正是 x86 累積數十年、無法被輕易動搖的護城河。
為什麼我們無法在 Computex 得到答案?
在展會期間,兩家公司所公布的基準測試(Benchmarks)與展示,都是在最有利於自家架構的特定場景下進行的。
NVIDIA 展示的,是跑特定本地 LLM 時,Arm 晶片那令人驚艷的每瓦 Token 輸出率。
Intel 展示的,是面對複雜企業工作流時,x86 系統那行雲流水般的異質硬體調度與相容性。
這些「紙面性能」都非常優秀,但它們都屬於「完美實驗室」裡的產物。
接下來該看什麼?
要判斷這場架構之爭的真正勝負,我們必須將目光移開展會,在接下來的數個季度中,持續監控以下三個核心的後續實質數據:
企業與 OEM 的實際拉貨與出貨量;
軟體生態系的實際相容性與遷移成本:
企業在將現有的 IT 基礎設施、資料庫與安全性軟體遷移到 Arm 架構時,是否遇到了預期之外的阻礙與隱性成本?
x86 陣營在執行新一代 AI Agent 軟體時,是否真的能如 Intel 所說,展現出無縫接軌的調度優勢?
雲端服務商(CSPs)的資本支出與採購比例。
Computex 2026 只是這場馬拉松的起跑槍聲。NVIDIA 證明了 Arm 的無限潛力,Intel 則用 x86 的深厚底蘊來反擊。真正的贏家,將由接下來幾季的出貨報表、企業財報與軟體生態系的真實回饋來決定。
主題三:從回購王變成融資王,Google 為什麼突然募資 850 億美元?
Alphabet 這個星期宣布並完成了一筆高達 847.5 億美元 的歷史性股權融資。
這是什麼概念?它打破了 2010 年巴西石油(Petrobras)創下的 700 億美元 紀錄,成為人類企業歷史上規模最大的單一增資案。
對於這筆天文數字,市場上充斥著各種聲音。
有人質疑:「Google 不是富可敵國、手握大把現金流嗎?為什麼還要跟市場要錢?」甚至有人放大招股書中的細節,質疑這筆錢是用來「幫員工繳稅」而非發展 AI。
一家過去十五年一直在回購自己股票的科技公司,為何要大舉融資?
標題黨的盲點:那筆被誤解的「300 億員工稅金」
首先,我們來釐清一個在社群媒體上被瘋傳的「偽命題」:
「Alphabet 融資是為了幫員工繳稅,而不是為公司發展」。
這完全是只看硬幣一面的斷章取義。這次 847.5 億美元 的融資結構,其實分得很清楚:
約 550 億美元:透過公開發行與巴菲特旗下 Berkshire Hathaway 的私募,這筆錢是鐵打的「AI 基礎建設與算力擴張基金」。
約 400 億美元 的 ATM(市價發行)計劃:其中預計有 300 億美元,確實是用來處理 2026 年員工股權激勵(RSU)歸屬時的稅務問題。
讓我解釋一下這個操作實際上是什麼。
過去,員工股票到期時,公司通常會直接「扣留並賣出」一部分股票來繳稅(Sell-to-cover),員工拿到的股票變少。
現在 Alphabet 改成:股票全額給員工(極大激勵 AI 頂尖人才),稅金由公司用新募集的股權資金支付,從而把公司原本寶貴的「自由現金流(FCF)」完好地保存下來。
事實上,「用自有現金付稅,用融資蓋資料中心」,也可以選擇「用融資付稅,把自有現金省下來蓋資料中心」,這兩者除了字眼上有分別外,實際效果究竟有甚麼不一樣?
Alphabet 2026 年的資本支出(CapEx)指引高達 1,800 億至 1,900 億美元(幾乎是去年的兩倍),根本不是沒有發展。 Alphabet 真正的考驗仍然是大規模資本支出是否能產生回報,而不是這 300 億美元 稅務項目的具體資金來源。
公開市場的速度優勢
這筆歷史性融資,最有趣的地方在於,它展示了「已上市科技巨頭」對比「未上市 AI 新創」在資金獲取速度上的降維打擊。
當前,像 OpenAI、Anthropic 這些明星獨角獸,為了應付龐大的模型訓練與算力成本,同樣在尋求百億美元級別的融資或 IPO 計劃。
然而,未上市公司的融資之路無比漫長,要經歷無數輪的談判、繁瑣的 SEC 審查、路演、估值博弈,動輒耗時數月甚至一年。
反觀 Alphabet:
6 月 1 日:宣布計劃融資 800 億美元。
6 月 2-3 日:因為市場認購太過踴躍,直接超額認購,最終定價 847.5 億美元。
6 月 4-5 日:資金全部交割入帳。
前後僅僅用了不到五天。
這就是身為萬億級上市公司、擁有極致流動性與信用紅利的終極優勢。
當新創公司還在排隊等待 IPO、為估值爭論不休時,Alphabet 已經把 850 億美元 的真金白銀裝進口袋,直接去向 台積電 搶產能、向 NVIDIA 搶晶片、向電力公司搶電網配額了,為 Gemini 提供更多資金發展。
在「天下武功,唯快不破」的 AI 軍備競賽中,這種「光速吸金」的能力,本身就是一道無法逾越的護城河,也是為甚麼其他獨角獸要盡快上市的原因。
股神的背書
這次融資的錨定投資者中,出現了一個熟悉的名字:Berkshire Hathaway,他們直接認購了 100 億美元。
這是繼承班底 Greg Abel 掌舵後的重大決策之一。Abel 公開說過,Berkshire 不會「為了 AI 而做 AI」,必須是增值的。在這裡投入 100 億美元 是一個具體的投票,表明 Alphabet 在 AI 基礎設施上的執行達到了那個標準。
他們願意在 Alphabet 股價並不算便宜的當下,砸下 100 億美元,釋放了一個極其強烈的信號:
即使在最保守、最注重價值投資的巨頭眼中,Alphabet 的 AI 基礎建設投資,估值相對有吸引力,依然具備極高的長期回報率(ROIC)與安全邊際。
這給了市場一顆定心丸,它證明了這場軍備競賽有著扎實商業邏輯支撐的未來基建。
逼迫所有人提前攤牌的「軍備競賽」
這次 850 億美元 的歷史性融資,確實為整個 AI 生態系帶來了顯著的正面效應。當頂級資本願意在此刻為天文數字的資本支出背書時,它實際上是用真金白銀向市場證明:
AI 的商業變現絕非空中樓閣。這不僅給了高喊泡沫化的空頭一記響亮耳光,也為 NVIDIA、台積電 等半導體巨頭,以及電網、核能與冷卻系統等供應鏈,提供了一張極其珍貴的「長期未來訂單保證書」,間接降低了整個板塊的系統性風險。
然而,這也是在迫所有人加速行動。
這筆錢砸下去,意味著 Alphabet 正在用史無前例的資金體量,提前鎖定並壟斷未來幾年最稀缺的晶片與電力資源,極限擠壓其他玩家的生存空間。
更關鍵的是,它正在逼迫所有人以最快速度跟進融資。
2026 年,四大超大規模運算商(Hyperscalers)的集體資本支出指引已來到驚人的 7,250 億美元。在如此恐怖的燒錢速度下,即便是強如亞馬遜、Meta 這樣的巨頭,其自由現金流也面臨被榨乾的壓力,被迫轉向股權融資。
然而,全球資本市場的承接力始終會有上限。當每家巨頭都試圖在市場上募集成百上千億美元時,先動手的 Alphabet 已經拿走了最便宜、最充裕的第一桶金。
那些動作慢、還在猶豫是否要稀釋股權,或是還在為估值爭論不休的競爭對手(包括 OpenAI、Anthropic 等新創),一旦錯過了這個短暫的黃金窗口,未來將不得不面對更挑剔的投資人與更昂貴的融資成本。
我們正處於物理基建的「重工業時代」
站在歷史的節點回看,這筆 850 億美元 的融資,是我們理解當前 AI 週期定位的終極信號。
我們正在見證一個前所未有的、資本極度密集的「重工業階段」。在這個階段,物理世界的基礎建設(算力、電力、資料中心)必須先行,隨後才能迎來軟體層面的全面變現。
公開市場用超額認購的熱情、波克夏用 100 億美元 的錨定、評級機構用正面的信用評估,共同為這個偉大的週期投下了信任票。
這筆融資之所以值得我們每一個人高度關注,是因為它清晰地告訴了我們:這場 AI 之戰,最終將屬於那些能夠在資本市場長袖善舞、高效部署並展現極致執行力的終極玩家。
主題四:拒絕賺快錢,從 Build 2026 看微軟的策略
剛剛落幕的 Microsoft Build 2026,表面上是一場眼花繚亂的「Agent(智能體)大秀」。
如果你只看大會的標題,會看到一堆讓人興奮的新名詞:七個新的 MAI 自研模型、一個叫 Scout 的「自動駕駛」個人工作代理、一台塞了 NVIDIA RTX Spark 晶片的開發者夢幻機器、一個不是 Windows 的全新平台 Solara,以及一顆在量子運算領域取得重大突破的 Majorana 2 晶片。
你可能會問:既然市面上已經有 OpenAI、Anthropic 這些強大的模型,微軟為什麼還要大費周章自己做 MAI 模型?
幾天後,微軟執行長 Satya Nadella 接受了 Stratechery 創辦人 Ben Thompson 的專訪。這場對話,才是我們理解微軟真正在做什麼的關鍵鑰匙。
拒絕「嫉妒型創新」:微軟不做下一個 Zune
專訪中,Thompson 問了一個很多人都想問的問題:在 AI 這場競爭中,微軟到底是領先還是落後?
Nadella 的回答很有意思。他沒有直接給出答案,而是退一步,重新定義了競爭。
「大多數人衡量競爭地位時,彷彿這是一場完全零和的遊戲,但從來都不是這樣。雲端時代不是,當年的用戶端伺服器時代也不是。對我來說,『微軟在這個新世界中能獨特地做什麼』,這才是我們必須先回答的問題。」
接著,他坦誠地說了一句非常清醒的話:「我們最糟的時候,就是因為『嫉妒』而去做某些事。只因為別人做出了很酷的熱門產品,不代表我們就該跟風。」
他甚至主動自嘲了微軟當年的黑歷史 Zune(當年為了對抗 iPod 而推出的播放器):
Zune 是個好裝置,但這世界根本不需要微軟做 Zune。
這番話,其實是 Nadella 在向市場釋放一個明確的訊號:微軟不打算加入「誰的模型最聰明」這場無止境的軍備競賽。
微軟的基因從來就不是做出世界上最強的單一產品,他們的強項是成為一個平台,讓所有人都能在上面創造價值。在 PC 時代是 Windows,在雲端時代是 Azure,而在 Agent 時代,微軟要做的,是企業 AI 生態的作業系統。
企業的終極護城河:專屬的「爬山機」
既然不爭最強模型,那微軟要做什麼?
Nadella 提出了一個非常生動的概念,叫做「爬山」(Hill-climbing)。
「爬山基本上是這樣的:當你想『AI 能做什麼?』,AI 就是拿一個目標,持續學習如何預測和創造代表那個目標的輸出,而且是持續不斷地做。」
「私有輸出、評估,我認為這可能是一家公司創造的最重要的智慧財產權,就是這些私有的基準和評估。在那裡,你有品味地去識別什麼是好的輸出、什麼是高品質。」
這就是微軟對 AI 時代企業競爭優勢的核心判斷:最關鍵的不是你用的基礎模型有多聰明,而是你能不能把公司的隱性知識、專屬資料與工作流程,持續地餵給模型,讓模型在你的業務場景裡不斷「爬山」,變得越來越懂你。
微軟要建的,就是一個讓這台「爬山機」能夠安全、規模化、受治理地運作的平台。
這解釋了 Build 2026 發表的一切
一旦理解了「爬山機」這個框架,Build 2026 那些看似眼花繚亂、各自獨立的產品發表,瞬間就拼成了一幅清晰的拼圖。微軟其實是在為企業打造一整套組裝工具箱:
首先,是 MAI 模型與 Frontier Tuning。
微軟不跟別人拼誰的模型更強,他們給企業一個大小適中、極具成本效益的 MAI 自研模型。
透過 Frontier Tuning,企業可以用自己的專屬資料來訓練它。這就像是讓引擎適應自家門前的山路,用最低的 Token 成本,爬出最好的效果。
其次,是 Microsoft IQ。
Microsoft IQ(包含 Work IQ 和 Web IQ)把原本埋在 Microsoft 365 底下、平常沒人注意的企業內部資料庫挖出來,變成 Agent 可以直接調用的智慧層。
這等於是給了 Agent 一張企業內部的活地圖,讓它知道每項工作的前因後果。
接著,是 Microsoft Scout。
過去的 AI 像是一個等著你發號施令的副駕駛,而 Scout 則是真正的 Autopilot。
它不需要你一直跟它聊天,它會在背景默默運作,主動幫你準備會議、處理費用報告。這正是 Nadella 所說的,AI 從「被動工具」走向「自主工作」的關鍵一步。
再來,是 RTX Spark 開發機與 Solara 平台。
為了讓工程師能在本地順暢地測試這台爬山機,微軟推出了配備強大晶片的 Surface RTX Spark 開發機。
同時,他們也推出了全新的 Solara 平台。這是一個完全不依賴 Windows 的新系統,專為穿戴式裝置或智慧硬體設計。
這展現了微軟的務實,當舊有的 Windows 道路不適合新一代的 Agent 體驗時,微軟寧可直接鋪一條新路,也不硬套舊框架。
最後,是 MXC 沙盒與 Agent 365 SDK。
當 Agent 開始在背景自主幫你開車、處理業務,企業最怕的就是它失控撞車。Microsoft Execution Containers (MXC) 安全沙盒與治理工具,就是為了在系統底層拉起安全防護網,確保 Agent 的一舉一動都在合規且安全的範圍內。
這些發表並不是零散的技術更新,微軟的意圖非常明確:他們要幫企業把安全防護、內部資料、自主代理和底層硬體全部縫合在一起,讓企業能毫無後顧之憂地運作自己的「爬山機」。
從「重壓合作」到「建立選擇權」:微軟與 OpenAI 的關係演變
Nadella 在專訪中對 OpenAI 的態度相當務實。他承認早期與 OpenAI 的合作是微軟在 AI 賽道上快速取得領先地位的關鍵,也坦言「每天 OpenAI 做得好,微軟也做得好」。
雙方合約關係至少持續到 2032 年,微軟仍會是 OpenAI 的重要客戶與基礎設施提供者。
然而,從微軟積極推出 MAI 自研模型、GitHub Copilot 導入多模型選擇(甚至可以用 Claude 來互相檢查),以及在算力分配上展現的紀律來看,微軟正在從「早期重度依賴單一合作夥伴」,轉向「建立重要但非獨占的夥伴關係」。
更關鍵的是,Nadella 清楚表達了微軟在資本配置上的取捨:
「在今天這個時代,如果你想要短期的 Azure 營收,這很容易,你只需要把 GPU 賣給某個投機的 AI 新創(Neolab)就行了。」
他明確表示微軟不會這麼做。原因很簡單:前沿 AI 實驗室最終會建立自己的基礎設施。
與其把寶貴的算力大量押在少數幾個模型公司身上,不如把產能分配給三個更長期的桶子:超大規模雲端服務、微軟自己的應用業務(M365、GitHub、Security),以及自研模型的研究計算。
這背後反映出 Nadella 對未來的判斷:真正的長期價值,不會來自追逐最熱門的模型公司,而是來自那些願意為安全、治理、企業整合,以及持續優化付出代價的客戶。拒絕「容易賺的錢」,正是微軟把算力留給真正能產生長期複利的地方。
商業模式的轉變:當人頭計費失效
然而,這場變革也帶來了一個根本性的商業難題:當 Agent 可以 24 小時在背景不間斷工作時,傳統 SaaS「按人頭計費(Per-Seat)」的模式就失效了。
如果一個自動駕駛的 Agent 能幫五個人完成工作,企業為什麼還要買五個帳號?
微軟給出的解法是「混合定價模式」(基本人頭費 + 彈性算力消耗費)。
這是一場考驗耐心的轉型。對企業客戶來說,這意味著他們會非常精明地計算每一筆 AI 消費的 ROI,這會帶來優化成本的壓力;而對微軟來說,這逼得他們必須把安全沙盒(MXC)、觀測性與治理工具打包成無可取代的套裝服務,讓企業在享受 Agent 便利的同時,不得不為這些底層的安全防禦買單。
仍要時間觀察
微軟在 Build 2026 展現的姿態,反映出一個歷經多個平台週期後,選擇以長期結構性優勢為優先的成熟公司。
它沒有急於證明自己的自研模型在通用能力上超越 GPT 或 Claude,而是把重點放在如何把安全沙盒、企業上下文、治理工具與底層硬體,系統性地結合在一起。
這種做法背後的邏輯,在 Nadella 與 Ben Thompson 的對話中表露得相當清楚:微軟認為,AI 時代企業真正的護城河,來自於能否把自身的隱性知識持續轉化為模型優勢,而非單純依賴最強的基礎模型。
Build 所展示的,正是微軟試圖在這個方向上建立平台級能力的嘗試。
然而,這條路徑仍存在明顯的執行挑戰。Agent 的實際採用速度、企業是否願意為持續運作的 Agent 支付可觀的消費費用,以及這些消費何時能對財報產生實質貢獻,都是市場在接下來幾個季度會密切觀察的重點。
目前 Scout 仍處於 Frontier 客戶小規模驗證階段,混合定價模式的市場接受度也尚未完全明朗。
換句話說,微軟正在為 Agent 時代的長期遊戲規則布局,但這場轉型需要時間驗證。
短期內,市場仍會以 Azure 成長品質、內部應用與研究算力的使用效率,以及早期 Agent 產品的採用跡象,來評估這套策略的進展。
主題五:Nvidia 對記憶體需求減半?
SemiAnalysis 發了一份報告,提到 Nvidia 的 Vera Rubin NVL72 機櫃在出貨時,系統記憶體的配置比原本規劃的少了大約一半。
很快地,市場上就出現了鋪天蓋地的熊市鬼故事:「Nvidia將記憶體需求砍半!」、「記憶體大廠的超級週期要終結了!」
這類點擊率極高的陰謀論,完美展現了什麼叫「去脈絡化的斷章取義」。
不當完美主義者,先通車再說
首先,我們要釐清一個關鍵:被「砍半」的,是 CPU 側的系統記憶體(LPDDR5X),而不是 GPU 側那顆最核心、最昂貴的 HBM4(高頻寬記憶體)。
在 Rubin 晶片上,負責承擔海量矩陣運算、注意力機制等核心算力的 HBM4,規格與需求完全沒有受到任何影響。
那為什麼要動 CPU 側的 LPDDR5X?答案很簡單:供應鏈卡住了,但客戶等不及了。
目前,要達到原先規劃的超高容量,必須使用極高密度的 16 層堆疊 LPDDR5X 模組,而這種模組目前的良率與產能極其受限。
如果 Nvidia 堅持「規格不攻頂不出貨」,那 Rubin 的量產時程勢必會被嚴重拖累。
於是,黃仁勳做了一個非常務實的商業決策:
降規加速出貨:改用產能成熟的 96 GB 模組,避開供應鏈瓶頸,讓 Rubin 機架能以最快速度送進微軟、Meta 等雲端巨頭(Hyperscalers)的資料中心。
幫客戶省錢(降低 TCO):這一降規,直接讓每台機架的成本暴省了 80 萬美元(從約 760 萬美元 降至 680 萬美元)。
保留升級後路:Blackwell 世代(如 GB300 Ultra)使用的是直接銲死在主機板上的 LPDDR 記憶體;但 Vera Rubin 平台改用了插槽式(Socketed)的 SOCAMM2 模組設計。
這種「熱插拔、可現場更換」的設計,意味著 96GB 只是供應鏈極限下的「過渡性配置」。如果客戶未來真的有極致需求,且高密度模組產能跟上了,隨時可以像插拔電腦記憶體一樣,在機房裡直接升級。
很明顯,這根本不是 Nvidia 覺得不需要這麼多記憶體了,只不過是一個工程上的妥協。
這根本不是需求下滑,只不過是一個「先上車、後補票」的彈性策略。
記憶體階層的演進
系統記憶體配置降低,反而可能加速另一個趨勢:把更多工作負載推向儲存層。
在即將到來的 Agent(智能體)與長文本(Long-Context)時代,AI 不再只是回答一個問題就結束,而是要進行多輪對話、調用工具、協同運作。這會產生天文數字般的 KV 快取(KV Cache)。
這些暫存資料如果全部塞在最貴、最稀缺的 GPU HBM 裡,成本會高到不合理;但如果全部丟到傳統硬碟,速度又慢到讓人無法忍受。
於是,AI 工廠正在演進出類似傳統電腦 CPU 快取(L1/L2/L3)的「三階層記憶體架構」:
熱層(Hot Tier)— HBM4:速度最快、最貴。只用來處理最核心的即時運算。
溫層(Warm Tier)— LPDDR5X(SOCAMM):速度中等、具備高頻寬與 CPU 一致性。用來暫存「準備要用」的 KV Cache 與 Agent 調度狀態。
冷層 / 容量層(Cold/Capacity Tier)— 高性能 SSD 與 AI 原生儲存:容量極大、成本最低。用來存放長期的對話記憶與歷史資料。
當系統記憶體配置降低,這個三層架構的價值反而更明顯。軟體需要更聰明地管理資料在不同層級之間的流動,而 Nvidia 的全端控制(從晶片到軟體堆疊)讓他們有能力做這種最佳化。
對記憶體產業的實際影響
從這個變化,我們可以再嘗試往下推兩個結論。
儲存層(SSD / NAND Flash)變得更重要
當 CPU 側的 LPDDR5X 容量降低,系統為了維持整體流暢度,勢必會更積極地把「半熱」(Warm)狀態的 KV Cache 與 Agent 上下文,透過軟體堆疊(Nvidia Dynamo、BlueField-4、NIXL 等)更頻繁地調動到高性能儲存層。
對記憶體大廠來說,這意味著原本「配角」的 NAND Flash 業務,在 Agent 時代反而成為不可或缺的戰略拼圖。Samsung、SK hynix、Micron 同時擁有 DRAM 與 NAND 事業的廠商,在這個演進中反而具備更完整的 exposure。
機架變便宜,出貨量暴增(總量效應大於單機減少)
每台機架省下 80 萬美元,加上出貨速度變快,會刺激雲端巨頭下單更多數量的 Rubin 機架。
從數學邏輯來看,全球 LPDDR5X 的總產能目前就這麼多。Nvidia 將單機配置減半,意味著原本只能組裝 100 台機櫃的記憶體,現在可以分給 200 台機櫃使用,讓整體 Rubin 平台以雙倍速度鋪開。
對記憶體大廠來說,產能依然是滿載被消耗掉的,總體位元(Total Bits)需求根本沒有縮水。
相反地,每一台多賣出去的機架,裡面搭載的 HBM4 可是一點都沒少。更別提未來產能緩解後,客戶回頭採購 192GB 模組進行二次升級的「售後拉貨潮」。
標題之外
SemiAnalysis 的創辦人 Dylan Patel 在社群媒體上的回應很直接:「有件事我一直覺得有趣,分享我們報告的人經常漏掉大部分內容。」
事實上,複雜的供應鏈分析,在傳播過程中幾乎必然會被簡化。簡化本身不是壞事,但當簡化變成扭曲,當「Nvidia 為了加速出貨而調整系統記憶體配置」變成「記憶體需求腰斬」,訊息的本質就完全走樣了。
這次的 SOCAMM 故事是個縮影。相比起記憶體需求的崩潰,這更是 AI 基礎建設正在走向一個更成熟、更分層、更軟體定義的記憶體架構。
在這個架構裡,熱資料、溫資料、冷資料有各自適合的載體,而整體的矽需求和儲存需求會隨著 AI 部署的規模持續上升。
記憶體超級週期的邏輯沒有改變。瓶頸會在不同層級之間移動,但總需求的方向是清楚的。
下次看到「XX 需求腰斬」這種標題時,或許可以先問一句:腰斬的是哪一層?為什麼?這對其他層級有什麼影響?答案通常比標題有趣得多。
商周專欄解禁版(付費會員專享)
謝謝你閱讀到這裡,如果你覺得這份筆記為你帶來了價值,請不吝按下一個讚,這是我持續分享的最大動力。
我在Facebook和Threads都有每天發佈當天對市場的觀察,大家也可以考慮追蹤我的社交媒體。
另外我在Telegram有頻道,每天早上我會發當天重要新聞摘要。
同時,如果想開戶的話,可以考慮用我的富途/口袋證券獨家推薦碼,會有更多優惠。
全部資訊在以下鏈結:
另外,如果你已經加入付費會員,不要浪費了群組的功能,進入我們Substack的Chat功能一起討論市場!
· KP









獲益良多謝謝 FOMO🙏👍👍👍