Meta算力過剩了嗎?加息機率下降?Palantir大駡大模型? - KP思考筆記(第49期)
大家好,我是 KP,歡迎來到第 49 期的《週末思考筆記》。
就在上週,我才在筆記的前言中提到,現在的半導體與雲端巨頭,關係就像是坐在同一個蹺蹺板上。半導體的基本面固然強勁,但巨頭們絕對有能力、也有手段去尋求突圍。
沒想到才過幾天,Meta 就為我們做了一次現場示範。
這幾天市場的焦點全在 Meta 身上。事實上,當前的半導體盛世,很大程度上取決於這些雲端巨頭的資本支出(Capex)。
只要他們繼續大手筆「買單」,派對就能持續;一旦增速放緩,整條價值鏈的風向就會劇烈轉變。
有些人將這次的市場回調稱為「鬼故事」。但在我看來,所謂鬼故事,通常是指那些事實上站不住腳、純屬恐嚇的傳聞,例如 SemiAnalysis 最近那幾篇,被不少只看了標題的人過份解讀,這些對我來說才是「鬼故事」。
然而這一次,我認為情況並非如此。
Meta 這次在雲端建設規劃上並沒有提供太多具體細節,這留下了極大的解讀空間。
雖然我個人傾向於認為 Meta 會持續投入,但那些解讀「Meta 可能放緩支出」的人,其擔憂也並非完全沒有根據。
在投資的世界裡,當「確定性」出現裂縫時,資金選擇去槓桿、避險或獲利了結,都是極其合理的反應。
作為投資者,我們必須學會區分兩種下跌:一種是基於假新聞或情緒化恐慌的「非理性重挫」,另一種則是基於邏輯推演與風險溢價調整的「合理修正」。對我而言,這一次的波動屬於後者。
至於 Meta 是否真的會減少支出?目前沒有人有標準答案,我們只能等待更多細節出爐。
這也是為什麼我一直強調「動態配置」的原因。當半導體處於「進攻矛」的巔峰時,任何關於需求端的風吹草動都會被放大。這不代表半導體不好了,而是代表它的「容錯率」變低了。
在這種階段,與其去猜測 Meta 下一季的 Capex 數字,不如回頭檢視你的組合:你是否過度暴露在「單一假設」之下?如果 Meta ,甚至其他巨頭真的放緩支出,你的組合是否有足夠的韌性去應對這種「合理修正」?
在 AI 這場長線賽局中,我們不需要每次都猜對頂部,但我們必須確保在市場重新校準預期時,我們依然留在場內。
在開始正題之前,想和大家分享一件事。
過去這段時間,感謝大家對「FOMO 研究院」的支持。接下來,我開始思考要將這裡再一步升級,希望從一人項目,變成一個小團隊。
坦白說,這個項目還在非常早期的籌備階段。我目前沒有固定的職缺框架、不確定需要全職還是兼職、也還在摸索最有效率的工作流。
但我相信「人才是因事而聚的」。如果你對產業有極大熱情、對市場嗅覺敏銳、是 AI 工具的重度使用者,且渴望參與一個從零到一的投研項目,我想邀請你填寫這份表單。
我不會說這是招聘,這更多是一次「互相認識的機會」:
告訴我你最擅長什麼(無論是追蹤趨勢、數據建模、AI 寫作、還是視覺排版等等,甚麼都可以),能夠提供甚麼技能。
告訴我你期望的合作模式與待遇。
如果有合適的契機,我會親自聯絡你聊聊(但請諒解,我無法保證聯絡所有人)。
以下是Google form連結:
https://docs.google.com/forms/d/e/1FAIpQLSfxHHVZCJR7I9EKBQJxQ8m0krtBDhSChitIB5N_z4SOnsIgBQ/viewform
這個星期有四個主題想和大家分享:
主題一:Meta 真的是算力太多了嗎?
主題二:Meta做雲,對三大雲和Neoclouds分別影響如何?
主題三:數據不夠,算法來湊?PCE迎來改革,將通脹壓低?
主題四:Palantir CEO Alex Karp 為何大駡大模型公司?
不妨考慮先讚後看,我們立刻進入主題!
主題一:Meta 真的是算力太多了嗎?
如果你回看過去半年 Zuckerberg 說過的話、Meta 的財務壓力、以及整個 AI 基礎設施市場的脈絡裡,你會發現這事早有預謀。
可以這樣想像,這是一家公司在史上最大規模的資本支出週期裡,幫自己買了一份保險。
1400 億美元的「瘋狂」與「選擇權」
2026 年,Meta 的資本支出(Capex)預算被推升到了令人咂舌的 1250 億至 1450 億美元。這相當於 Meta 每天就要花掉近 3.8 億美元 在建造數據中心、採購晶片和鋪設電網上。
面對華爾街對其自由現金流(FCF)和短期投資回報率(ROI)的排山倒海質疑,祖克柏 在 2026 年 5 月的股東大會上,拋出了一個核心詞:「選擇權(Optionality)」。
他說到,Meta 之所以敢如此激進地超前部署,正是因為他們擁有一個「安全閥」。如果內部暫時用不完,隨時可以租給別人:
「我們還沒這樣做,是因為我們認為自己用得上這些運算能力。但如果某個時候我們覺得蓋太多了,那這(出租)就是一個選項,而這也是讓我們有信心繼續投資建設的部分原因。」
「幾乎每個星期,都有不同的外部公司跑來找我們,希望我們能提供 API 服務,或者問我們能不能把算力以高於我們採購價的溢價賣給他們。」
在 AI 基礎設施建設中,最怕的就是出現「閒置資產」。當 Meta 擁有將過剩算力隨時變現的能力時,其龐大 Capex 的下行風險就被顯著對沖了。
既然有空置,為何不先換成現金流?
Meta 會有這樣的戰略轉變,很大可能上是受到了 xAI 的啟發。
既然目前的算力利用率在特定週期內沒有達到 100%,與其讓昂貴的 GPU 在機房裡空轉折舊,不如先拿出來租給市場換取實實在在的現金流。
這對 Meta 的財務與戰略意味著三個最直接的好處:
資本支出的風險管理與融資優勢
Meta 花了上千億美元蓋的基礎設施,如果全部只能自己用,回報就完全取決於內部 AI 產品的成功,這是一個極大的單點風險。
如果有一部分可以賣給外部客戶,這些資產就從純粹的成本中心變成了可能產生營收的資產,固定成本也能被分攤。
更重要的是,穩定的算力租賃收入能直接改善營運現金流,讓 Meta 在未來發行債券或進行融資時,在資本市場上爭取到更具優勢的利率。
營收多元化
Meta 九成以上的收入來自廣告。廣告是週期性的,經濟不好企業就會縮減預算。
而雲端算力服務的收入模式不一樣,通常是用量計費或長期合約,更可預測、更穩定。即使一開始只是賣多餘的產能,規模也可能隨著時間變大。
參考 AWS:現在年營收超過 900 億美元,是 Amazon 的主要利潤來源之一,營業利潤率超過 30%。
估值敘事重塑
投資人對 Meta 的擔憂之一是:你花這麼多錢在 AI 上,但營收還是靠廣告,我怎麼知道這些投資有回報?
有了雲端業務的選項,故事就變成:我們不只是一家在 AI 上大筆燒錢的廣告公司,我們是一個有多元化營收潛力的 AI 基礎設施玩家。
是不是代表他們的模型不行了?
如果 Meta 的 AI 產品(如 Muse 家族)真的受歡迎,為什麼會有過剩的算力可以賣?這涉及到了 AI 產業一個客觀的技術規律,也就是「訓練」與「推理」的時空錯配。
前沿模型的訓練是爆發性的,需要瞬間調動極其龐大的算力;而推理(即用戶實際使用模型)的需求則是漸進且平滑的。
Meta 在 2026 年第一季推出了由 Meta 超級情報實驗室研發的 Muse 家族(包括 Muse Spark),並正在秘密訓練代號為 “Watermelon“ 的下一代超級模型。
在這些新模型尚未完全融入 Meta 旗下數十億用戶的日常應用(如 Instagram、WhatsApp 的 AI 代理)之前,算力出現短暫的供過於求是合理的現象。
更值得注意的是,就在 2026 年 7 月 2 日,Zuckerberg 在內部 Town hall 中親自承認,過去至少四個月,AI agent 的發展軌跡並未如預期加速。
他表示,高層原本擔心動作不夠快,現在看來「押注的新結構還沒完全兌現」。
這句話直接說明了為什麼 Meta 內部高價值推理需求尚未完全起飛,因為真正能把模型轉化為每天數十億次使用的 agentic 應用,還在成熟過程中。訓練可以超前部署,但推理規模化需要 agent 把模型變成可靠、易用的日常工具,這個轉換比預期更花時間。
但至少目前看來,Meta 並沒有放棄模型研發,他們正在用賣算力賺來的現金流,去養更強大的模型。
那「多餘」這件事,究竟要不要擔心?
當然,有多餘的運算能力可以賣,確實代表 Meta 目前的內部需求還沒有完全消化掉他們蓋出來的產能。
不過我認為,這很大程度上是 Meta 自身戰略節奏造成的,並不代表整個 AI 基礎設施市場已經出現系統性的供過於求。
關鍵差異在於:Meta 過去幾乎是純內部使用算力,而非像 AWS、Azure、Google Cloud 那樣,本來就同時服務大量外部客戶。
Big 3 因為長期經營雲端業務,內部使用與對外銷售的算力配置本來就高度混合,外界本來就難以精準拆解。因此當它們調整內外部配置時,市場較難察覺。
相對而言,Meta 過去幾乎把所有新增算力都留給自己使用。現在突然釋出「願意將過剩算力對外出租」的訊號,這個轉變本身就製造了可見的市場解讀空間。
事實上,目前主流 Neocloud(如 CoreWeave、Nebius)的利用率仍維持在健康水準,這顯示市場的整體需求並未崩壞。
當然,儘管這本質上是 Meta 較為獨特的問題,但因為 Meta 是目前 AI 基礎設施領域中最大的單一買家之一,其任何風吹草動仍會對市場情緒產生放大效果。
一旦市場解讀為「連 Meta 都開始釋出過剩算力」,就容易引發對整個供應鏈(GPU、電源、數據中心)的信心動搖。
真正的考驗在於時間。
如果 Meta 無法在接下來的 12 到 18 個月 內,透過旗下應用程式(Instagram、WhatsApp 等)快速放大用戶的推理需求,或者雲端算力業務的利潤不如預期,那麼這筆巨額投資的回報確實會面臨壓力。
這場 AI 基礎設施競賽,已經從過去單純比拼建造速度的階段,正式進入了考驗算力轉化效率的新局。
HBM DRAM不夠用?NVIDIA 記憶體分層革命? SSD當記憶體? - 深入分析第53期:NAND Flash控制器 (慧榮 SIMO,群聯)
過去大半年,整個 AI 產業都意識到,算力已經不再是唯一的瓶頸。真正卡住所有人、讓運算效率無法提升的,是記憶體。
主題二:Meta做雲,對三大雲和Neoclouds分別影響如何?
Meta 意圖進軍雲端市場,其實實際已經公佈的細節並不多。根據Bloomberg的報導,Meta希望做到兩條收入軌道。
這兩條軌道到底在賣什麼?
要理解這場變革,我們可以先從這兩種服務的運作邏輯看起。
軌道 A:託管模型 API 服務,開箱即用的 AI 資源
託管 API 服務將 AI 模型包裝成一種隨選隨用的公共服務。
以亞馬遜的 AWS Bedrock 為例,當企業或開發團隊想要在產品中加入 AI 聊天、圖像生成或文件摘要功能時,他們不需要自己採購 GPU,也不用架設伺服器,甚至不需要深入了解模型的底層架構。
他們只需要透過 API 發送請求,後台就會自動調用對應的模型(例如 GPT、Claude 等等),並將結果返回給用戶。
付費方式採取用多少付多少的模式,主要以 Token(字詞單位)計費,這與伺服器的開機時間無關。
而Meta 必須負責後端所有複雜的工作,包括伺服器維護、GPU 資源調度、模型自動擴展、資安與合規等。客戶看到的只有一個乾淨的 API 接口。
這個軌道的目標客戶主要是中大型企業內的產品團隊,以及想要快速導入生成式 AI 的傳統產業。他們通常沒有龐大的基礎設施團隊,但希望能低門檻地把 AI 功能整合進現有產品中。
軌道 B:原始算力出租,只租地、不蓋房的裸機服務
相較於 API 服務的便利性,原始算力出租則是另一個極端,它提供的是底層硬體資源。
在這個模式下,Meta 只出租 GPU 實體叢集、超高速網路(例如 InfiniBand)以及儲存設備,不提供任何預先訓練好的模型,也不幫客戶處理軟體層面的工作。
客戶租到的是實體 GPU 叢集(Bare Metal),可以完整掌控從作業系統、容器編排(Kubernetes 或 Slurm)到模型訓練與推理的整個流程。
付費方式通常按照「GPU 數量 × 租用時間」計費。目標客戶主要是大型 AI 實驗室、需要訓練自家基礎模型的科技公司,或對成本與性能有極高要求的 AI 新創。
這條軌道在商業模式上,與 CoreWeave、Nebius、Crusoe 等新興算力提供商(Neoclouds)比較相近。
軌道 A 的挑戰:在別人的主場打硬仗
Meta 若推出託管模型 API 服務,意在讓企業透過 API 直接調用 Muse Spark 或 Llama 系列模型。這條路徑在理論上具備高毛利與高黏性的特點,但實際執行難度極高。
Meta 將面對 AWS、Azure 與 Google Cloud 長年累積的生態優勢。企業客戶通常已將數據、向量資料庫與應用系統建置在三大雲平台上,直接在其原有環境中調用模型,是成本與合規風險最低的選擇。
此外,Meta 缺乏完整的企業級基礎設施生態,難以提供同等程度的資料庫、安全、身份管理與微調工具整合。
企業決策者對 Meta 的品牌認知仍停留在消費級社群與廣告領域,要讓他們把核心商業數據託管給 Meta,存在明顯的信任障礙。
更重要的是,近期 Zuckerberg 承認 AI agent 進度落後預期,這也讓 Track A 在短期內面臨更嚴峻的需求環境。因為真正高價值的 agentic API 使用場景,還需要更成熟的技術與用戶習慣支撐。
最後,Meta 的銷售與服務體系主要服務廣告業務,缺乏大規模 B2B 企業雲端服務所需的直銷團隊、長期談判能力與複雜售後支持。
因此,我不認為 Meta 會有能力在 API 服務戰場上取得太多市佔。
軌道 B 的優勢:Meta 資源的自然延伸
相較之下,直接出租 GPU 算力集群對 Meta 而言是更自然的選擇。這條路徑不需要 Meta 建立完整的企業級軟體平台,只需將現有資料中心資源對外開放。
Meta 已在 Prometheus 與 Hyperion 等大型資料中心累積數吉瓦規模的營運經驗,具備建置與維護高性能 GPU 集群的能力。這種重資產營運模式與其內部需求高度一致,無需額外發展新能力。
xAI 將 Colossus 集群部分容量租給 Anthropic 的案例,顯示在當前算力需求強勁的環境下,只要規模足夠且價格具競爭力,即可吸引大型買家。這為 Meta 提供了可參考的執行路徑。
更重要的是,這是 Meta 對巨額資本支出的直接對沖機制。當自有模型訓練進入相對穩定階段,或 MTIA 晶片出現暫時性富餘產能時,將其出租可有效提升整體投資報酬率,降低資本支出(Capex)帶來的財務壓力。
對 Neoclouds 的影響:最直接的挑戰者,但非終局
Meta 進入原始算力租賃市場,受到挑戰最直接的無疑是 Neoclouds。
過去兩年 Neoclouds 的快速成長,很大程度來自於科技巨頭因晶片與資料中心產能不足而產生的外部需求,其中 Meta 本身就是重要買家之一。
隨著 Meta 自建的資料中心陸續投產,其對外部算力的採購需求可能逐步下降,同時開始將部分富餘產能對外出租。
這意味著 Neoclouds 面臨雙重挑戰:一是直接的市場競爭,二是,Meta究竟還會否不斷租用外部算力,這也是一個疑問。
Neoclouds 的防禦壁壘與獨特優勢
儘管面臨巨頭壓境,Neoclouds 並非毫無防禦能力,他們依然保有獨特的競爭優勢:
極致的敏捷性與部署速度:Neoclouds 專注於 GPU 基礎設施,能夠以比傳統巨頭更快的速度部署最新的硬體架構,並提供更靈活的容量調度。
向軟體層與開發者服務延伸:領先的 Neocloud 已經開始擺脫單純的「硬體出租」模式。例如 Nebius 提供包含開發者服務的完整 AI 軟體棧,CoreWeave 則將儲存、網路與專屬調度軟體深度整合,提供比純裸機更高效的訓練環境。
靈活的資源共享機制:許多 Neocloud 創新地推出了 fractional GPU(分段 GPU 租賃)、動態成本協商與輕量化虛擬機(thin VMs),這些精細化運營是超大型廠商在初期難以兼顧的。
Meta 的加入,證明了原始算力市場的經濟效益與龐大需求,這對整個產業是一次強力的背書。
然而,Meta 帶來的競爭將迫使 Neoclouds 必須以更快的速度成長。他們必須盡快擺脫單純的「硬體轉租商」角色,加速向 AI 原生軟體服務、模型微調工具與差異化開發者生態轉型。
只有在軟體與服務層面建立起足夠深厚的壁壘,Neoclouds 才能在巨頭倒灌算力的洪流中,守住屬於自己的高價值市場。
AI還是泡沬嗎?資本支出仍值得擔憂嗎?雲端反彈力度最強?-深入分析第44期:Oracle,CoreWeave,Nebius
2024 年,巨頭們(Hyperscalers)的資本支出大約是 2,410 億美元。
主題三:數據不夠,算法來湊?PCE迎來改革,將通脹壓低?
升息,可以說是過去一個月市場一直在擔心的事情。
五月份那份高達 3.4% 的核心 PCE(個人消費支出)物價指數,創下了近半年來的新高,將今年降息的希望完全消滅,令論調變為「今年要升多少次息」。
然而,正當市場籠罩在「通膨黏性」與「繼續升息」的陰影下時,美國經濟分析局(BEA)與勞工統計局(BLS)突然聯手送來了兩份大禮。
PCE 的「統計整容術」
BEA 將調整三個 PCE 組成部分的計算方法:投資組合管理和投資顧問服務、法律服務,以及電腦軟體和配件。
這三個類別有什麼共同點?它們都是難以準確定價的服務項目,而且現有的數據源都存在已知的質量問題。
為什麼要改?因為舊的算法有嚴重的「高估通膨」傾向。BEA 發現,過去這三個領域的數據源存在嚴重的雜訊。具體原因不作詳解,反正大概的原因就是舊方法在這些類別中系統性地高估了價格增長。
這項「微調」的威力有多大?
這項修改將會一路回溯修正到 2021 年的數據。
最直接的影響是:之前那個讓市場擔心的五月份核心 PCE(3.4%),在九月份修正後,預計會直接被「削掉」大約 10 到 20 個基點(bps)。高盛預估會變成 3.2%,摩根大通預估是 3.3%。
這就像是一個學生本來考了不及格,結果學校突然宣布「因為計分標準不合理,決定重新調整權重」,於是學生的分數當場被拉回了及格線以上。
客觀來看,這確實是合理的學術與統計修正,聯準會的研究員早在五月份就發文指出軟體價格被高估了。
但我們也不得不感嘆,這個修正的時機點實在是精妙得令人難以置信。它恰好在通膨顯得最頑固、市場情緒最緊繃的時候出現,剛剛好為通膨敘事卸下了大半的壓力。
就業市場的「誠實豆沙包」
就在 BEA 宣布方法論改變後幾天,六月非農就業報告出爐了。
數字遠低於預期:新增就業 57,000 人,而預期約為 110,000-114,000 人。前月(五月)被大幅向下修訂,從原來的約 172,000 人降至 129,000 人。
失業率為 4.2%,略好於預期的 4.3%。
這是一個明確的不及預期。就業增長從 2026 年早些時候的強勁步伐顯著放緩。
這份數據傳遞了非常清晰的訊號:美國的勞動力市場正在加速冷卻。過去幾個月看起來異常強勁的就業數據,事後證明大半是「虛胖」(被下修了)。
雖然這不至於代表經濟要陷入衰退,但它減低了「經濟過熱、必須繼續升息」的論調。
Kevin Warsh 的平衡姿態
就在就業數據公布的前一天(7 月 1 日),現任聯準會主席Kevin Warsh在歐洲央行的論壇上發表了演說。
他的態度非常有意思。一方面,他維持了鷹派的底線,不斷強調「如果有人以為聯準會能容忍通膨高於 2%,那他們會大失所望」。
但另一方面,他卻表示「通膨風險已經有所下降」,前景自六月 FOMC 會議以來有所改善。
這是一種標準的「數據依賴(Data-dependent)」姿態。而僅僅一天後,他就拿到了這份疲軟的就業報告,以及即將在九月迎來「向下修正」的 PCE 歷史數據。
這兩者結合,基本上宣告了短期內(七月與九月)升息的機率已經微乎其微。
當我們在談論數據時,我們在談論什麼?
這場由「統計修正」與「就業降溫」共同編織的戲碼,給了我們一個非常深刻的啟示:
在金融市場中,我們所信仰的「客觀數據」,本質上也不過是一種「人造的模型」。當溫度計顯示病人發燒時,有時候不是病人真的病重了,而是溫度計的刻度需要校準。
這並不意味著數據是虛假的,而是提醒我們,市場的敘事(Narrative)往往比數據本身更具彈性。
這也就是為什麼,作為成熟的投資人,我們永遠不該輕易被那些驚悚的新聞標題給嚇倒。
標題往往只負責販賣焦慮與情緒,而真正的真相,永遠藏在那些乏人問津的底層細節與邏輯裡。唯有耐下心來,看清背後究竟發生了什麼,你才不會在市場集體的恐慌或亢奮中迷失方向。
當規則改變,歷史就能被重新書寫;當歷史被重新書寫,未來的貨幣決策軌跡也就隨之改變。
我在三個星期前的分析中,明確指出了四月份火爆的就業數據,其實充滿水分。也在後續的分析中,多次提到我的基準情境是按兵不動或最多只加一次做做樣子。
如果想思考整個利率走向的思路,歡迎重溫分析。
主題四:Palantir CEO Alex Karp 為何大駡大模型公司?
幾天前,Palantir CEO Alex Karp 在 CNBC 的 Squawk Box 節目上,開始了一段長達數分鐘的即興演講。
他罵 OpenAI、罵 Anthropic、罵整個矽谷共識,罵到主播都忍不住打斷:「你是不是有點生氣?」
「我不是生氣,我只是在替全美 CEO 說出他們的心聲。」
這聽起來像是一場情緒化的個人攻擊,但如果你只看到情緒,你就完全誤讀了這場演出。
先看他到底在賣什麼
要理解這場「暴走」,你得先看懂 Karp 想推的東西:Sovereign AI(主權 AI)。
就在幾天前,Palantir 與 Nvidia 剛剛升級了他們的合作案,核心產品是一套用 Nvidia 開源權重模型(Nemotron)打造的企業級 AI 引擎。這套引擎的賣點是:
你用自己的模型(開源權重,不是 OpenAI 或 Anthropic 的黑盒子)
你的資料留在自己家(不會回流訓練別人的模型)
你有完整的控制權(可以放進 air-gapped 的環境跑)
定價可預測(不是按 Token 計費)
這套產品要賣給誰?政府、國防、金融、醫療、大型製造業,那些「資料就是命」、對主權與控制權敏感到極致的客戶。
Karp 要做的,是說服這些客戶:你們現在用 OpenAI 與 Anthropic 的方式,是錯的。
Karp 到底在批評什麼?
第一,Token 定價模式有結構性問題。
OpenAI 和 Anthropic 按 token 收費(API 使用量)。
Karp 認為這創造了扭曲的激勵:公司花大量 token 費用,但實際的商業回報令人失望。企業不斷燒錢買 token,只換來邊際收益,而隨著更新、更貴的模型推出,成本還在不斷上升。
更糟糕的是,每次新模型出來,企業又要重新測試、重新調整,之前的投入可能又要打折扣。這是一個變動成本很高、可預測性很低的模式。
第二,IP 和數據正在被提取。
當企業使用這些 API 時,他們把專有數據和知識產權餵進這些模型。這些數據改善了實驗室的模型權重,而客戶付了高昂的費用,卻沒有完全擁有產生的能力。
Karp 的說法是:企業正在「交出他們的 alpha」,那些專有優勢正在流向別人的模型。
第三,過度銷售與糟糕的企業適配。
前沿模型在一般任務和聊天上很強大,但要在複雜的企業工作流程中(特別是國防、情報、或大規模運營)有效部署,比廣告說的難得多。很多公司在實際價值交付上撞牆了。
第四,國家安全和主權的問題。
這是 Karp 最激動的部分。他質疑政府和軍方依賴這些矽谷實驗室的做法:「我們真的要把這個國家的戰場外包給矽谷的共識觀點嗎?」
對於有數據分級、安全、主權、和審計要求的政府客戶,純粹用 API 調用封閉模型根本無法滿足需求。
他的賣點是:
「把生產工具拿回自己手裡。」
企業不需要再向矽谷繳納無底洞般的 Token 稅,而是可以在自己安全、甚至物理隔離的伺服器裡運行模型。數據是你的,模型改進是你的,成本是固定的。
為什麼是現在?因為別人正在抄他的作業
Karp 這場演出的時機並非偶然,因為 Palantir 最大的護城河,正在被人複製。
過去,Palantir 最引以為傲的資產就是 FDE(前線部署工程師)。這些工程師直接駐紮在客戶現場,幫客戶解決最髒、最累的數據整合工作。這是 Palantir 獨一無二的「重資產」護城河。
這是 Palantir 能吃下五角大廈、CIA、大型製造業訂單的根本原因。
然而,到了 2026 年,大模型實驗室們集體撞牆,發現光靠賣 API 不夠,於是紛紛開始「抄作業」:
2026 年 5 月,OpenAI 成立「OpenAI Deployment Company」,收購應用 AI 顧問公司 Tomoro,一口氣拿到 150 個 FDE。
Anthropic 同步推出「Applied AI Engineers」,還拉了 Blackstone、Goldman Sachs、Hellman & Friedman 一起搞 AI 落地合資公司。
2026 年 7 月 2 日(Karp 上節目的隔天),Microsoft 宣布砸 25 億美元 成立「Microsoft Frontier Company」,直接宣稱要打造「業界最大 FDE 組織」。
當所有人都在宣稱「我們也有工程師可以幫你落地」時,Palantir 的獨特性面臨了被稀釋的危險。
因此,Alex Karp必須站出來,極力證明「我們不一樣」。
FDE 不只是一個部門
Karp 的核心論點是:這些大模型公司以為只要僱用一幫工程師(FDE)送去客戶現場,就能解決 AI 落地問題,這完全是把問題想得太簡單了。
這就像是「裝自來水」的道理:
OpenAI 、Anthropic 和微軟的做法是,他們派了一群頂尖的「水管工」(FDE)到你家,但他們手裡只有水管,水源(模型)依然在遙遠的矽谷總部,而且你每開一次水龍頭,他們就要按流量(Token)向你收費。
更糟的是,你洗過手的水(企業數據),還會被回收送回總部去淨化(訓練模型)。
Palantir 的做法是,他們不只派水管工,他們直接幫你在自家後院挖一口井、蓋一座專屬的「淨水廠」(Ontology 本體論平台)。
「Ontology(本體論)」聽起來很學術,但說穿了,它就是一張「企業運作的數位地圖」。
大型企業的數據通常極其混亂,財務數據在 A 系統、工廠機台數據在 B 系統、客戶資料在 C 系統,彼此根本不通。Palantir 的 Ontology 平台,就是把這些分散、格式不同的數據,翻譯成 AI 和業務人員都能聽懂的「統一語言」。
有了這張地圖,Palantir 的 FDE(前線工程師)才能像神醫一樣,迅速把 AI 植入企業的核心運作流程中。
相反地,OpenAI 或 Microsoft 現在做的,是在一個「按流量計費、數據外流、沒有統一數據地圖」的地基上,硬塞一組昂貴的水管工。
這群工程師再厲害,也只能幫忙貼補丁,無法從根本上解決企業對數據安全、成本失控與系統不相容的集體焦慮。
AI 的「最後一哩」
把視角拉遠一點看,這其實是一個不同層級的互相競爭。
在這個新的戰場中,大家在比併誰能把 AI 真正塞進企業的作業流裡、產生可衡量的價值。
而 Karp 這場演出,本質上就是在告訴市場:這條賽道我跑了二十年,你們現在才進場,該用什麼姿勢跑,我最有資格說。
AI 的獵物還是獵人?不是一般的SaaS?估值和增速合理嗎?- 深入分析第34期:Palantir
在成為華爾街代碼「PLTR」之前,Palantir 首先是一個來自 J.R.R. 托爾金筆下《魔戒》的神話符號。
謝謝你閱讀到這裡,如果你覺得這份筆記為你帶來了價值,請不吝按下一個讚,這是我持續分享的最大動力。
我在Facebook和Threads都有每天發佈當天對市場的觀察,大家也可以考慮追蹤我的社交媒體。
另外我在Telegram有頻道,每天早上我會發當天重要新聞摘要。
同時,如果想開戶的話,可以考慮用我的富途/口袋證券獨家推薦碼,會有更多優惠。
全部資訊在以下鏈結:
另外,如果你已經加入付費會員,不要浪費了群組的功能,進入我們Substack的Chat功能一起討論市場!
· KP











頭位😬