#NVIDIA的三維防線與雲端巨頭們的越獄計畫

作者: 林宗輝
2025 年 11 月 27 日

當全球科技圈還沈浸在Gemini 3的驚人效能時,一個更讓NVIDIA背脊發涼的消息悄然傳出:Anthropic才剛推出的頂級模型,Claude Opus 4.5,竟然也開始大規模採用Google TPU進行訓練,且未來的訓練規模將劍指百萬顆TPU等級,甚至連Meta也對Google遞出橄欖枝。

這是個極具殺傷力的警訊。過去NVIDIA之所以能壟斷市場,#是因為CUDA是AI界的「#英語」,是唯一的通用語言。#Google自研的TPU雖然強大,#但一直被視為Google內部的「#方言」,出了Google園區就沒人講。但現在,連擁有頂級模型能力的Anthropic都開始講這門方言,#這意味著TPU生態系已經具備了外溢能力。

如果越來越多頂級玩家發現,不繳「黃仁勳稅」也能訓練出世界級模型,NVIDIA的護城河將出現第一道真正的裂痕。

面對「Google效率路線」與「叛軍結盟」的雙重夾擊,NVIDIA的執行長黃仁勳展現了極致的戰略彈性。他不僅祭出了三維防線,更使出了一招令人意想不到的「特洛伊木馬」——開放NVLink授權。

這場算力戰爭,現在演變成了三層同心圓的立體攻防:

第一層:Scale-up的記憶體怪獸與開放陷阱(NVIDIA的主場)

在GB200 NVL72機櫃中,NVIDIA利用NVLink技術與銅纜,將72顆GPU塞進同一個空間。為了應對推理性模型(Reasoning Models)對記憶體的貪婪需求,NVIDIA即將祭出GB300(Blackwell Ultra),透過CoWoS-L技術堆疊12層HBM3e,將記憶體推升至288GB,試圖將運算鎖死在機櫃內部。

但最精彩的轉折在於:NVIDIA打破了封閉的傳統,宣布開放NVLink IP授權。 這是一招極為高明的「以退為進」。黃仁勳看準了雲端巨頭們(CSP)想自研CPU或加速器的野心,既然擋不住你們造晶片,那我就讓你們的晶片「必須」透過NVLink來連接我的GPU。#透過開放高速互連標準,#NVIDIA將潛在的競爭對手變成了共生夥伴。你想造自己的CPU?沒問題,但請用NVLink連上我的Blackwell,這樣才跑得快。這看似開放,實則是將對手鎖得更緊的特洛伊木馬。

第二層:Scale-out的路線分歧(效率 vs. 通用)

這是Google與叛軍們的甜蜜點。Google利用OCS光學交換,用鏡子反射雷射光,避開了傳統電子交換器的塞車與高溫。這種「預先配置電路」的模式極度適合穩定的超大規模訓練,這也是為什麼Claude會看上TPU叢集的主因——在百萬顆晶片的規模下,省下的電費與光電轉換成本是天文數字。

NVIDIA則採取雙軌策略回擊。針對貴族用戶提供InfiniBand;針對不想被綁架的通用乙太網路用戶,則祭出Spectrum-X。#NVIDIA試圖證明,#即便是通用的乙太網路,經過他們的Spectrum-X調教,也能達到 #接近InfiniBand的效能,藉此留住那些動搖的客戶。

第三層:Scale-across的維度打擊(NVIDIA的新戰場)

這就是NVIDIA回應物理牆與叛軍聯盟的殺手鐧。Scale-across不再執著於「單點密度」,而是透過Base Command等軟體調度,將訓練任務拆解,跨越地理限制分布到多個資料中心。 這是一個降維打擊的策略:既然Google在單一機房內用鏡子反射雷射光做到了極致效率,NVIDIA就繞過這個戰場,直接把分散在不同城市的機房連成一個超級大腦。同時,Scale-across也意味著跨越架構,#讓AI工作負載能跑在企業既有的通用乙太網路上,全面收割企業端市場。

至於其他巨頭們,則是在夾縫中尋找第三條路,面對NVIDIA的全面封鎖與TPU聯盟的崛起,其他雲端巨頭(CSP)必須拿出真正的黑科技,證明自己還有獨立生存的空間。

AWS選擇攻克通訊協定的痛點。他們發現傳統TCP/IP協定太過笨重,因此為自研晶片Trainium開發了 #SRD協定(Scalable Reliable Datagram)。配合EFA轉接器,它能將數據流打散成無數小封包,同時走多條路徑傳送,最後再重組。這就像是快遞公司不再堅持一台車走直線,而是出動機車隊鑽遍所有大街小巷,確保貨物最快送達。

微軟為了自研晶片Maia,走了一條更科幻的路。他們收購了Lumenisity公司,準備在資料中心鋪設「#空芯光纖」。傳統光纖的中間是玻璃,光在玻璃中的速度比在真空中慢了約31%。微軟的新光纖中間是空氣,讓光束能以接近物理極限的速度狂奔。對於需要頻繁同步參數的AI模型來說,這省下的每一奈秒都價值連城。

總結這場戰局,Claude加入TPU陣營證明了「非CUDA路線」的可行性,這迫使NVIDIA必須同時揮舞兩把劍使出星爆氣流斬:一把是技術上的GB300與Scale-across,試圖用規模壓制對手;另一把是商業上的NVLink授權,試圖用「開放」的名義將叛軍重新納入麾下。

投資者雖然緊張,但NVIDIA護城河遠還不到崩潰的地步,相反的還不斷在強化,然而未來的AI霸主會是誰?能源,以及跨地理限制的運算能力可能會成為決定關鍵。


》想看更多內容?快來【免費加入會員】【登入會員】,享受更多閱讀文章的權限喔!
標籤
相關文章

讀取性能快又可靠 NOR Flash簡化智慧汽車設計

2012 年 09 月 23 日

整合更多GPU核心 行動處理器大開「眼」界

2013 年 12 月 23 日

雲端服務已成IoT必要元素 簡化連線設定將成大勢所趨

2018 年 06 月 28 日

改善資料中心能源效率 導入DPU成效顯著

2023 年 01 月 03 日

ChatGPT再掀新高潮 科技廠爭搶生成式AI商機

2023 年 06 月 06 日

低精度高性能:NVIDIA FP4格式如何加速AI應用新時代

2025 年 03 月 28 日
前一篇
為何說Nvidia的GB200巨獸,是在向十年前的Google致敬?
下一篇
DigiKey推出業界首創電源供應器配置工具 簡化設計流程