NVIDIA Rubin CPX重新定義長文本模型處理極限

昨天NVIDIA正式發布Rubin CPX GPU,這款專為百萬token上下文處理設計的晶片,搭載30 petaflops運算能力和128GB GDDR7記憶體,標誌著AI推理硬體進入專業化分工新階段。當前AI模型在處理大規模程式碼分析和長影片生成時面臨的運算瓶頸,將因為這項技術突破獲得根本性解決。...
2025 年 09 月 10 日