神雲科技將於NVIDIA GTC 2026展示其在NVIDIA MGX架構的AI伺服器與全方位AI解決方案的最新突破,主題為「Enterprise AI, Flexible by Design」。透過與NVIDIA、AMD、DDN、Intel、Micron、Rafay、Sandisk及Solidigm等產業夥伴的合作,神雲科技持續推動加速運算與次世代資料中心的發展,為客戶提供涵蓋AI訓練、推理及檢索增強生成應用的端到端實力。
為了解決現代AI工作負載的複雜性,神雲科技將硬體與先進軟體棧整合,實現無縫的GPU管理與高效能儲存應用。透過與Rafay的戰略夥伴關係,神雲科技支援統一的控制面功能,具備管理大規模容器化環境的能力,協助企業簡化Kubernetes編排,並透過Slurm控制器實現高效能運算與AI工作負載的自動化調度。
Rafay共同創辦人暨執行長Haseeb Budhani表示,與神雲科技的合作簡化了現代AI的複雜性,協助企業自動化Kubernetes編排與Slurm AI任務調度,確保在嚴格的營運控制下實現高效擴展。
神雲科技基於NVIDIA MGX參考架構打造的次世代G系列高吞吐量4U AI Powerhouse,搭載兩顆最新的AMD EPYC「Venice」處理器,並支援高達8張雙槽GPU。該平台可配置NVIDIA RTX PRO 4500或NVIDIA RTX PRO 6000,亦可搭載NVIDIA H200 GPU,並整合E3.S PCIe Gen 5外型規格的Micron 9550 NVMe SSD或Solidigm D7-PS1010,提供高速網路連線,專為大規模生成式AI訓練與推理設計。
針對其他配置方案,神雲科技展示了基於MGX架構的4U平台,搭載雙路Intel Xeon 6700P處理器與8張GPU,整合E1.S PCIe Gen 5外型規格的Micron 9550 NVMe SSD或Solidigm D7-PS1010,以及Micron DDR5 DRAM。
神雲科技與DDN聯手展示AI Data Storage Solution,針對多模態RAG流水線的資料需求,採用DDN Infinia,提供極低延遲的文檔檢索,並最小化資料移動以提高GPU利用率,支援高吞吐量的AI工作負載。
此解決方案架構整合了神雲科技基於NVIDIA MGX架構的次世代4U AI平台,並由R1917GC管理伺服器提供支援,構建出橫跨核心、邊緣與管理層的統一AI基礎設施。R1917GC搭載NVIDIA Grace或NVIDIA Vera處理器,利用LPDDR5X提供卓越的運算密度與記憶體頻寬,並支援RDMA的連網能力。
為了替AI規模的資料湖架構奠定基礎,此方案納入GC68A-B8056儲存伺服器,具備支援DDR5-4800記憶體的24個DIMM插槽,提供高效能的儲存密度。
神雲科技總經理黃承德表示,透過與Rafay及DDN的策略合作,神雲科技提供全方位的AI基礎設施,滿足AI訓練、推理與RAG應用的全生命週期需求,為次世代資料中心客戶提供端對端解決方案。