NVIDIA宣布,已完成收購Slurm的主要開發者SchedMD。Slurm為用於高效能運算(HPC)與人工智慧(AI)的開源工作負載管理系統。此次收購將有助於強化開源軟體生態系,並為研究人員、開發者與企業推動AI創新。NVIDIA將持續以開源、供應商中立軟體的形式開發並發表Slurm,讓Slurm得以在多元硬體與軟體環境中,持續被更廣泛的高效能運算與AI社群採用與支援。
高效能運算與AI工作負載往往涉及複雜運算,需在叢集上以平行方式執行多項任務,因此必須具備佇列、排程,以及運算資源分配等能力。隨著高效能運算與AI叢集規模日益擴大、效能持續提升,如何有效利用資源,已成為關鍵。
Slurm在可擴展性、輸送量及複雜政策控管等方面,為領先的工作負載管理器與作業排程器。在TOP500超級電腦排行榜中,前10名與前100名系統有一半以上採用Slurm。Slurm支援最新NVIDIA硬體,同時也是生成式AI所需的關鍵基礎設施之一。基礎模型開發者與AI建置團隊會使用Slurm來管理模型訓練與推論需求。
SchedMD執行長Danny Auble表示,我們很高興能與NVIDIA攜手合作。這次收購可說是對Slurm在全球最嚴苛的高效能運算與AI環境中扮演關鍵角色的最佳肯定。NVIDIA在加速運算領域深厚的專業與投入,將強化Slurm的發展,以滿足下一代AI與超級運算的需求。Slurm也將持續維持開源的形式。
NVIDIA與SchedMD已合作超過十年,並將持續投入Slurm的開發,確保其維持為高效能運算與AI領域首屈一指的開源排程器。NVIDIA也將加速SchedMD對新系統的導入,讓使用NVIDIA加速運算平台的用戶,能在整體運算基礎設施上最佳化工作負載。同時SchedMD也將支持多元硬體與軟體生態系,協助客戶在異質叢集中採用最新Slurm創新功能。
NVIDIA亦將持續為SchedMD數百家客戶提供Slurm的開源軟體支援、訓練與開發服務。這些客戶涵蓋雲端服務供應商、製造商、AI公司與研究實驗室,橫跨自動駕駛、醫療與生命科學、能源、金融服務、製造與政府等產業。