(評論)英特爾亟欲扭轉GPU運算生態系劣勢 oneAPI責任重大

作者: 黃繼寬
2020 年 11 月 26 日

提到以GPU進行通用運算,NVIDIA無疑是業界的領導者。NVIDIA花了十多年經營的CUDA生態系統,已經有為數眾多的開發者,與大量針對NVIDIA GPU進行最佳化的應用。這是讓NVIDIA最近幾年能在Top 500超級電腦榜單上頻頻拿下優異成績,並且在資料中心市場上收穫豐碩,最重要的資產之一。

身為高性能運算與資料中心處理器市場的龍頭老大,英特爾(Intel)很難不對NVIDIA的動作有所回應。一方面,英特爾正在加緊研發專為資料中心設計的Xe HP與Xe HPC獨立GPU,以便與NVIDIA的GPU產品抗衡,另一方面也希望藉由oneAPI扭轉當前在GPU運算相關軟體/應用生態系的劣勢。

落實XPU願景 oneAPI不可或缺
英特爾於SuperComputing 2019期間發表oneAPI產業倡議(oneAPI Initiative),以建立一個開放、遵循標準、一致的程式設計模型為目標,提供開發者於CPU、GPU、FPGA及其它ASIC加速器之間,自由選擇最佳硬體的可能性,也是英特爾落實其「XPU」願景不可或缺的重要配套方案。很明顯的是,英特爾並不打算讓自家的GPU跟NVIDIA單挑,而是想連結公司CPU、FPGA、AI加速器ASIC等產品線的優勢,回過頭來挹注GPU的發展。

英特爾力推oneAPI,盼藉此讓開發者撰寫出可以跨CPU、GPU、FPGA,甚至ASIC硬體平台上執行的應用

英特爾確實是在下一盤很大的棋。在通用GPU運算領域,NVIDIA的CUDA生態系已經處在其他業者很難在短時間內超車的領先地位,但通用GPU運算的生態系跟x86 CPU的生態系相比,確實也只是個規模中等的池塘。如果oneAPI能讓原本為x86 CPU撰寫的應用快速移植到GPU上,甚至把一個應用中不同性質的運算任務,自動分配給x86 CPU或GPU處理,對運算資源做最高效率的利用,英特爾確實有機會對NVIDIA發動一場漂亮的逆襲。因為市場競爭的態勢,將從英特爾、NVIDIA間的GPU對決,轉變成英特爾CPU、GPU、FPGA、ASIC聯軍圍攻NVIDIA GPU的情況。

技術上能做到這件事嗎?有機會,但不是一蹴可幾的事情。oneAPI 1.0版在12月正式發表後,後面還有很多工作要做。據英特爾台灣分公司商用業務總監鄭智成表示,要讓一個應用橫跨不同運算硬體架構,需要整條工具鏈的配合。目前做得比較完整的,是基於OpenVINO工具包(Toolkit)所發展出來的應用。

欲使用oneAPI的開發者,英特爾會提供oneAPI基礎工具包(Base Toolkit),該工具包內含直接面對硬體的核心工具,包含編譯器、函式庫、相容性工具,以及分析與除錯工具。在這之上,會有對應oneAPI的特定領域工具包(Domain-specific Toolkit),例如針對物聯網應用的IoT Toolkit、針對資料視覺化的渲染工具包(Rendering Toolkit),以及專為高效能運算應用開發的HPC Toolkit。最後則是專為特定應用開發所設計的工具包,例如OpenVINO跟AI Analytics。特定領域工具包跟特定應用工具包,都必須先做到能跟oneAPI銜接,才能進一步發展異質協同運算。

oneAPI與其對應的三種工具包,是實現異質協同運算不可或缺的基本工具

日前英特爾就選擇OpenVINO作為oneAPI的展示範例,該展示案例是一個透過OpenVINO實作的車輛影像辨識應用。藉由oneAPI的協助,一個基於OpenVINO的影像辨識應用,只要調整一些參數,就能同時在英特爾的Xeon跟Xe GPU上執行。雖然這個展示沒有把Movidius也放進來,但在oneAPI發表前,Movidius VPU就已經是x86 CPU的協處理器,因此在oneAPI發表後,OpenVINO將成為一個可以橫跨x86 CPU、GPU與ASIC的應用框架。

可以跑不等於跑得快 最佳化還需下苦工
參與oneAPI產業倡議的成員之一,德國柏林的Zuse Institution,已經展示了將原本在CUDA上撰寫的海嘯模擬應用,移植到英特爾平台的可行性。據了解,透過oneAPI,該應用絕大部分程式碼都可以直接轉換,只有小部分需要手動調整。

然而,有程式開發經驗的讀者應該都會意識到,程式碼能移植到新平台上是一回事,移植到新平台後的程式執行效能,又是另外一回事。要得到最好的執行效能,手動最佳化通常是免不了的苦工。針對藉由oneAPI進行移植的應用程式,目前並沒有公開的Benchmark數據,可以比較其移植前後的性能表現,但這想必是業內最關心的事情之一。

退一步來說,應用型態百百種,即便有某個應用公開其移植前後的Benchmark資料,也不代表其他應用移植後的狀況會是如此。或許,對應用開發者而言,只有實際動手試試看,才能知道藉由oneAPI移植後的程式,執行效能到底如何。

在oneAPI 1.0版正式發表後,英特爾會在其DevCloud上提供免費的開發環境與虛擬硬體,供所有開發者存取、測試。不過,針對某些還沒正式發表的硬體,只有簽署保密協定(NDA)的特定開發者能夠存取,例如還在工程樣品階段的Xe HP GPU。

英特爾大打免費牌,不無廣發英雄帖的味道。對英特爾而言,能不能吸引更多開發者聚集到oneAPI的大旗下,進而「一試成主顧」,在英特爾搭建的平台上安身立命,將決定oneAPI策略到底能發揮多大效果。
 

標籤
相關文章

爭行動大餅 晶片商競逐CPU/GPU協同運算

2013 年 06 月 04 日

Xilinx AI轉型拉攏資料中心 劍指Intel、NVIDIA

2018 年 10 月 19 日

資料中心競合新局 邊緣運算開啟軟體附加價值

2020 年 11 月 02 日

NVIDIA攜手VMware力推AI Enterprise 軟體套件

2021 年 03 月 19 日

大廠力拱 USB 3.0裝置端市場水漲船高

2011 年 05 月 12 日

人工智慧技術陣營眾多 ARM專注後端控制技術

2016 年 11 月 22 日
前一篇
貿澤供貨意法BlueNRG-2N/LP裝置
下一篇
英飛凌躋身全球最具永續發展公司之列