新電子雜誌 » 市場話題 » Zyphra推出首個基於AMD技術的大規模混合專家模型ZAYA1

Zyphra推出首個基於AMD技術的大規模混合專家模型ZAYA1

2025 年 11 月 26 日

超微(AMD)宣布，Zyphra在大規模AI模型訓練方面達成重大里程碑，成功開發出ZAYA1，此為首個採用AMD GPU與網路平台訓練而成的大規模混合專家(MoE)基礎模型。這項成就得益於AMD Instinct MI300X GPU、AMD Pensando網路技術，並由AMD ROCm開放軟體堆疊所實現。

Zyphra測試結果顯示，該模型在推理、數學及編碼等基準測試中，與頂尖開放模型相比，展現出具有競爭力甚至更卓越的效能，充分彰顯AMD Instinct GPU在生產級AI工作負載方面的可擴展性與效率。

AMD人工智慧事業群人工智慧與工程全球副總裁Emad Barsoum表示，AMD在加速運算領域的地位，正為Zyphra等創新者挹注動能，持續突破AI領域的極限。這項里程碑展示了AMD Instinct GPU與Pensando網路技術在訓練複雜大規模模型方面的強大能力與靈活性。

Zyphra執行長Krithik Puthalath指出，效率一直是Zyphra的核心指導原則，影響著我們如何設計模型架構、開發訓練與推論演算法，並選擇具備最佳性價比的硬體，以向客戶提供前瞻性的智慧。ZAYA1體現了這項理念，我們很高興成為首家在AMD平台上展示大規模訓練的公司。這個成果彰顯將模型架構與晶片及系統共同設計的強大力量，我們期待在建構下一代先進多模態基礎模型的進程中，深化與AMD及IBM的合作。

AMD Instinct MI300X GPU具備192GB高頻寬記憶體，實現高效的大規模訓練，無須仰賴成本高昂的專家或張量分片(Tensor Sharding)，從而降低複雜度並提升整個模型堆疊的吞吐量。Zyphra亦指出，透過AMD最佳化的分散式I/O，模型儲存時間加快10倍以上，進一步提升訓練的可靠性與效率。ZAYA1-Base僅以極小部分的活躍參數，總參數量8.3B、活躍參數760M的效能，已可媲美甚至超越Qwen3-4B、Gemma3-12B、Llama-3-8B和OLMoE等模型。

基於先前的合作基礎，Zyphra與AMD及IBM緊密合作，設計並部署搭載AMD Instinct GPU及AMD Pensando網路互連技術的大規模訓練叢集。這套由AMD與IBM共同開發的系統已於本季稍早發表，結合AMD Instinct MI300X GPU與IBM Cloud的高效能網路與儲存架構，為ZAYA1大規模預訓練奠定基礎。

標籤

近期研討會 More

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Intel擘劃AI時代Wi-Fi 8智慧無線區域網路

領先業界近十年 意法半導體2027年100%使用再生能源

Playground Global攜7家重要新創登台 台灣扮演運算革命推手

鴻海研究院/陽明交大發表二維矽光子-超穎透鏡焦平面陣列光束轉向技術

IEK：2028全球生成式AI市場規模達519億美元

稀土精鍊門檻被高估 美國技術與產能突圍正在加速

實驗室與產線之間的距離 量產量子晶片是下階段賽道

充電焦慮瓶頸有解 EV高功率充電水到渠成

地緣政治牽動大國博弈 2026美中競爭下半導體展望

不拚量子霸權 台灣要當供應鏈關鍵節點

DRAM儲存密度要求只增不減 熱穩定FinFET潛力可期

Arm推出NSS升頻技術 AI驅動行動GPU降載增效

量子雜訊現難題 AI解碼器改寫糾錯賽局

AEC-Q006推動車用電子品質革新 車用IC銅線封裝驗證一把抓

提升效率/瞬態響應性能 優化H橋降壓升壓電路效能

人形機器人進入起飛期 2025~30年出貨量CAGR接近70%

記憶體價格暴漲衝擊消費市場 2026年手機/NB出貨下修

Omdia：2026年面板出貨面積將成長6%

生成式AI智慧型手機出貨量突破五億支

Counterpoint：智慧型手機AP加速轉進5奈米以下製程