新電子雜誌 » 熱門新聞 » 鎖定AI推論商機　高通發表AI200/AI250解決方案

鎖定AI推論商機　高通發表AI200/AI250解決方案

2025 年 10 月 31 日

高通(Qualcomm)近日宣布推出新一代專為資料中心AI推論最佳化的解決方案：以高通AI200與AI250晶片為基礎打造的加速卡及機架系統。以高通在NPU技術領域的領導地位為基礎，這些解決方案提供機架級效能與卓越的記憶體容量，能以出色的每美元每瓦的高效能，支援快速生成式AI推論，並在推動跨產業可擴展、高效且靈活的生成式AI上邁出重大突破。

高通宣布將推出基於AI200、AI250晶片的加速卡與機架解決方案，瞄準生成式AI推論需求。

高通AI200推出專為機架級AI推論打造的解決方案，可為大型語言模型(LLM)、多模態模型(LMM)推論及其他AI工作負載提供低總體擁有成本(TCO)與最佳化的效能。每張加速卡支援768GB的LPDDR記憶體，實現更高容量與更低成本，為AI推論提供出色的擴展性與靈活性。

高通AI250解決方案將首次採用基於近記憶體運算(near-memory computing)的創新記憶體架構，透過提供超過10倍的有效記憶體頻寬並大幅降低功耗，為AI推論工作負載在效率與效能上帶來跨世代的躍進。此架構可實現分離式AI推論，提升硬體資源利用效率，同時滿足客戶在效能與成本上的需求。

兩款機架級解決方案皆配備直接液冷技術以提升散熱效率，支援PCIe垂直擴展與乙太網路橫向擴展，並具備機密運算功能以確保AI工作負載的安全性，而整個機架的功耗為160千瓦。

高通技術公司資深副總裁暨技術規劃、邊緣解決方案與資料中心總經理Durga Malladi表示，透過高通AI200與AI250，我們正重新定義機架級規模AI推論的可能性。這些創新的AI基礎架構解決方案能讓客戶以前所未有的總體擁有成本部署生成式AI，並兼顧現代資料中心所需的靈活性與安全性。我們擁有豐富的軟體堆疊與開放生態系統支援，讓開發者與企業能比以往更輕鬆地在我們最佳化的AI推論解決方案上整合、管理並擴展已訓練完成的AI模型。透過與主流AI框架的無縫相容性及一鍵式模型部署功能，高通AI200與AI250將支持企業輕鬆導入並加速創新。

我們超大規模等級的AI軟體堆疊，涵蓋從應用層到系統軟體層的端到端架構，並針對AI推論進行最佳化。此軟體堆疊支援主流的機器學習(ML)框架、推論引擎、生成式AI框架，以及包括分離式服務在內的大型語言模型(LLM)與多模態模型(LMM)推論最佳化技術。開發者可透過高通技術公司的Efficient Transformers Library與Qualcomm AI Inference Suite，無縫導入模型並一鍵部署Hugging Face模型。我們的軟體提供可立即使用的AI應用和智慧代理、完整工具、函式庫、API與AI營運化服務。

高通AI200與AI250預計將分別於2026年與2027年正式上市。未來，高通技術公司將致力於按年度迭代節奏，持續推動資料中心產品藍圖發展，專注於提供業界領先的AI推論效能、能源效率與最佳總體擁有成本。

標籤

近期研討會 More

2025-12-18 【實體活動】12月18日機器人的智慧基因──AI×感測×驅動技術與應用交流座談會──晶片設計專場

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

台灣掌握光纖陀螺儀關鍵技術 本土慣性導航挺進國防與航太供應鏈

imec展示與英特爾/台積電合作成果 2D材料取得重大進展

Quobly宣布量子半導體重要進展 28Si FD-SOI基板進入意法製程開發

TPCA：中日韓PCB產業進入新競局 AI伺服器與高階載板成關鍵動能

2025恩智浦創新技術峰會 聚焦人工智慧、工業物聯網與智慧汽車新趨勢

那些藏在展台裡的野心：ST 如何用 30 款方案重定義 AI 與移動的物理邊界

建構全方位環境感知力 多感測融合為車輛智慧加冕

無人載具的靈魂之戰 工研院打造感測決策核心

靈魂之窗結合AI大腦 無人載具走向具身智慧

因應台灣特有狀況 5G專網投資側重附加價值

馬斯克的軌道算力戰：從 Starlink V3 的魔改到 V4 的終極型態

三星聯手MIT蓋「樓中樓」，意圖繞過台積電的護城河

突破HPC功耗與散熱雙重挑戰 3D封裝電源模組應運而生

預防電路板微短路 HAST測試PCB不失效有道

開源方案顛覆工業自動化 ROS2改變未來工廠

3Q’25半導體產業營收打破單季歷史紀錄

光通訊雷射出現缺貨潮 NVIDIA策略性固樁重塑雷射供應鏈格局

半導體製程碳足跡持續攀升 電網碳強度重新劃分製造版圖

記憶體價格飆漲 TrendForce下修2026年遊戲主機出貨預估

Yole：玻璃將成主流半導體製程平台

Holtek推出HT66F3126/HT66F3132/HT66F3142三款全新A/D Flash MCU系列產品

新唐科技參加台以商會座談會 分享跨國研發管理經驗

Nordic Semiconductor推出nRF7002 EBII開發板 擴展nRF54L系列Wi-Fi 6功能

愛德萬測試推出M5241記憶體分類機 專為AI應用設計

Littelfuse推出200 V 480 A超級結MOSFET 具超低導通電阻和高功率密度

鎖定AI推論商機 高通發表AI200/AI250解決方案

NVIDIA AI推論效能/能源效率均佳

軟硬整合釋放AI潛能 資料中心效能須升級

Meta首席AI科學家Yann LeCun：AI架構新典範5年內到來

晶片功耗進入千瓦級世代 超流體散熱勢在必行

美光推出業界首批AI專用資料中心SSD產品組合

高通收購Arduino 加速邊緣技術創新與開發能力

【找到你的AI神隊友】立即免費下載，開啟AI智慧應用無限可能

【特輯秘笈】免費下載！連接AI智慧聯網新未來：Wi-Fi 6E/7/8技術關鍵解密

【強檔白皮書下載】馬達驅動器 – 探索電子馬達控制的迷人世界

【免費下載】解鎖政府補助與合作商機：《晶創生態圈資源指南》助您加速創新

【創新必備】「AI on Chip產業合作策略聯盟」手冊，開創AI晶片應用合作新契機

攻擊者已在行動 量子威脅迫企業提前布局

量子賽局加速前進 工研院押注台灣製造優勢

量子戰場的反叛者 Quobly用半導體老技術打游擊戰

SDV時代來臨 英飛凌押注運算、通訊與電力安全

感測器融合決定成敗 智慧機器人精準行動的技術關鍵

馬斯克的軌道算力戰：從 Starlink V3 的魔改到 V4 的終極型態

三星聯手MIT蓋「樓中樓」，意圖繞過台積電的護城河

那些藏在展台裡的野心：ST 如何用 30 款方案重定義 AI 與移動的物理邊界

Holtek推出HT66F3126/HT66F3132/HT66F3142三款全新A/D Flash MCU系列產品

新唐科技參加台以商會座談會 分享跨國研發管理經驗

建構全方位環境感知力 多感測融合為車輛智慧加冕

無人載具的靈魂之戰 工研院打造感測決策核心

imec展示與英特爾/台積電合作成果 2D材料取得重大進展

靈魂之窗結合AI大腦 無人載具走向具身智慧

預防電路板微短路 HAST測試PCB不失效有道

台灣掌握光纖陀螺儀關鍵技術　本土慣性導航挺進國防與航太供應鏈

imec展示與英特爾/台積電合作成果　2D材料取得重大進展

Quobly宣布量子半導體重要進展　28Si FD-SOI基板進入意法製程開發

TPCA：中日韓PCB產業進入新競局　AI伺服器與高階載板成關鍵動能

2025恩智浦創新技術峰會　聚焦人工智慧、工業物聯網與智慧汽車新趨勢

建構全方位環境感知力　多感測融合為車輛智慧加冕

無人載具的靈魂之戰　工研院打造感測決策核心

靈魂之窗結合AI大腦　無人載具走向具身智慧

因應台灣特有狀況　5G專網投資側重附加價值

突破HPC功耗與散熱雙重挑戰　3D封裝電源模組應運而生

預防電路板微短路　HAST測試PCB不失效有道

開源方案顛覆工業自動化　ROS2改變未來工廠

光通訊雷射出現缺貨潮　NVIDIA策略性固樁重塑雷射供應鏈格局

半導體製程碳足跡持續攀升　電網碳強度重新劃分製造版圖

記憶體價格飆漲　TrendForce下修2026年遊戲主機出貨預估

新唐科技參加台以商會座談會　分享跨國研發管理經驗

Nordic Semiconductor推出nRF7002 EBII開發板　擴展nRF54L系列Wi-Fi 6功能

愛德萬測試推出M5241記憶體分類機　專為AI應用設計

Littelfuse推出200 V 480 A超級結MOSFET　具超低導通電阻和高功率密度

鎖定AI推論商機　高通發表AI200/AI250解決方案

軟硬整合釋放AI潛能　資料中心效能須升級

晶片功耗進入千瓦級世代　超流體散熱勢在必行

高通收購Arduino　加速邊緣技術創新與開發能力

攻擊者已在行動　量子威脅迫企業提前布局

量子賽局加速前進　工研院押注台灣製造優勢

量子戰場的反叛者　Quobly用半導體老技術打游擊戰

SDV時代來臨　英飛凌押注運算、通訊與電力安全

感測器融合決定成敗　智慧機器人精準行動的技術關鍵