新電子雜誌 » 市場話題 » Mistral AI推出Mistral 3系列開源多語言模型　優化企業級AI效能

Mistral AI推出Mistral 3系列開源多語言模型　優化企業級AI效能

2025 年 12 月 03 日

Mistral AI今日宣布推出Mistral 3系列開源多語言、多模態模型，該系列模型針對NVIDIA超級運算與邊緣平台進行最佳化。

Mistral Large 3為混合專家(MoE)模型，無需為每個詞元啟動所有神經元，而是僅啟動模型中最具影響力的部分。此設計在不浪費資源的情況下實現規模化，並在不犧牲準確性的前提下實現高效運作，使企業級人工智慧(AI)具備真正實用性。

Mistral AI的全新模型為企業級AI提供準確性和效率。從12月2日開始，該模型將在雲端、資料中心和邊緣等各種環境中啟用。憑藉410億個有效參數、6,750億總參數及大型的25.6萬情境窗口，Mistral Large 3將為企業AI工作負載提供可擴展性、高效能與適應性。

透過結合NVIDIA GB200 NVL72系統和Mistral AI的混合專家架構，企業可以高效部署和擴展大規模AI模型，並從先進的平行處理和硬體最佳化中受益。

這樣的結合標誌著此次發表正邁向Mistral AI所稱的「分散式智慧」時代，進一步彌合研究突破與現實應用之間的差距。

該模型採用細粒度的混合專家架構，利用NVIDIA NVLink的記憶體一致性域和廣泛的專家並行最佳化，充分釋放了大規模專家並行運算的效能優勢。

這些優勢與保持準確度的低精度NVFP4格式及NVIDIA Dynamo分散式推論最佳化技術相疊加，確保大規模訓練與推論任務達到巔峰效能。

在GB200 NVL72上，Mistral Large 3的效能相較前一代NVIDIA H200提升了10倍。此代產品的躍進帶來更優異的使用者體驗、讓每個詞元的成本更低，並創造更高的能源效率。

除了針對企業級應用打造的Large 3，Mistral AI也發表9款可以在邊緣裝置上運行的小型語言模型，幫助開發者隨時隨地運行AI。精巧的Ministral 3套件針對NVIDIA的邊緣平台進行最佳化，涵蓋NVIDIA Spark、RTX桌上型和筆記型電腦，以及NVIDIA Jetson裝置。

為了實現最佳效能，NVIDIA與Llama.cpp和Ollama等AI框架合作，在邊緣端的NVIDIA GPU上發揮極致效能。開發人員與業餘玩家現可透過Llama.cpp和Ollama體驗Ministral 3套件，在邊緣端快速且高效地運行AI。

Mistral 3系列模型已全面開放，賦能全球研究人員和開發人員進行實驗、客製化並加速AI創新，同時普及前沿級別的技術。

透過將Mistral AI的模型與Data Designer、Customizer、Guardrails和NeMo Agent Toolkit等開源NVIDIA NeMo工具相連接，企業可以根據自身應用場景進一步客製化這些模型，加速從原型開發到生產部署的進程。

為了實現從雲端到邊緣的效能最佳化，NVIDIA已針對Mistral 3系列模型進行推論框架的最佳化，包含NVIDIA TensorRT-LLM、SGLang及vLLM。Mistral 3目前已在主流開源平台和雲端服務供應商上架。此外，這些模型預計很快將能以NVIDIA NIM微服務的形式進行部署。

標籤

近期研討會 More

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

美光推出256GB LPDRAM SOCAMM2 記憶體功耗大幅改善

高通號召組成產業聯盟 加速6G研發與全球部署

超微支持Open Telco 加速電信級AI發展

聯發科於MWC 2026大秀6G、AI新方案

超微/Meta擴大策略合作 啟動6GW GPU規模部署

AI伺服器全面走向液冷 Submer DLC/浸沒式技術兩頭布局

當摩爾定律撞上物理牆 台積電A14藉AI破壁而出

光進銅退勢在必行 愛德萬ATE力助矽光子落地

遠洋貨運走向智慧化/數位化 衛星應用服務價值浮現

決定人機協作成敗的隱形臍帶 工業無線網路部署考驗重重

訊號/電源模擬提升設計成功率 高速設計SIPI模擬應用

精準決策/快速部署/提升能效 資料驅動的電網智慧化轉型

整合布局檢查與電源完整性模擬 FEDS革新PCB與電源設計

掌握光衰/可靠度/突破驗證瓶頸 矽光子與CPO光速量產

資源感知引領未來工廠 製造業數位轉型邁入新階段

Counterpoint：2026年智慧型手機出貨量恐衰退12.4%

2026年全球八大CSP合計資本支出將破7,100億美元

2025年智慧手錶出貨量走出衰退陰霾

FPD製造設備折舊接近完成 OLED、LCD成本壓力大幅緩解

AR智慧眼鏡帶動MicroLED顯示器銷售成長150%

是德推出次世代Infiniium XR8即時示波器 加速高速數位與合規性測試

稜研科技於MWC 2026展示商用級毫米波相位陣列解決方案 聚焦5G與衛星通訊應用

全球資料中心資本支出預測將達1.2兆美元 是德科技推出XR8示波器應對AI基礎建設挑戰

安立知與高通合作展示7 GHz頻段裝置驗證能力 推動6G無線創新

意法半導體推出首款內建AI加速的車用微控制器Stellar P3E

Mistral AI推出Mistral 3系列開源多語言模型 優化企業級AI效能

賽普拉斯/NVIDIA聯手打造平板觸控螢幕方案

凌華嵌入式MXM圖形模組加速處理邊緣運算

Ansys攜手NVIDIA Omniverse加速自駕車開發

DeepSeek引發喧然大波 草根AI模型還有路要走

西門子推出全新EDA AI系統 提升生產力與加速產品上市速度

ADI推出800 VDC解決方案 支援資料中心高效能AI基礎設施轉型

【填資料抽好禮🎁】Infineon 便攜式儲能解決方案，點亮能源新未來！

【找到你的AI神隊友】立即免費下載，開啟AI智慧應用無限可能

【特輯秘笈】免費下載！連接AI智慧聯網新未來：Wi-Fi 6E/7/8技術關鍵解密

【強檔白皮書下載】馬達驅動器 – 探索電子馬達控制的迷人世界

【免費下載】解鎖政府補助與合作商機：《晶創生態圈資源指南》助您加速創新

碇基半導體總經理邢泰剛：AI電源是氮化鎵的新藍海

不只「聽得見」更能「聽得懂」 AI終端迎來自然語言互動新時代

擺脫硬體代工思維 艾知科技揭示無人機大腦革命

超赫科技總經理吳展興：台灣化合物半導體前景可期

資料中心互連典範轉移中 光循方彥翔：兩大關鍵技術解難題

AI伺服器全面走向液冷 Submer DLC/浸沒式技術兩頭布局

美光推出256GB LPDRAM SOCAMM2 記憶體功耗大幅改善

是德推出次世代Infiniium XR8即時示波器 加速高速數位與合規性測試

稜研科技於MWC 2026展示商用級毫米波相位陣列解決方案 聚焦5G與衛星通訊應用

全球資料中心資本支出預測將達1.2兆美元 是德科技推出XR8示波器應對AI基礎建設挑戰

訊號/電源模擬提升設計成功率 高速設計SIPI模擬應用

精準決策/快速部署/提升能效 資料驅動的電網智慧化轉型

整合布局檢查與電源完整性模擬 FEDS革新PCB與電源設計

掌握光衰/可靠度/突破驗證瓶頸 矽光子與CPO光速量產

當摩爾定律撞上物理牆 台積電A14藉AI破壁而出

美光推出256GB LPDRAM SOCAMM2　記憶體功耗大幅改善

高通號召組成產業聯盟　加速6G研發與全球部署

超微支持Open Telco　加速電信級AI發展

超微/Meta擴大策略合作　啟動6GW GPU規模部署

AI伺服器全面走向液冷　Submer DLC/浸沒式技術兩頭布局

當摩爾定律撞上物理牆　台積電A14藉AI破壁而出

光進銅退勢在必行　愛德萬ATE力助矽光子落地

遠洋貨運走向智慧化/數位化　衛星應用服務價值浮現

決定人機協作成敗的隱形臍帶　工業無線網路部署考驗重重

訊號/電源模擬提升設計成功率　高速設計SIPI模擬應用

精準決策/快速部署/提升能效　資料驅動的電網智慧化轉型

整合布局檢查與電源完整性模擬　FEDS革新PCB與電源設計

掌握光衰/可靠度/突破驗證瓶頸　矽光子與CPO光速量產

資源感知引領未來工廠　製造業數位轉型邁入新階段

FPD製造設備折舊接近完成　OLED、LCD成本壓力大幅緩解

是德推出次世代Infiniium XR8即時示波器　加速高速數位與合規性測試

稜研科技於MWC 2026展示商用級毫米波相位陣列解決方案　聚焦5G與衛星通訊應用

全球資料中心資本支出預測將達1.2兆美元　是德科技推出XR8示波器應對AI基礎建設挑戰

安立知與高通合作展示7 GHz頻段裝置驗證能力　推動6G無線創新

Mistral AI推出Mistral 3系列開源多語言模型　優化企業級AI效能

DeepSeek引發喧然大波　草根AI模型還有路要走

西門子推出全新EDA AI系統　提升生產力與加速產品上市速度

ADI推出800 VDC解決方案　支援資料中心高效能AI基礎設施轉型

不只「聽得見」更能「聽得懂」　AI終端迎來自然語言互動新時代

擺脫硬體代工思維　艾知科技揭示無人機大腦革命

資料中心互連典範轉移中　光循方彥翔：兩大關鍵技術解難題