Mistral AI推出Mistral 3系列開源多語言模型 優化企業級AI效能

Mistral AI今日宣布推出Mistral 3系列開源多語言、多模態模型,該系列模型針對NVIDIA超級運算與邊緣平台進行最佳化。 Mistral Large 3為混合專家(MoE)模型,無需為每個詞元啟動所有神經元,而是僅啟動模型中最具影響力的部分。此設計在不浪費資源的情況下實現規模化,並在不犧牲準確性的前提下實現高效運作,使企業級人工智慧(AI)具備真正實用性。...
2025 年 12 月 03 日

更懂台灣、口音更親切 繁中強化AI多模態語言模型全面開源

目前全球熱門AI大語言模型(LLM)大多較「擅長」英文或簡體中文,台灣晶片設計大廠聯發科技旗下的聯發創新基地(MediaTek Research)在2月中正式發表並全面開源其最新的多模態基礎模型群——MediaTek...
2025 年 02 月 26 日

Meta推出新一代Llama 3模型 AWS/NVIDIA旋即力挺

Meta宣布釋出第一波Llama 3大語言模型,包含8B(80億)與70B(700億)兩個版本。除了兩個不同參數規模的預訓練模型外,亦提供經過指令微調的模型版本,可支援更多元的使用情境。新一代Llama在多項產業指標上展現了卓越的成效,並提供許多新的功能,包括更精準的推理能力,是目前同業中最佳的開源模型。此外,延續Meta長期以來的開放創新模式,Llama...
2024 年 04 月 19 日