AWS推出新一代自研晶片

2023 年 12 月 01 日

亞馬遜(Amazon)旗下Amazon Web Services(AWS)於AWS re:Invent上宣布，自研晶片的兩個系列推出新一代，包括AWS Graviton4和AWS Trainium2，為機器學習(ML)訓練和生成式人工智慧(AI)應用等廣泛的工作負載提供更高性價比和效能。

Graviton4和Trainium2是AWS自研晶片的最新創新，AWS每一代自研晶片都持續提升性價比和效能，為客戶提供了使用AMD、Intel以及NVIDIA等最新晶片和執行個體組合之外的更多選擇，進而使Amazon Elastic Compute Cloud(Amazon EC2)可以為客戶虛擬運行幾乎所有應用和工作負載。

Graviton4與前一代Graviton3處理器相比，效能提升30%，獨立核心增加50%以上，記憶體頻寬提升75%以上，為在Amazon EC2上運行的工作負載提供最佳效能和能源效率；Trainium2與第一代Trainium晶片相比訓練速度提升4倍，並能在EC2 UltraClusters中部署100,000個晶片，可以在極短的時間訓練基礎模型(FMs)和大語言模型(LLMs)，同時能源效率提升2倍。

AWS運算與網路服務副總裁David Brown表示，晶片是客戶所有工作負載的基礎，透過將晶片設計聚焦於客戶真正關心的實際工作負載，AWS能夠為客戶提供先進的雲端基礎設施。Graviton4是AWS推出的同系列第四代，是AWS至今功能最強大和最具能源效率的晶片，支援客戶廣泛的工作負載。隨著生成式AI引起廣大的關注，Tranium2可以幫助客戶以更低的成本和更佳的能源效率，更快地訓練機器學習模型。

如今，AWS在全球大規模提供的使用Graviton的Amazon EC2執行個體種類達150多個，已經建構的Graviton處理器數量超過200萬個，並擁有超過50,000客戶。這些客戶涵蓋了EC2最大的前100個客戶，他們應用使用Graviton的執行個體獲得最佳的性價比。Datadog、DirecTV、Discovery、Formula 1(F1)、NextRoll、Nielsen、Pinterest、SAP、Snowflake、Sprinklr、Stripe以及Zendesk等客戶正採用使用Graviton的執行個體運行廣泛的工作負載，包括資料庫、資料分析、網路服務器、批次處理、廣告服務、應用伺服器以及微服務等。

隨著客戶把更大的記憶體資料庫和分析工作負載遷移到雲端，對運算、記憶體、儲存和網路的要求也隨之增加。為此，客戶需要更高效能和更大的執行個體來運行這些要求嚴苛的工作負載，同時需要優化成本。針對這些工作負載，客戶還希望能使用更加節能的運算資源，減少對環境的影響。目前，很多AWS的託管服務都支援使用Graviton，包括Amazon Aurora、Amazon ElastiCache、Amazon EMR、Amazon MemoryDB、Amazon OpenSearch、Amazon Relational Database Service (Amazon RDS)、AWS Fargate 以及AWS Lambda等，將Graviton的性價比優勢帶給使用這些服務的客戶。

Graviton4處理器相比Graviton3處理器效能提升30%，獨立核心增加50%以上，記憶體頻寬提升75%以上。Graviton4還進一步透過完全加密高速物理硬體介面提升了安全性。Amazon EC2 R8g記憶體優化執行個體將採用最新的Graviton4，提升客戶運行高效能資料庫、記憶體緩存、大數據分析等工作負載的效率。

R8g執行個體相比前一代R7g執行個體提供更大的執行個體大小，虛擬處理器(vCPU)以及記憶體均提升了3倍。這讓使用者可以處理更大量的資料、更大規模的工作負載、更快獲得運行結果，並降低擁有權總成本。使用Graviton4的R8g執行個體現已提供預覽版，並將在未來幾個月推出正式可用版。

如今日益增加的生成式AI應用背後的基礎模型和大語言模型需要使用海量的資料進行訓練。這些模型透過創造文字、音訊、圖片、影片、甚至軟體程式碼等大量新的內容，幫助客戶重構使用者體驗。當今最先進的基礎模型和大語言模型通常包含數千億甚至數萬億個參數或變數，需要能夠支援上萬機器學習晶片進行擴展的可靠高效能運算能力。AWS現已提供廣泛而深入的機器學習晶片支援的Amazon EC2執行個體選項，包括最新的NVIDIA GPU、Trainium以及Inferentia2。

Databricks、Helixon、Money Forward以及Amazon Search團隊等眾多客戶都在使用Trainium訓練大規模深度學習模型，受益於Trainium的高效能、可擴展、可靠以及低成本等諸多優勢。然而即便已經在使用當今最快的加速執行個體，客戶仍然希望獲得更強的效能和規模來訓練這些日益複雜的模型，提高訓練速度、降低成本，同時降低能源消耗。

Trainium2晶片專為以高效能訓練具有數萬億個參數或變數的基礎模型和大語言模型而打造。Trainium2與第一代Trainium晶片相比，效能提升4倍，記憶體提升3倍，能源效率(每瓦效能)提升2倍。Amazon EC2 Trn2執行個體採用最新的Trainium2，一個單獨執行個體包含16個Trainium加速晶片。

Trainium2執行個體致力於為客戶在新一代EC2 UltraClusters中擴展100,000個Trainium2加速晶片，並與AWS Elastic Fabric Adapter(EFA)PB級網路互連，提供的產能達65exaflops(exaflops指10的18次方)，客戶可按需獲得超級運算級別的效能。有了這個級別的規模，客戶可在數週而非數月就能訓練完成一個具有3千億參數的大語言模型。透過顯著降低的成本提供最高橫向擴展的模型訓練，Trainum2執行個體可以幫助客戶開啟並加速生成式AI的新一輪創新。

Anthropic是一家AI安全和研究公司，是負責任地部署生成式AI的主要推廣者，致力於打造可靠、可判斷和可控的AI系統。Anthropic自2021年開始使用AWS，近期Anthropic推出了Claude，一款專注於提供幫助、無害且誠實的AI助手。Anthropic聯合創辦人Tom Brown表示，自支援Amazon Bedrock以來，Claude已獲得AWS客戶的廣泛採用。Trainium2將幫助該公司大規模建構和訓練模型，對於一些工作負載，Trainium2相比第一代Trainium晶片速度提升了至少4倍。Anthropic與AWS的合作，將助力各種規模的組織有機會同時受益於Anthropic安全並先進的AI系統以及AWS可靠的雲端技術，進而開創新的可能性。

Databricks幫助全球超過10,000家組織機構，包括Comcast、Condé Nast及50%以上的財富500強企業，統一資料、分析和運用AI。Databricks生成式AI副總裁Naveen Rao表示，數千家客戶在AWS上運用Databricks，使用MosaicML對各種用例的基礎模型進行預先訓練、微調及其他操作。AWS Trainium為Databricks提供了訓練Mosaic MPT模型所需要的規模、高效能以及低成本。Trainium2使更快地建構下一代Mosaic MPT模型成為可能，讓Databricks有機會為客戶提供前所未有的規模和效能，助力他們比以往更快地推出自己的生成式AI應用。

標籤

近期研討會 More

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

慧榮UFS方案通過高通數位座艙平台驗證

艾飛思成為台灣及亞洲首家PCI-SIG認證實驗室

慧與科技與NVIDIA推出全新AI工廠解決方案 加速各行業AI應用

超微執行長蘇姿丰：開放是超微一路走來的信念

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

表前儲能通過實戰驗證 能源署三管齊下推動表後儲能

技術創新持續推進 全球RAN設備市場回穩

多重挑戰宇宙來襲 半導體產業打造韌性供應鏈

災難時刻不斷線：民間社群發力 織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大 純視覺路線成本效益突出

樹莓派從碳移除到全球銷售

SRAM微縮面臨瓶頸 SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動 智慧運輸車解決偏鄉醫療痛點

全球個人電腦供應鏈轉向東南亞 生產基地多元化應對關稅風險

手機SoC製程節點轉移加速 2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動 1Q25全球前十大IC設計廠營收季增6%

超越生產力：人工智慧重塑下一代平板電腦

MicroLED應用場景擴展 透明及非顯示技術帶來新商機

ROHM第4代SiC MOSFET助力TOYOTA全新跨界電動車「bZ5」性能提升

Ceva推出新一代動作控制軟體MotionEngine Hex 實現智慧電視精準互動

Holtek推出HT16K24整合LCD控制及驅動IC 支援160點顯示及24鍵輸入

Holtek推出BS23B16CA Touch I/O OTP MCU 擴展至16 Key應用

PANJIT推出175°C高結溫HULV超低VF橋式整流器系列 提升高效能功率整流技術

AWS推出新一代自研晶片

恩智浦/AWS共拓聯網汽車商機

晶心RISC-V平台獲Amazon FreeRTOS資格

AMD/AWS透過第4代AMD EPYC處理器重新定義雲端效能

Ansys宣布AnsysGPT虛擬助理進入測試階段

數產署/資策會運用AWS技術攜手伊雲谷為企業打造競爭力

安提導入Super Mode技術提升模組AI推論效能

【重磅白皮書】免費下載！8位產業專家探討儀器儀錶在現代技術中的作用

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

【成功案例分享】即刻下載！ROHM使用Siemens Tanner提供一流的dual MOSFET元件

超微執行長蘇姿丰：開放是超微一路走來的信念

Quobly共同創辦人暨執行長Maud Vinet：量子運算不是贏者全拿

英特爾散熱技術經理莊騏鴻：高功耗時代散熱技術的轉型路徑

Perstorp業務發展總監曾偉銓：散熱技術臨界點下的合成酯突圍戰略

金運營運長郭丁賀：八年前瞻布局液冷技術，領航AI時代散熱

超微執行長蘇姿丰：開放是超微一路走來的信念

ROHM第4代SiC MOSFET助力TOYOTA全新跨界電動車「bZ5」性能提升

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

Ceva推出新一代動作控制軟體MotionEngine Hex 實現智慧電視精準互動

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

表前儲能通過實戰驗證 能源署三管齊下推動表後儲能

技術創新持續推進 全球RAN設備市場回穩

自動駕駛感測融合限制大 純視覺路線成本效益突出

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

慧與科技與NVIDIA推出全新AI工廠解決方案　加速各行業AI應用

表前儲能通過實戰驗證　能源署三管齊下推動表後儲能

技術創新持續推進　全球RAN設備市場回穩

多重挑戰宇宙來襲　半導體產業打造韌性供應鏈

災難時刻不斷線：民間社群發力　織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大　純視覺路線成本效益突出

SRAM微縮面臨瓶頸　SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動　智慧運輸車解決偏鄉醫療痛點

全球個人電腦供應鏈轉向東南亞　生產基地多元化應對關稅風險

手機SoC製程節點轉移加速　2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動　1Q25全球前十大IC設計廠營收季增6%

MicroLED應用場景擴展　透明及非顯示技術帶來新商機

Ceva推出新一代動作控制軟體MotionEngine Hex　實現智慧電視精準互動

PANJIT推出175°C高結溫HULV超低VF橋式整流器系列　提升高效能功率整流技術

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

Ceva推出新一代動作控制軟體MotionEngine Hex　實現智慧電視精準互動

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

表前儲能通過實戰驗證　能源署三管齊下推動表後儲能

技術創新持續推進　全球RAN設備市場回穩

自動駕駛感測融合限制大　純視覺路線成本效益突出