AMD Instinct MI300X 加速器為 Microsoft Azure OpenAI 服務和新的 Azure ND MI300X V5 虛擬機提供支援

關鍵字 :AMDMI300X OpenAI
AMD Instinct MI300X 加速器正在科技界引起轟動,尤其在人工智慧(AI)領域。這些加速器與 AMD 的 ROCm 開放軟體 搭配使用,旨在處理一些最具挑戰性的 AI 工作負載,包括微軟 Azure 的 OpenAI 服務。

AMD 總裁 Victor Peng 表示,AMD Instinct MI300X 與 ROCm 軟體堆疊助力執行 Azure OpenAI Chat GPT 3.5 與 4 版本服務,處理許多全球要求最嚴苛的 AI 工作負載。在 Azure 全新 VM 全面上線後,AI 客戶可更廣泛地透過 MI300X 為 AI 應用帶來高效能與高效率的解決方案。

CEO

微軟在 Azure 雲端虛擬機器上採用了 AMD Instinct MI300X 加速器,並取得了一些顯著的優點:

  1. 領先性價比:AMD Instinct MI300X 加速器與 ROCm 軟體堆疊協助執行 Azure OpenAI Chat GPT 3.5 與 4 版本服務,處理許多全球要求最嚴苛的 AI 工作負載。在 Azure 全新虛擬機器全面上線後,AI 客戶可以更廣泛地透過 MI300X 為 AI 應用帶來高效能與高效率的解決方案。
  2. 節省成本與功耗:這些虛擬機器具有領先業界的效能,並提供令人印象深刻的 HBM 儲存容量與記憶體頻寬。客戶可以在 GPU 記憶體中安裝更大的模型,或減少使用 GPU,從而節省功耗與成本,同時加速解決方案進程。
  3. 支援 GPT 模型:這些虛擬機器不僅用於 Azure AI 生產力工作負載,包括讓客戶能使用 GPT-3.5 與 GPT-4 模型的 Azure OpenAI 服務,還被 Hugging Face 等客戶採用。Hugging Face 僅花了一個月就將其模型遷移到 ND MI300X VM 上,使其模型達到令人驚豔的效能與性價比。

此外,微軟也選用了 AMD Alveo MA35D 媒體加速器 執行 Microsoft Teams、SharePoint Video 等即時視訊工作負載。Alveo MA35D 為支援大規模即時互動串流服務量身打造,將協助微軟透過影片轉碼、解碼、編碼以及自行調適位元速率(adaptive bitrate,ABR)串流等串流影片處理工作負載,確保高品質視訊體驗。

這些技術的進步將有助於推動視訊服務和企業運算,並為 AI 領域帶來更多創新與效能。

★博文內容參考自 網站,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★博文作者未開放評論功能

參考來源

AMD: https://www.amd.com/en/newsroom/press-releases/2024-5-21-amd-instinct-mi300x-accelerators-power-microsoft-a.html