AWS 宣布具有 EC2 UltraClusters 功能的 Amazon EC2 P4d 實例全面上市
西雅圖--今天,Amazon.com 公司(納斯達克股票代碼:AMZN)旗下的 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Elastic Compute Cloud (Amazon EC2) P4d 實例,這是下一代的與上一代 P3 實例相比,GPU 驅動的實例為機器學習訓練和高性能計算 (HPC) 工作負載提供 3 倍更快的性能、高達 60% 的成本以及 2.5 倍的 GPU 內存。 P4d 實例具有 8 個 NVIDIA A100 Tensor Core GPU 和 400 Gbps 的網絡帶寬(比 P3 實例多 16 倍)。使用具有 AWS 的 Elastic Fabric Adapter (EFA) 和 NVIDIA GPUDirect RDMA(遠程直接內存訪問)的 P4d 實例,客戶能夠創建具有 EC2 UltraClusters 功能的 P4d 實例。借助 EC2 UltraClusters,客戶可以將 P4d 實例擴展到超過 4,000 個 A100 GPU(是任何其他云提供商的兩倍),方法是利用 AWS 設計的與 Amazon FSx 集成的非阻塞 PB 級網絡基礎設施實現 Lustre 高性能存儲,提供按需訪問超級計算級性能,以加速機器學習訓練和 HPC。要開始使用 P4d 實例,請訪問:
AWS 宣布推出由具有 UltraClusters 功能的 NVIDIA A100 GPU 提供支持的 EC2 P4d 實例,用于機器學習訓練和 HPC。
數據科學家和工程師通過創建更大、更復雜的模型來繼續突破機器學習的界限,這些模型為廣泛的用例提供更高的預測精度,包括自動駕駛汽車的感知模型訓練、自然語言處理、圖像分類、對象檢測和預測分析。針對大量數據訓練這些復雜模型是一項計算、網絡和存儲密集型任務,通常需要數天或數周時間。客戶不僅希望縮短訓練模型的時間,而且還希望降低總體訓練支出??偟膩碚f,長訓練時間和高成本限制了客戶訓練模型的頻率,這意味著機器學習的開發和創新速度較慢。
P4d 實例性能的提高可將機器學習模型的訓練時間縮短多達 3 倍(將訓練時間從幾天縮短到幾小時),額外的 GPU 內存可幫助客戶訓練更大、更復雜的模型。隨著數據變得越來越豐富,客戶正在訓練具有數百萬甚至數十億參數的模型,例如用于文檔摘要和問答的自然語言處理、自動駕駛汽車的對象檢測和分類、大規模內容審核的圖像分類、推薦電子商務網站的引擎和智能搜索引擎的排名算法——所有這些都需要增加網絡吞吐量和 GPU 內存。 P4d 實例在一個 EC2 實例中配備 8 個 NVIDIA A100 Tensor Core GPU,能夠實現高達 2.5 petaflops 的混合精度性能和 320 GB 的高帶寬 GPU 內存。 P4d 實例是業內首個通過 Elastic Fabric Adapter (EFA) 和 NVIDIA GPUDirect RDMA 網絡接口提供 400 Gbps 網絡帶寬的實例,可在服務器之間實現 GPU 之間的直接通信,從而降低延遲并提高擴展效率,有助于消除跨多個服務器的擴展瓶頸-node 分布式工作負載。每個 P4d 實例還提供 96 個 Intel Xeon Scalable (Cascade Lake) vCPU、1.1 TB 系統內存和 8 TB 本地 NVMe 存儲,以減少單節點訓練時間。通過將上一代 P3 實例的性能提高一倍以上,P4d 實例可以將訓練機器學習模型的成本降低多達 60%,從而為客戶提供比昂貴且不靈活的本地系統更高的效率。 HPC 客戶還將受益于 P4d 提高的處理性能和 GPU 內存,適用于地震分析、藥物發現、DNA 測序、材料科學以及金融和保險風險建模等要求苛刻的工作負載。
P4d 實例還基于 AWS Nitro 系統構建,AWS 設計的硬件和軟件使 AWS 能夠向客戶提供越來越廣泛的 EC2 實例和配置選擇,同時提供與裸機無法區分的性能,提供快速存儲和網絡,并確保更安全的多租戶。 P4d 實例將網絡功能卸載到專用 Nitro 卡上,從而加速多個 P4d 實例之間的數據傳輸。 Nitro 卡還支持 EFA 和 GPUDirect,這允許 GPU 之間的直接跨服務器通信,從而促進 P4d 實例的 EC2 UltraCluster 之間的更低延遲和更好的擴展性能。這些 Nitro 支持的功能使客戶能夠在 EC2 UltraClusters 中啟動 P4d,并按需和可擴展地訪問 4,000 多個 GPU,以實現超級計算機級性能。
“我們的客戶使用 AWS 服務構建、訓練和部署機器學習應用程序的速度非常快。與此同時,我們從這些客戶那里聽說,他們想要一種成本更低的方式來訓練他們的大型機器學習模型,”AWS EC2 副總裁 Dave Brown 說。 “現在,借助由 NVIDIA 最新 A100 GPU 和 PB 級網絡提供支持的 P4d 實例的 EC2 UltraClusters,我們正在為幾乎所有人提供超級計算級性能,同時將訓練機器學習模型的時間縮短 3 倍,并降低成本與上一代實例相比,最多可訓練 60%。”
客戶可以使用 AWS Deep Learning Containers 在 P4d 實例上運行容器化應用程序,其中包含適用于 Amazon Elastic Kubernetes Service (Amazon EKS) 或 Amazon Elastic Container Service (Amazon ECS) 的庫。為了獲得更全面的托管體驗,客戶可以通過 Amazon SageMaker 使用 P4d 實例,從而為開發人員和數據科學家提供快速構建、訓練和部署機器學習模型的能力。 HPC 客戶可以利用帶有 P4d 實例的 AWS Batch 和 AWS ParallelCluster 來幫助高效地編排作業和集群。 P4d 實例支持所有主要的機器學習框架,包括 TensorFlow、PyTorch 和 Apache MXNet,讓客戶可以靈活地選擇最適合其應用程序的框架。 P4d 實例已在美國東部(弗吉尼亞北部)和美國西部(俄勒岡)推出,并計劃很快在其他區域推出。 P4d 實例可以按需購買、使用 Savings Plans、使用預留實例或作為 Spot 實例購買。
GE Healthcare 是 GE 價值 167 億美元的醫療保健業務。作為全球領先的醫療技術和數字解決方案創新者,GE Healthcare 使臨床醫生能夠在其 Edison 智能平臺的支持下,通過智能設備、數據分析、應用程序和服務做出更快、更明智的決策。 “在 GE Healthcare,我們為臨床醫生提供工具,幫助他們匯總數據、將 AI 和分析應用于該數據,并發現可改善患者結果、提高效率和消除錯誤的見解,”人工智能副總裁兼總經理 Karley Yoder 說。 GE醫療。 “我們的醫學成像設備會產生大量數據,需要我們的數據科學家處理。使用以前的 GPU 集群,訓練復雜的 AI 模型(例如 Progressive GAN)需要數天時間才能進行模擬并查看結果。使用新的 P4d 實例將處理時間從幾天縮短到幾小時。我們發現,在訓練具有各種圖像大小的模型時速度提高了兩到三倍,同時通過增加批量大小實現了更好的性能,并通過更快的模型開發周期實現了更高的生產力?!?/p>
豐田研究院 (TRI) 成立于 2015 年,致力于為豐田開發自動駕駛、機器人和其他人體放大技術。 “在 TRI,我們正在努力打造一個人人都可以自由行動的未來,”TRI 基礎設施工程技術主管 Mike Garrison 說。 “上一代 P3 實例幫助我們將機器學習模型的訓練時間從幾天縮短到幾小時,我們期待使用 P4d 實例,因為額外的 GPU 內存和更高效的浮點格式將使我們的機器學習團隊能夠訓練更多以更快的速度完成復雜模型?!?/p>
怡安是一家全球領先的專業服務公司,提供廣泛的風險、退休和健康解決方案。 Aon PathWise 是一種基于 GPU 且可擴展的 HPC 風險管理解決方案,保險公司和再保險公司、銀行和養老基金可以使用它來應對當今的關鍵挑戰,例如對沖策略測試、監管和經濟預測以及預算編制。 “Aon PathWise 允許(再)保險公司和養老基金使用下一代技術,以快速解決當今的關鍵保險挑戰,例如對沖策略測試、監管和經濟預測以及預算編制,”PathWise 總裁兼首席執行官 Peter Phillips 說。 “通過使用具有 2.5 petaflops 混合精度性能的 AWS P4d 實例,我們能夠在不損失性能的情況下為客戶提供兩倍的成本降低,并且可以為最苛刻的要求提供 2.5 倍的速度提升計算。速度很重要,借助 AWS 的新實例,我們繼續讓客戶滿意。”Rad AI 由放射科和人工智能專家組成,構建的產品可最大限度地提高放射科醫師的工作效率,最終使醫療保健更廣泛地獲得并改善患者的治療效果。 “在 Rad AI,我們的使命是為每個人增加醫療保健的可及性和質量。 Rad AI 專注于醫學成像工作流程,可以節省放射科醫生的時間、減少倦怠并提高準確性,”Rad AI 聯合創始人 Doktor Gurson 說。 “我們使用人工智能來自動化放射學工作流程并幫助簡化放射學報告。借助新的 EC2 P4d 實例,我們看到了比上一代 P3 實例更快的推理速度和 2.4 倍的模型訓練速度和更高的準確度。這允許更快、更準確的診斷,以及更多地獲得我們在美國的客戶提供的高質量放射服務。”
OmniSci 是加速分析的先驅。 OmniSci 平臺用于商業和政府部門,以發現超出主流分析工具限制的數據洞察力。 “在 OmniSci,我們正在努力打造一個數據科學和分析融合以打破和融合數據孤島的未來。客戶正在利用他們的海量數據,其中可能包括位置和時間,通過時空數據的精細可視化,不僅可以全面了解正在發生的事情,還可以了解何時何地。我們的技術可以看到森林和樹木,”OmniSci 美國公共部門副總裁 Ray Falcione 說。 “通過使用 P4d 實例,與上一代 GPU 實例相比,我們能夠顯著降低部署平臺的成本,從而使我們能夠經濟高效地擴展海量數據集。 A100 的網絡改進提高了我們擴展到數十億行數據的效率,并使我們的客戶能夠更快地收集洞察力?!?/p>
Zenotech Ltd 正在通過使用 HPC 云重新定義在線工程,提供按需許可模型以及利用 GPU 帶來的極致性能優勢。 “在 Zenotech,我們正在開發工具,使設計師能夠創造出更高效、更環保的產品。我們跨行業開展工作,我們的工具通過使用大規模仿真提供更深入的產品性能洞察力,”Zenotech 董事兼聯合創始人 Jamil Appa 說。 “與上一代 GPU 相比,使用 P4d 實例使我們能夠將模擬運行時間減少 65%。這種加速大大縮短了我們解決問題的時間,使我們的客戶能夠比以前更快地將設計推向市場或進行更高保真度的仿真。”
關于亞馬遜網絡服務
14 年來,Amazon Web Services 一直是世界上最全面、應用最廣泛的云平臺。 AWS 為計算、存儲、數據庫、網絡、分析、機器人、機器學習和人工智能 (AI)、物聯網 (IoT)、移動、安全、混合、虛擬和增強現實(VR 和 AR)提供超過 175 項功能齊全的服務)、媒體和應用程序開發、部署和管理,來自 24 個地理區域內的 77 個可用區 (AZ),并宣布計劃在印度尼西亞、日本、西班牙和瑞士再增加 12 個可用區和四個 AWS 區域。數以百萬計的客戶(包括發展最快的初創公司、最大的企業和領先的政府機構)信任 AWS 來支持他們的基礎設施、變得更加敏捷并降低成本。
關于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發明的熱情、對卓越運營的承諾以及長期思考??蛻粼u論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 是亞馬遜率先推出的一些產品和服務。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部