AWS 宣布推出 Amazon DevOps Guru
西雅圖--今天在 AWS re:Invent 大會上,Amazon.com, Inc. (NASDAQ: AMZN) 旗下公司 Amazon Web Services, Inc. (AWS) 宣布推出完全托管的運營服務 Amazon DevOps Guru使用機器學習,通過自動檢測操作問題并推薦特定的補救措施,讓開發人員更容易提高應用程序的可用性。 Amazon DevOps Guru 應用基于 Amazon.com 和 AWS 多年卓越運營經驗的機器學習來自動收集和分析應用程序指標、日志、事件和跟蹤等數據,以識別偏離正常運營模式的行為(例如,計算能力不足、數據庫 I/O 過度使用、內存泄漏等)。當 Amazon DevOps Guru 識別出可能導致潛在中斷或服務中斷的異常應用程序行為(例如增加的延遲、錯誤率、資源限制等)時,它會向開發人員發出問題詳細信息(例如所涉及的資源、問題時間線、相關事件等)的警報。 ) 通過 Amazon Simple Notification Service (SNS) 和合作伙伴集成(如 Atlassian Opsgenie 和 PagerDuty)幫助他們快速了解問題的潛在影響和可能的原因,并提供具體的補救建議。開發人員可以使用來自 Amazon DevOps Guru 的補救建議來縮短問題出現時的解決時間,并提高應用程序的可用性和可靠性,而無需手動設置或機器學習專業知識。 Amazon DevOps Guru 沒有前期成本或承諾,客戶只需為 Amazon DevOps Guru 分析的數據付費。要開始使用 Amazon DevOps Guru,請訪問
“客戶要求我們繼續圍繞我們可以應用我們自己的專業知識來提高應用程序可用性的領域添加服務,并從我們在運行 Amazon.com 時獲得的多年運營經驗中學習”
隨著越來越多的組織轉向基于云的應用程序部署和微服務架構以在不受本地部署限制的情況下在全球范圍內擴展其業務和運營,應用程序變得越來越分散以滿足客戶需求,開發人員需要更多的自動化實踐來維護應用程序的可用性和減少檢測、調試和解決操作問題所花費的時間和精力。由錯誤代碼或配置更改、不平衡的容器集群或資源耗盡(例如 CPU、內存、磁盤等)導致的應用程序停機事件不可避免地導致糟糕的客戶體驗和收入損失。公司投入大量資金和開發人員時間來部署多個通常單獨管理的監控工具,然后必須針對常見問題(例如負載均衡器錯誤峰值或應用程序請求率下降)開發和維護自定義警報。設置閾值以在應用程序資源行為異常時進行識別和警報很難正確設置,涉及手動設置,并且需要隨著應用程序使用情況的變化(例如,假日購物季節異常大量的請求)必須不斷更新閾值。如果閾值設置得太高,開發人員在操作性能受到嚴重影響之前不會看到警報。當閾值設置得太低時,開發人員會得到太多誤報,最終會被忽略。即使開發人員收到潛在操作問題的警報,確定根本原因的過程仍然很困難。使用現有工具,開發人員通常難以從圖表和警報中確定操作問題的根本原因,即使他們能夠找到根本原因,他們也常常無法解決問題。每次故障排除嘗試都是一個冷啟動,團隊必須花費數小時或數天來識別問題,這會導致耗時、乏味的工作,從而減慢解決操作故障的時間,并可能延長應用程序中斷時間。
Amazon DevOps Guru 的機器學習模型利用了 20 多年為 Amazon.com 構建、擴展和維護高可用性應用程序的運營專業知識。這使 Amazon DevOps Guru 能夠自動檢測操作問題(例如丟失或配置錯誤的警報、資源耗盡的早期警告、可能導致中斷的配置更改等),提供有關資源和相關事件的上下文,并建議補救措施– 無需機器學習經驗。只需在 Amazon DevOps Guru 控制臺中單擊幾下,歷史應用程序和基礎設施指標(如延遲、錯誤率和所有資源的請求率)就會自動獲取和分析,以建立正常的操作范圍,然后 Amazon DevOps Guru 使用預先訓練的機器學習模型來識別與既定基線的偏差。當 Amazon DevOps Guru 分析系統和應用程序數據以自動檢測異常時,它還將這些數據分組為運營洞察力,其中包括異常指標、應用程序行為隨時間變化的可視化以及補救措施建議。 Amazon DevOps Guru 還關聯和分組相關的應用程序和基礎設施指標(例如 Web 應用程序延遲峰值、磁盤空間不足、錯誤代碼部署、內存泄漏等),以減少冗余警報并幫助用戶將注意力集中在高嚴重性問題上。客戶可以查看配置更改歷史記錄和部署事件,以及系統和用戶活動,以在 Amazon DevOps Guru 控制臺中生成可能導致操作問題的優先級列表。為幫助客戶快速解決問題,Amazon DevOps Guru 提供帶有修復步驟的智能建議,并與 AWS Systems Manager 集成以提供運行手冊和協作工具,使客戶能夠更有效地維護應用程序并管理其部署的基礎設施。與 Amazon CodeGuru(一種由機器學習提供支持的開發人員工具,可提供智能建議以提高代碼質量和識別應用程序中最昂貴的代碼行)一起,Amazon DevOps Guru 為客戶提供機器學習對其操作數據的自動化優勢,以便開發人員能夠更多輕松提高應用程序的可用性和可靠性。
亞馬遜副總裁 Swami Sivasubramanian 說:“客戶要求我們繼續圍繞我們可以應用我們自己的專業知識來提高應用程序可用性的領域添加服務,并從我們在運行 Amazon.com 時獲得的多年運營經驗中學習。” Machine Learning, Amazon Web Services, Inc. “借助 Amazon DevOps Guru,我們汲取了我們的經驗并構建了專門的機器學習模型,幫助客戶檢測、排除故障和預防操作問題,同時在出現問題時提供智能建議。這使團隊能夠立即從亞馬遜從運行 Amazon.com 中學到的最佳運營實踐中受益,從而為客戶節省原本用于配置和管理多個監控系統的時間和精力。”
只需在 AWS 管理控制臺中單擊幾下,客戶就可以讓 Amazon DevOps Guru 在幾分鐘內開始分析賬戶和應用程序活動,以提供運營見解。 Amazon DevOps Guru 為客戶提供單一控制臺體驗,通過匯總多個來源(例如 AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray)的相關數據來可視化其運營數據,并減少在多個工具之間切換的需要.客戶還可以在 Amazon DevOps Guru 控制臺中查看相關的操作事件和上下文數據以獲得操作見解,并通過 Amazon SNS 接收警報。此外,Amazon DevOps Guru 通過 AWS 開發工具包支持 API 終端節點,使合作伙伴和客戶可以輕松地將 Amazon DevOps Guru 集成到他們現有的解決方案中,以便針對高嚴重性問題進行工單、尋呼和自動通知工程師。 PagerDuty 和 Atlassian 是已將 Amazon DevOps Guru 集成到其運營監控和事件管理平臺的合作伙伴之一,使用其解決方案的客戶現在可以從 Amazon DevOps Guru 提供的運營洞察中受益。 Amazon DevOps Guru 現已在美國東部(弗吉尼亞北部)、美國東部(俄亥俄)和美國西部(俄勒岡)、亞太地區(新加坡)和歐洲(愛爾蘭)推出預覽版,未來幾個月將在其他區域推出.
超過 170,000 家公司的團隊依靠 Atlassian 產品簡化團隊合作,并幫助他們組織、討論和完成工作。 “Atlassian 很自豪能夠與 AWS 合作推出 Amazon DevOps Guru,并幫助團隊自信地部署代碼和運營服務,”Opsgenie 產品負責人 Emel Dogrusoz 說。 “通過我們新的 Opsgenie 和 Jira Service Management 集成,當 Amazon DevOps Guru 預測潛在問題或確定發生事件時,可以立即通知正確的團隊。 Amazon DevOps Guru 提供了一個新維度的洞察力,而 Atlassian 確保了最快的響應。”
PagerDuty, Inc. (NYSE:PD) 是數字運營管理領域的領導者。 PagerDuty 產品高級副總裁 Jonathan Rende 說:“PagerDuty 旨在通過自動化整個事件響應生命周期和解決方案來推動向 DevOps 文化的轉變。” “我們很高興通過與 Amazon DevOps Guru 的最新集成來繼續對 DevOps 的承諾。利用 Amazon 數十年的卓越運營和 Amazon DevOps Guru 的機器學習能力,PagerDuty 為我們的共同客戶提供了更多實時信號到行動的能力。通過 PagerDuty 引入 Amazon DevOps Guru 的 Amazon SNS,AWS 客戶可以在運營問題成為影響客戶的中斷之前對其采取實時行動。”
Thomson Reuters 是世界上最值得信賴的答案提供商之一,幫助專業人士做出自信的決策并經營更好的業務。 “客戶體驗對我們至關重要。在嘗試預防和減輕影響我們客戶的事件時,處理可用性、性能和變更請求的多個警報源可能是一項挑戰,”湯森路透基礎設施托管產品組合總監 Steve Thoennes 說。 “我們很高興使用 Amazon DevOps Guru 并利用其機器學習洞察力提供清晰的行動路徑,使我們能夠快速緩解問題并避免影響客戶的事件。與 PagerDuty 的集成是一個好處,因為我們可以及時有效地向合適的人提供建議。”SmugMug 是一個付費圖片分享服務、圖片托管服務和在線視頻平臺,用戶可以在上面上傳照片和視頻。該公司為業余和專業攝影師銷售數字和印刷媒體提供便利。 SmugMug 運營總監 Andrew Shieh 說:“我的團隊遵循終身運營的座右銘,我們一直在尋找自動化手動活動的方法。” “借助 Amazon DevOps Guru,我們希望實現這一目標,讓 AIOps 接管我們的許多日常任務,讓我們的工作日由單個 George-Jetson 風格的 Easy Button 組成,這樣我的團隊就可以專注于 IT 創新.我們現在不僅能夠滿足業務需求,而且能夠超越它們,因為我們有更多時間專注于最重要的事情——為我們的組織和客戶創造價值。”
NextRoll 通過授權市場和營銷平臺構建和增強其營銷解決方案來幫助他們增加收入。 “我們運行了數千個 Amazon Elastic Compute Cloud (Amazon EC2) 實例,我們正在尋找方法來減少我的團隊在解決運營問題上所花費的時間,”NextRoll 首席技術官 Valentino Volonghi 說。 “我們很高興能夠使用 Amazon DevOps Guru 并利用其機器學習驅動的洞察力來幫助我們識別、關聯和修復運營問題并提供建議。這將幫助我的團隊節省時間并減少我們的平均恢復時間。”
關于亞馬遜網絡服務
14 年來,Amazon Web Services 一直是世界上最全面、應用最廣泛的云平臺。 AWS 為計算、存儲、數據庫、網絡、分析、機器人、機器學習和人工智能 (AI)、物聯網 (IoT)、移動、安全、混合、虛擬和增強現實(VR 和 AR)提供超過 175 項功能齊全的服務)、媒體和應用程序開發、部署和管理,來自 24 個地理區域內的 77 個可用區 (AZ),并已宣布計劃在印度、印度尼西亞、日本、西班牙和瑞士再增加 15 個可用區和 5 個 AWS 區域。數以百萬計的客戶(包括發展最快的初創公司、最大的企業和領先的政府機構)信任 AWS 來支持他們的基礎設施、變得更加敏捷并降低成本。要了解有關 AWS 的更多信息,請訪問 aws.amazon.com。
關于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發明的熱情、對卓越運營的承諾以及長期思考。客戶評論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 只是亞馬遜開創的部分產品和服務。欲了解更多信息,請訪問并關注@AmazonNews。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部