AWS 宣布全面推出 Amazon Textract
西雅圖--今天,Amazon.com 公司(納斯達克股票代碼:AMZN)旗下的 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon Textract,這是一項使用機器學習自動提取文本的完全托管服務和數據,包括來自表格和表格的數據,幾乎可以在任何文檔中使用,無需人工審核、自定義代碼或機器學習經驗。 Amazon Textract 不僅可以識別簡單的光學字符識別 (OCR),還可以識別表單中字段的內容、存儲在表格中的信息以及顯示信息的上下文,例如稅表或產品中的姓名或社會保險號庫存報告中倉庫中的 SKU 或數量。提取的文本和數據可以很容易地用于對大型文檔檔案進行智能搜索,或者可以加載到數據庫中供應用程序使用,例如會計、審計和合規軟件。 Amazon Textract 的 API 支持多種圖像格式,如掃描、PDF 和照片,客戶可以將其與 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena 等數據庫和分析服務以及 Amazon Comprehend、Amazon Comprehend Medical、Amazon 等其他機器學習服務一起使用Translate 和 Amazon SageMaker 從提取的文本和數據中獲取更深層次的含義。要開始使用 Amazon Textract,請訪問 。
“我們已經使用 Amazon Textract 代表金融機構分析了數以萬計的貸款文件,并且我們自己的軟件即服務產品通過該服務得到了增強,使我們能夠識別 95% 的貸款缺陷應用程序包并幫助銀行減少手動數據輸入”
許多公司通過手動數據輸入或簡單的 OCR 軟件從合同、費用報告、抵押擔保、基金招股說明書、稅務文件、醫院索賠和患者表格等文件中提取文本和數據。這是一個耗時且通常不準確的過程,它產生的輸出需要大量的后處理,然后才能以其他應用程序可用的格式放置。這是因為現有的 OCR 技術無法識別表單和表格等常見布局,只能生成冗長且通常不準確的文本轉儲。相反,組織想要的是能夠從任何格式的文檔以及各種文件類型和模板中的表單和表格中準確識別和提取文本和數據。 Amazon Textract 幾乎可以分析任何類型的文檔,自動生成高度準確的文本、表單和表格數據。 Amazon Textract 識別文檔中表格和表格中的文本和數據(例如拍攝收據中的行項目和總計、W2 中的稅務信息或掃描庫存報告中表格中的值)并識別一系列文檔格式,包括那些特定于金融服務、保險和醫療保健的產品,無需任何定制或人工干預。 Amazon Textract 讓客戶可以在短短幾個小時內輕松準確地處理數百萬個文檔頁面,顯著降低文檔處理成本,讓客戶專注于從文本和數據中獲取商業價值,而不是在后期處理上浪費時間和精力.結果通過 API 交付,無需任何機器學習經驗即可輕松訪問和使用。
“Amazon Textract 的強大之處在于它可以準確地從幾乎任何文檔中提取文本和結構化數據,而無需機器學習經驗。隨后,開發人員可以使用我們的數據庫和分析服務(如 Amazon Elasticsearch Service、Amazon DynamoDB 和 Amazon Athena)分析和查詢提取的文本和數據,并與 Amazon Comprehend、Amazon Comprehend Medical、Amazon Translate 和 Amazon SageMaker 等其他機器學習服務集成幫助客戶從提取的文本和數據中獲得更深層次的意義,”亞馬遜機器學習副總裁 Swami Sivasubramanian 說。 “除了與其他 AWS 服務的集成之外,圍繞 Amazon Textract 開發的豐富合作伙伴社區使客戶能夠從他們的文件集合中獲得真正的意義、更高效地運營、提高安全合規性、自動化數據輸入并促進更快的業務決策。”
Amazon Textract 獲取存儲在 Amazon S3 存儲桶中的掃描文件,讀取它們,并以帶有頁碼、部分、表單標簽和數據類型注釋的 JSON 文本的形式返回數據。然后,這些數據可用于一系列應用(例如生成智能搜索索引、編輯大量表單中的文本、創建自動貸款審批工作流程、使用數據進行監管合規以及標記保險索賠的欺詐風險)。客戶可以將數據加載到電子表格、數據庫和工資系統等業務軟件中,也可以使用 Amazon ElasticSearch、Amazon DynamoDB、Amazon Redshift 或 Amazon Athena 分析和查詢數據。 Amazon Textract 現已在美國東部(俄亥俄)、美國東部(弗吉尼亞北部)、美國西部(俄勒岡)、歐洲(愛爾蘭)推出,明年將擴展到其他區域。
The Globe and Mail 是加拿大的標志性媒體和加拿大最知名的媒體品牌。 “作為一家新聞媒體公司,我們依賴于許多 PDF 或掃描源文檔,例如 FOI(信息請求自由),這些文檔在我們以前無法訪問的表格中包含重要信息,”總經理 Michael O'Neill 說The Globe and Mail 的數字和數據科學部主任。“這些文件未被充分利用,因為記者無法輕松訪問它們或不知道它們的存在。使用 Amazon Textract,我們能夠從 PDF 中的表格中提取信息并將這些數據輕松輸出到 CSV,并通過讓我們的記者可以搜索查詢來輕松訪問這些文檔。這將我們的記者獲取信息的效率提高了十倍。”
Met Office 是英國的國家氣象服務機構,在提供天氣和氣候服務方面處于世界領先地位。 “我們希望使用 AmazonTextract 將來自文檔檔案的數百萬歷史天氣觀測數據數字化,”氣象局氣候科學家 Philip Brohan 說。“將這些觀測數據提供給科學界將提高我們對氣候變率和變化的理解。”
普華永道通過提供質量保證、稅務和咨詢服務來幫助組織和個人創造價值。 “在普華永道,我們致力于為客戶提供智能自動化工具,幫助改變以前的手動流程。我們已將 Amazon Textract 集成到我們的制藥行業解決方案中,以自動處理各種 FDA 表格(如 MedWatch 和 CIOMS)的文檔,”普華永道的 Siddhartha Bhattacharya 說。 “以前,人們會手動審查、編輯和處理這些表格,每一個都需要幾個小時。事實證明,Amazon Textract 是可用于這些表單的最高效、最準確的 OCR 解決方案,它提取所有相關信息以供審查和處理,并將花費的時間從幾小時縮短到幾分鐘。”
Healthfirst 是一家非營利性管理式醫療組織,也是紐約發展最快的健康計劃之一,擁有超過 140 萬多元化成員以及由 35,000 多名提供者和 4,500 名員工組成的網絡。 “在 Healthfirst,我們正在構建數據管道,將掃描的醫療圖表轉化為有用的臨床信息,以改善護理協調,推動質量結果,并確保為我們覆蓋的成員提供適當的報銷,”Healthfirst 首席分析官 Steve Prewitt 說。 “我們使用 Amazon Textract 和 Amazon Comprehend Medical 以有效的方式從非結構化數據源中收集真正的價值,與我們通常的下游業務相比,節省了 10-20 倍的收入。通過擴大分析超過 50,000 個圖表,我們可以找到未記錄的診斷,并為大約 5,000 名成員推薦他們需要的護理管理。”
Informed, Inc. 自動化金融機構發放貸款和開設銀行賬戶的方式。 “我們已經使用 Amazon Textract 代表金融機構分析了數以萬計的貸款文件,并且我們自己的軟件即服務產品通過該服務得到了增強,使我們能夠識別 95% 的貸款缺陷Informed Inc. 創始人兼首席執行官 Justin Wickett 說、納稅申報表和其他財務文件。我們計劃擴展使用 Amazon Textract 分析的文件類型,以使金融機構能夠利用我們的機器學習模型,為當今緩慢和手動的情況帶來實時決策效率過程。”
Candor 的使命是改變對抵押貸款行業造成負擔的陳舊、耗時的流程。 “我們使用 OCR 從各種貸方要求的文件中提取數據,以驗證收入、資產、財產價值等。到目前為止,最好的 OCR 解決方案以 38.4 秒的速度讀取一頁,但 Amazon Textract 只用了一小部分時間就實現了這一目標,”Candor 創始人兼首席執行官 Tom Showalter 說。 “我們已經能夠使用 Textract 準確讀取復雜、多樣化的文件,例如銀行對賬單、工資單和稅務文件,而無需額外的培訓或機器學習專業知識,使我們的客戶能夠在幾天內承銷和關閉貸款,而不是周。”UiPath 是領先的機器人流程自動化供應商,提供完整的軟件平臺來幫助組織有效地自動化業務流程。 “Amazon Textract 將通過增強 UiPath 的文檔理解能力進一步區分 UiPath 的機器人流程自動化平臺,使我們的客戶能夠從文檔中解鎖關鍵業務數據,將這些數據轉化為可操作的業務洞察力,并將這些洞察力傳遞給業務線和運營系統”UiPath 首席產品官 Param Kahlon 說。
TeraDact 允許客戶將存儲的圖像和紙質文檔大規模轉換為符合隱私的、可用的數字格式。 “Amazon Textract 的智能文檔平臺為 TeraDact 的專利編輯服務提供數據,以自動刪除和保護敏感數據。 TeraDact 客戶可以永久刪除這些數據,使其永遠無法恢復,或者選擇用具有適當權限的個人可以恢復的專利令牌替換敏感數據。 TeraDact 首席運營官 Tom Trobridge 說:“這對于遵守政府對個人數據隱私的要求(例如 GDPR)特別有用。”
Ripcord 的使命是使用視覺引導機器人、機器學習和先進的人工智能從紙質文檔中數字化和提取知識。這些知識使業務流程和工作流程自動化。 “我們利用 Amazon Textract 增強了我們先進的實體提取功能,使許多行業受益,并獲得了 40 億美元的新薪酬,取得了巨大的成功。我們期待將 Amazon Textract 的使用范圍擴大到金融和政府服務、醫療保健和法律領域,”Ripcord 首席執行官 Alex Fielding 說。
Blue Prism 開發機器人流程自動化軟件,為企業和組織提供更靈活的虛擬勞動力。 “Blue Prism 的聯網 RPA 可以自動化和執行關鍵任務流程,讓客戶可以自由地專注于更具創造性、更有意義的工作。通過使用 Amazon Textract,我們為我們的數字員工提供了另一個強大的自動化工具。 Amazon Textract 使用機器學習準確分析來自各種文檔類型的數據,從而增強了我們客戶的數字化轉型之旅。使用 Amazon Comprehend 和 Amazon Rekognition 等其他 AWS AI 服務,我們可以應對從增加安全客戶身份驗證流程到欺詐檢測功能的挑戰。 Amazon Textract 表單數據提取的智能性和靈活性可以將 OCR 提升到金融服務、零售、制造和運輸等行業的新水平,”Blue Prism 首席技術官兼聯合創始人 Dave Moss 說。
關于亞馬遜網絡服務
13 年來,Amazon Web Services 一直是世界上最全面、應用最廣泛的云平臺。 AWS 為計算、存儲、數據庫、網絡、分析、機器人、機器學習和人工智能 (AI)、物聯網 (IoT)、移動、安全、混合、虛擬和增強現實(VR 和 AR)提供超過 165 項功能齊全的服務)、媒體和應用程序開發、部署和管理,來自 21 個地理區域內的 66 個可用區 (AZ),跨越美國、澳大利亞、巴西、加拿大、中國、法國、德國、香港特別行政區、印度、愛爾蘭、日本、韓國、新加坡、瑞典和英國。數以百萬計的客戶,包括發展最快的初創公司、最大的企業和領先的政府機構,都信任 AWS 來支持他們的基礎設施、變得更加敏捷并降低成本。
關于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發明的熱情、對卓越運營的承諾以及長期思考。客戶評論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 是亞馬遜率先推出的一些產品和服務。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部