歡迎來到文件處理的未來!在數位化的浪潮下,我們每天都面臨著海量的文件需要處理。如何高效、準確地從這些文件中提取資訊,成為了企業和個人都非常關心的問題。今天,我們將深入探討一個關鍵概念:人機迴路(Human-in-the-Loop, HITL),以及它如何在 Google Cloud 的 Document AI 中發揮作用,提升文件處理的準確性。正如 Holt Skinner 所說:「沒有任何機器學習模型是完美的。」因此,人機協作變得至關重要。
數位化時代的挑戰
現今出現了許多處理文件的方法,包括處理通用表格、身分證件、收據,甚至使用 Document AI 處理完全客製化的格式。然而,機器學習模型並非萬能。正如 Skinner 指出,當應用程式需要最高的準確性時,最好在使用結果之前,讓人們驗證結果。這正是人機迴路(HITL)的價值所在。
人機迴路的概念並非新鮮事,它在許多領域都有應用。例如,自動駕駛汽車在路況不佳時需要人類駕駛員接管,自動化聯絡中心在來電者有特殊要求時會將電話轉接給人工客服。在文件處理領域,人機迴路意味著我們需要人類驗證處理器是否從輸入文件中提取了正確的資訊,並在結果不正確時手動調整。
HITL 的運作原理
那麼,人機迴路究竟是如何運作的?以及它如何提升 Document AI 的效能?
首先,人機迴路可以應用於資料標記。正如 Skinner 所解釋的:「對於監督式學習,例如 Document AI 使用的,這意味著我們需要標籤數據來告訴模型要尋找什麼。」人工審查可用於標記範例數據,以他們希望模型輸出的方式。
其次,人機迴路可以應用於生產審查。模型經過訓練並開始做出預測後,人類可以作為升級路徑,一個審查步驟,來驗證結果是否準確。Skinner 提到,人工審查員可以通過多種方式進行配置。您可以使用自己的內部或合作夥伴資源,使用 Google HITL 工具進行標記和審查,或者您可以讓 Google 託管的人力來處理。
更重要的是,您可以設定人工審查通過置信度分數手動或自動觸發。置信度值由 Document AI 輸出,以表明模型認為結果有多準確。這是一個介於 0 和 1 之間的數字,其中 1 是最高的信賴區間結果是準確的。您可以設定一個信賴度閾值 (confidence threshold) 以決定哪些流程文件應該被發送給人工審閱者。
舉例來說,假設我們有一個配置了人工審閱的費用解析器,並且這個費用報告被處理了。如果文件圖像非常模糊且難以閱讀,模型給出的信賴度分數可能很低,例如 0.1。此時,審閱者可以在標記控制台中打開此文件,然後驗證或更正根據需求輸出。完成審查後,提到的文字已更正,並且信心度已更改為 1。
人機迴路在 Document AI 的完整範圍中扮演著重要角色。它適用於文件準備、分類和實體提取等領域。此外,標記的文件可以饋送到向上訓練 (up-training) 中,作為基本事實範例,以幫助處理模型變得隨著時間的推移變得更加準確。
智慧化的文件處理
人機迴路是提升 Document AI 準確性的關鍵。通過人工審查,我們可以確保模型在處理文件時提取正確的資訊,並在需要時進行更正。正如 Skinner 所總結的,在影片筆記中,我們討論了人為參與 (human-in-the-loop) 以及它如何在機器學習工作流程中發揮關鍵作用。
▎了解更多內容、逐字稿筆記(請點選"開啟劇院模式"):