elDoc 中代理式 RAG 的架構:企業文件智慧的核心技術
企業組織不需要只會對話的 AI,而是需要能夠理解任務、在文件與數據中進行搜尋、連結不同來源的資訊、對所獲資訊進行推理,並在安全環境中協助完成實際工作的 AI。這正是代理式 RAG 發揮關鍵作用的地方。
在 elDoc 中,代理式 RAG 不僅僅是檢索少量相關文本並交由語言模型進行摘要,而是編排一個完整的 AI 流程,使多種技術協同運作,例如文件儲存、文字擷取、關鍵字搜尋、向量搜尋、推理模型,以及能規劃並執行多步驟任務的 AI 代理。這種組合使 elDoc 能夠超越被動的文件存取,邁向以任務為導向的企業內容智慧。
代理式 RAG 在實務中的意義
傳統文件搜尋協助使用者找到檔案,基礎 AI 對話協助使用者提出問題,基礎 RAG 則透過檢索內容提供具依據的答案。
代理式 RAG 更進一步,使系統能夠解析使用者請求、決定解決方式、執行多次檢索與推理、驗證結果,並組合出有價值的最終成果。系統不再依賴單一步驟的搜尋與回應,而是採用更接近專業分析師的工作流程:
系統首先理解請求,判斷所需資訊,識別資訊可能所在位置,檢索相關證據,進行分析,檢查證據是否充分,在必要時進行額外搜尋,最終產出答案、摘要、報告或可直接採取行動的結果。
這正是 elDoc 中代理式 RAG 的核心運作方式。
elDoc AI 流程
elDoc 中代理式 RAG 的強大之處,在於多個專業組件以協同方式運作為一個整體系統。每個組件各司其職,其價值來自彼此之間的互補。
MongoDB:文件儲存
此流程的基礎是 MongoDB,作為文件儲存層。企業文件環境通常相當複雜,文件可能來自不同部門,具有不同格式、結構、元資料欄位、生命週期狀態及安全分類。因此,需要具備彈性且可擴展的儲存層來管理這些複雜性。
MongoDB 透過提供一種結構,不僅能儲存文件本身,還能儲存使文件在 AI 流程中發揮價值的相關情境資訊,以支援此需求。這些資訊可包括文件類型、部門、作者、日期、版本、業務流程參照、存取控制、擷取文字、分塊結構、索引資訊以及與相關記錄的連結等元資料。
這一點至關重要,因為代理式 RAG 並不僅處理原始文本,還需要情境資訊。例如,當使用者查詢政策缺口、合規不一致、合約義務或流程風險時,系統不僅需要了解文本內容,還需掌握文件的當前版本、所屬部門、是否已核准,以及其與其他內容的關聯。
MongoDB 提供結構化與半結構化數據的基礎,使這些更豐富的工作流程得以實現。
Apache Solr:全文搜尋
並非所有企業問題都應僅依賴向量搜尋來解決。在許多實際業務場景中,精確的術語、名稱、代碼、參照、日期、識別碼、法律用語或特定領域術語至關重要。這正是 Apache Solr 在 elDoc 流程中扮演關鍵角色的原因。
Solr 提供強大的全文搜尋能力,使系統能透過關鍵字相關性、精確詞組比對、篩選、分面分析、元資料條件與排序邏輯來定位文件與段落。在企業場景中,當使用者搜尋以下內容時尤為重要:
- 合約編號
- 發票識別碼
- 專案代碼
- 員工姓名
- 政策條款
- 法律條款
- 技術術語
- 部門專用語言
例如,當使用者查詢特定供應商、政策編號或監管要求的所有相關內容時,全文搜尋往往是最快且最可靠的檢索方式。Solr 可協助系統精準定位這些明確參照。在代理式 RAG 中,這一點尤為重要,因為代理可判斷使用者請求最適合透過關鍵字檢索、語意檢索或兩者結合來完成。Solr 因此成為代理用於將工作建立在高度相關內容之上的核心工具之一。
Qdrant:向量搜尋
雖然全文搜尋在精確匹配方面表現優異,但企業使用者常以自然語言提出問題,而這些問題未必與文件中的措辭完全一致。此時,作為向量搜尋層的 Qdrant 便顯得至關重要。向量搜尋使 elDoc 能依據語意相似度進行檢索,而不僅依賴字詞重疊,這意味著即使文件中的用語與使用者問題不同,系統仍能找到相關內容。
例如,使用者可能會詢問:
- 「此合約中的主要交付風險是什麼?」
- 「供應商是否存在隱藏義務?」
- 「請指出責任不明確之處。」
- 「哪些政策說明了核准權限的限制?」
相關文件可能並未使用這些精確表述,而是採用服務承諾、責任條款、升級責任、授權權限或例外核准要求等相關語句。僅依賴關鍵字搜尋可能會遺漏重要證據,而向量搜尋則能補足這些語意情境。
在 elDoc 中,Qdrant 支援對企業文件分塊進行更深入的語意檢索,使系統能呈現具實質關聯的內容片段,並豐富代理分析所依據的證據集合。
這在以下複雜應用場景中特別有價值:
- 跨文件分析
- 政策與合規審查
- 合約智慧分析
- 營運風險識別
- 盡職調查
- 知識發掘
- 針對多元內容的企業問答
OCR 引擎:文字擷取
在文件能被搜尋、分析或進行推理之前,其內容必須先轉換為機器可讀格式。在企業環境中,這並非總是容易實現。許多重要文件以掃描 PDF、影像檔、簽署表單、紙本檔案或結構不佳的匯出文件形式存在。若未進行擷取,這些檔案對 AI 而言將處於不可見狀態。
因此,OCR 引擎成為 elDoc AI 流程中的關鍵組成部分。
OCR,即光學字元辨識,使 elDoc 能從掃描或影像文件中擷取文字,讓內容可被索引、分塊、搜尋並應用於後續 AI 流程。此步驟的重要性遠超表面。文字擷取的品質會直接影響檢索、推理與最終輸出的品質。若文字缺失、破碎、誤讀或分段不佳,後續 AI 所依據的證據將變得薄弱。
在實務中,OCR 使 elDoc 能將 AI 應用擴展至真實的企業檔案庫,而不僅限於數位原生文件。它將歷史記錄、紙本流程、已簽署文件、舊版掃描資料及營運附件納入同一個可搜尋且可分析的知識層。
這代表更完整的檢索、更豐富的情境以及更高的業務價值。
LLM 模型:推理與生成
當找到相關資訊後,下一步並非僅重述內容。系統需進行解讀、比較、整合、說明並生成有價值的回應,這正是 LLM 層的角色。elDoc 中的大型語言模型用於推理與生成,將檢索到的證據轉化為使用者可理解且可行動的輸出。
根據任務需求,這可能包括:
- 根據檢索文件回答問題
- 彙整多來源的發現
- 識別不一致或缺失資訊
- 比較條款、政策或版本
- 擷取義務、風險、日期或責任
- 撰寫報告或結構化輸出
- 以易懂語言說明結果
關鍵在於模型並非獨立運作。在代理式 RAG 中,LLM 建立於檢索內容之上,並成為由代理控制的整體流程的一部分。
這一點至關重要,因為企業使用者並不需要通用的文字生成,而是需要基於授權且相關內容的可信輸出。LLM 提供理解與語言能力,而檢索與代理層則確保推理過程建立在可靠證據之上。
AI 代理:規劃與任務執行
在代理式 RAG 中,決定性的層級是 AI 代理。代理不僅依賴單一提示進行回應,而更像一位智慧協調者。它會解析使用者目標、判斷所需步驟、選擇適當工具、評估中間結果,並在生成最終回應前決定是否需要進一步檢索或分析。
正是這一點,使標準 RAG 系統轉變為代理式 RAG 系統。
在 elDoc 中,代理可編排多個工作階段,例如:
- 理解使用者意圖
- 選擇搜尋策略
- 結合關鍵字與語意檢索
- 驗證檢索證據是否充分
- 若存在缺口則觸發後續搜尋
- 彙整跨文件的發現
- 依據任務需求進行輸出結構化
系統不再是單次互動,而是轉變為引導式的知識工作流程引擎。

這在企業應用場景中特別強大,因為請求往往並不簡單。使用者可能需要識別流程風險、比較合約版本、找出衝突政策、分析供應商文件、偵測缺失核准,或為管理報告彙整證據。這些任務需要規劃、迭代與具情境感知的推理,而代理正是實現這些能力的關鍵。
為何多步驟推理讓代理式 RAG 更具威力
代理式 RAG 的真正優勢在於多步驟推理。
許多企業任務無法透過單一提示與單次檢索可靠完成。重要資訊可能分散於多份文件之中,關鍵風險可能以隱含方式呈現,而非明確表述,關鍵證據也可能在初步發現指向其他來源後才變得相關。
多步驟推理使 elDoc 能以動態方式處理問題。系統不會假設首次檢索結果已足夠,而是會深入思考任務、分階段蒐集證據、優化搜尋,並構建更完整的答案。因此特別適用於以下複雜知識型任務:
- 合規分析
- 合約審查
- 稽核支援
- 政策一致性檢視
- 盡職調查
- 流程分析
- 企業知識發掘
- 以文件為基礎的調查
換句話說,代理式 RAG 的強大之處,在於讓 AI 不再只是靜態聊天機器人,而更像能夠逐步解決問題的智慧助理。
代理式 RAG 必須同時兼顧效率與安全,在 elDoc 中,這一點已內建於架構之中
雖然多步驟推理讓代理式 RAG 更加強大,但同時也帶來一項關鍵要求,即在每一個流程步驟中確保安全性。
在 elDoc 中,代理式 RAG 的設計不僅能理解、檢索並跨文件推理,還能在嚴格受控且安全的環境中執行。
每當使用者提交請求時,系統不會立即開始搜尋,而是先驗證使用者身份及其可存取範圍。這確保後續所有操作,包括檢索、分析與回應生成,皆完全符合企業存取政策。
此方法的核心是基於角色的存取控制(RBAC),用以定義每位使用者可查看與操作的數據範圍。elDoc 中的 AI 代理會承繼這些權限並嚴格遵循,無法檢索、分析或生成任何未授權存取的資訊。
這意味著:
- 每一次查詢皆具備權限感知
- 每一次檢索皆受存取控制
- 每一次回應皆僅基於已授權內容
然而,elDoc 的安全機制遠不止於 RBAC。
該平台採用多層企業級安全模型,涵蓋身份、數據、基礎設施與營運層面的全面防護:
- 身份與存取安全:透過多重驗證(MFA)、一次性密碼(OTP)以及與企業身份系統整合,確保僅有經驗證的使用者能存取平台
- 細緻權限與控制:細粒度存取策略延伸至文件與數據層級,並在每一次 AI 互動中嚴格執行
- 監控、記錄與可審計性:完整追蹤使用者行為,確保透明性、合規性與治理
- 安全部署選項:支援本地部署、私有雲或混合環境,確保對數據儲存與處理位置的全面掌控
- 隔離環境:可在完全隔離的基礎設施中運行 elDoc,對處理敏感或機密數據的組織至關重要
- 高可用性與災難復原:具備企業級可靠性與高韌性架構,確保 AI 驅動運作的持續性
此多層防護機制確保 AI 在透過多步驟推理提升能力的同時,不會引入額外風險。
在 elDoc 中,AI 不會繞過安全機制,而是落實並強化安全。
從提出問題到生成最終結果,代理式 RAG 工作流程的每一個步驟都持續依據企業政策進行驗證,確保組織在運用先進 AI 處理文件與數據時,仍能維持完整的控制、合規與安全防護。
讓我們聯繫我們
探索 elDoc 的代理式 RAG,立即申請示範或社群版本
回答您的問題或安排演示以了解我們的解決方案的實際應用:只需給我們留言
