如何在 elDoc 中打造強大的 Enterprise Agentic RAG 平台，實現大規模文件智慧化

2026 年 5 月 6 日

企業並不缺乏資料，而是缺乏能夠真正理解與運用資料的智慧能力。事實上，這個問題比大多數企業所意識到的更加深層。絕大多數的企業知識，並不存在於乾淨的資料庫或結構化完善的系統中，而是散落於掃描 PDF、圖片、照片、手寫表單、合約、發票與舊式檔案庫中，這些資料從一開始就不是為了讓機器能夠讀取與理解而設計的。

這就是我們所稱的企業暗資料（Enterprise Dark Data）。

它無所不在：

數十年累積的掃描合約，存放於文件儲存庫中
以 PDF 格式保存、缺乏結構化的合規文件
表單、報告與現場資料的照片
分散於彼此孤立系統中的電子郵件與附件
舊式系統匯出的靜態且無法查詢的檔案

⚠️ 被忽視的核心問題

大多數 AI 專案都在不知不覺中忽略了這一層資料。為什麼？

因為這非常困難。

傳統資料流程通常依賴於：

乾淨且可讀的文字資料
結構化資料庫
已預先處理的內容

但現實情況是：

高達 70% 至 80% 的企業資料屬於非結構化資料，其中相當大一部分還是以影像或掃描文件形式存在。

這代表：

關鍵知識無法被搜尋系統有效識別
大型語言模型（LLMs）只能基於不完整的上下文運作
決策建立在不完整的資訊之上

👉 最終結果是什麼？
AI 看似聰明，但實際上並未建立在完整且真實的企業資料基礎之上。

🧠 為什麼僅靠 LLMs 並不足夠

大型語言模型（LLMs）雖然功能強大，但存在一個根本性的限制：

它們只能理解與處理被提供給它們的內容。

如果您的資料檢索層忽略了：

掃描文件
圖像與圖片
未建立索引的 PDF 文件

那麼您的 AI 系統，實際上將無法看見龐大的企業知識資產。

💡 elDoc 的觀點

在 elDoc，我們並未將這視為少數特殊情況，而是將其視為企業 AI 的核心問題。

我們思考的是：

如何將所有企業資料，尤其是那些雜亂、非結構化、以影像為主的大量資料，整合進一個具備智慧能力且可查詢的系統中？

更重要的是：

我們該如何建立一套方法，讓 AI 不只是檢索資訊，而是真正能夠理解、推理，並以安全且可擴展的方式執行行動？

深入 elDoc：我們的 Agentic RAG 架構如何實現大規模運作

建立一套 Agentic RAG 系統是一回事，但要讓它在數百萬份企業文件環境中依然保持可靠、精準且具備可擴展性，則是另一項更大的挑戰。

在 elDoc，我們從最根本的原則出發來解決這個問題：

如果 AI 的能力取決於它能取得哪些資料，那麼資料檢索機制就必須被視為核心系統來設計，而不是事後補強的附加功能。

核心突破：混合式檢索架構

我們最早面臨的挑戰之一，就是資料檢索品質。

企業資料具有以下特性：

格式不一致
多模態
缺乏良好的結構化
分散於不同系統之中

我們很快便意識到一個根本性的限制：

沒有任何單一檢索方法，能夠適用於所有企業資料。

向量搜尋難以處理精確匹配需求，例如合約條款
關鍵字搜尋無法真正理解語意
單靠中繼資料缺乏足夠的上下文深度

因此，我們並未只選擇單一方法，而是將多種方法整合在一起。

多層式檢索系統

我們打造了一套混合式檢索架構，作為 elDoc 的核心骨幹。每一層架構都專門解決不同面向的問題：

🗄️ 上下文層：MongoDB

此層負責提供狀態管理與資料結構。

它儲存：

文件中繼資料
實體之間的關聯性
使用者與工作階段上下文
工作流程與 AI Agent 狀態

💡 為什麼這很重要

資料檢索不再是無狀態的流程。

AI Agents 可以：

理解提問者的身份與角色
追蹤已經檢索過的內容
在多步驟推理過程中維持上下文一致性

👉 這正是真正 Agentic 行為的基礎，而不只是單純搜尋。

📄 精準層：全文搜尋

此層確保在最關鍵的場景中維持高度精準性。

它負責處理：

精確關鍵字匹配
法律條款
合規文件
結構化查詢

💡 為什麼這很重要

在企業環境中：

「幾乎正確」是無法被接受的
細微的措辭差異，都可能完全改變內容含義

👉 此層能夠確保精準度與可靠性。

🧠 語意層：向量資料庫

此層賦予系統真正的理解能力。

它能夠實現：

基於相似性的檢索
具備上下文理解能力的搜尋
超越精確關鍵字的資訊發現能力

💡 為什麼這很重要

使用者並不一定知道該如何正確描述查詢需求。

此層可確保系統能夠：

理解使用者意圖
即使措辭不同，也能找到相關資訊

👉 這正是 RAG 真正具備智慧能力的關鍵。

從 RAG 到 Agentic RAG：elDoc 的關鍵轉折

當 elDoc 開始打造平台時，我們並不是一開始就採用 Agentic RAG，而是和大多數系統一樣，先從傳統 RAG 開始。它確實有效，但也只能做到某個程度。

⚠️ 傳統 RAG 的限制

在早期實作中，我們持續觀察到以下限制：

單次檢索經常遺漏關鍵上下文
查詢結果往往只有部分相關
當檢索結果品質不佳時，系統無法自我調整
無法判斷應該使用哪一種檢索方法
難以有效處理複雜、多步驟的企業查詢

最重要的是：

系統本身完全無法意識到自身的限制。

它只進行一次檢索，然後期待結果足夠好。

💡 關鍵洞察

我們很快便理解到，真正的問題不在於生成能力，而在於資料檢索是如何被協調與執行的。

這也促使我們做出一個根本性的轉變：

RAG 不應只是單純的流程管線，而應該是一套具備決策能力的系統。

關鍵轉變：導入 Agentic RAG

我們將架構從：

檢索 → 生成

轉變為：

理解 → 規劃 → 檢索 → 評估 → 優化 → 生成

這就是我們所稱的 Agentic RAG。

🔑 有哪些改變？

我們不再將資料檢索視為固定步驟，而是導入 AI Agents，使其能夠：

決定應該如何進行檢索
選擇需要查詢的系統
評估檢索結果的品質
在必要時進行優化並重新嘗試

Agentic RAG 的實際應用：elDoc 中的資料分析與智慧能力

此畫面展示了一個非常典型的企業應用場景：

使用者選取多份發票文件後提出需求：
「請整理這些發票的摘要，並計算總金額。」

乍看之下，這似乎是一個簡單的任務。
但實際上，這是一個涉及非結構化文件的多步驟推理問題。

而這正是 Agentic RAG 展現真正價值的地方。

為什麼這是一個 Agentic 問題，而不只是傳統 RAG

傳統 RAG 系統通常會：

從文件中檢索內容片段
將內容輸入至 LLM
生成摘要

但這種方式通常難以處理：

重複發票
多文件資料彙整
幣別分類與分組
結構化輸出生成

👉 最終很可能產生不完整或不正確的結果。

elDoc 的 Agentic RAG 如何逐步解決這個問題

1. 🧠 理解使用者意圖

AI Agent 不只是讀取指令，而是會真正理解需求：

這不只是單純的摘要任務
還涉及資料彙整與計算
需要同時處理多份文件
輸出結果必須具備結構化與高準確性

2. 📂 上下文擴展（完整文件模式）

在介面中：

已啟用「使用完整文件內容」功能

這將觸發系統：

將所有選取的發票視為一個完整資料集
檢索完整文件內容，而不只是片段
為跨文件推理做好準備

3. 🔍 跨文件資料檢索

Agentic RAG 系統會：

從所有選取的 PDF 中擷取資料
必要時透過 OCR 讀取發票內容
辨識關鍵欄位：
- 發票編號
- 供應商
- 日期
- 金額
- 幣別

👉 這不只是資料檢索，而是結構化資料擷取。

4. 🧩 資料標準化與對齊

接著，AI Agent 會：

將擷取出的資料統一成一致格式
偵測重複資料
- 例如：RT2847957 出現了兩次
並根據以下資訊區分發票：
- ID
- 供應商
- 日期

👉 這一步驟至關重要，也是傳統簡易 RAG 無法完成的能力。

5. 🎯 推理與去重處理

系統會辨識出：

已選取 5 份檔案
但其中只有 4 份為唯一發票

這需要：

邏輯比對
跨文件推理
去重策略

💡 這正是 Agentic 的核心時刻：

系統不只是回報資料，而是會主動檢視與驗證資料本身。

6. 🧮 彙整與計算

接著，AI Agent 會執行：

基於幣別的智慧分組：

USD 發票
HKD 發票

並進行計算：

計算各幣別總金額
正確處理重複資料

7. 📊 結構化輸出生成

系統最終產生的不是純文字，而是：

✔ 發票摘要表格

發票 ID
日期
供應商
金額
幣別

✔ 各幣別總計

已分組整理
已完成計算
清楚區分顯示

Agentic RAG 真正展現價值的地方

此工作流程並非線性執行，AI Agent 會在內部持續進行：

擷取 → 評估 → 驗證 → 重新計算
並根據中間結果動態調整邏輯

傳統 RAG 與 Agentic RAG 比較

能力	傳統 RAG	Agentic RAG (elDoc)
多文件理解能力	有限	強大
去重處理	❌	✅
計算能力	❌	✅
結構化輸出	較弱	強大
上下文感知能力	靜態	動態
準確性	不穩定	高

Enterprise Agentic RAG 的核心差異：以安全性、存取控制與信任為核心設計

Agentic RAG 將智慧能力帶入資料檢索，讓系統能夠進行規劃、推理與迭代。然而，在企業環境中，僅有智慧能力仍然不足，真正關鍵的是「信任」。在 elDoc，我們將 Agentic RAG 進一步演化為 Enterprise Agentic RAG，將安全性、存取控制與治理能力直接嵌入架構核心之中，而非事後補充的功能。

與一般專注於推理與檢索優化的 Agentic RAG 系統不同，Enterprise Agentic RAG 必須在嚴格的邊界內運作。每一次查詢、每一個檢索步驟，以及每一項生成回應，都具備上下文感知與權限感知能力。

這代表：

使用者只能存取其被授權查看的內容
AI Agents 會根據角色型與屬性型存取控制（RBAC／ABAC）進行資料檢索
即使在多步驟推理過程中，敏感文件依然受到保護

👉 系統不只是思考「哪些內容是相關的？」
還會同時判斷「哪些內容是被允許存取的？」

安全機制會在多個層級中被強制執行：

文件層級權限控制可實現細粒度存取管理
上下文過濾機制可確保檢索資料符合使用者角色權限
具備政策感知能力的 AI Agents，能夠動態調整檢索策略以避免存取受限制內容
私有部署模式（本地部署或私有雲）可確保完整的資料主權

此外，所有操作皆可進行稽核與追蹤：

檢索了哪些資料
使用了哪些上下文
最終回應是如何生成的

對於高度重視合規性的產業而言，這種透明性至關重要，且不可妥協。

透過 elDoc Agentic RAG，從文件走向決策

elDoc Vioma 所打造的，不僅僅是一套 RAG 系統，而是邁向 Agentic RAG 的重要轉變。在這種模式下，AI 不只是檢索資訊，更能主動理解、推理並與企業資料協同運作。

透過結合混合式檢索、Agent 編排機制與多模態處理能力，我們打造出一套能夠應對真實世界複雜性的系統，包括掃描文件、碎片化資料以及大規模知識，同時仍能提供精準、結構化且可執行的輸出結果。

這正是實現以下轉變的關鍵：

資料 → 轉化為上下文
上下文 → 轉化為洞察
洞察 → 轉化為決策

如果您希望突破基礎 RAG 的限制，真正實現大規模文件智慧化，那麼現在正是探索 Agentic RAG 如何在您的企業環境中發揮價值的最佳時機。

👉 了解 elDoc 如何為您的企業資料注入真正的智慧能力。

讓我們聯繫我們

立即預約產品示範，親身體驗 Enterprise Agentic RAG 的實際應用

回答您的問題或安排演示以了解我們的解決方案的實際應用：只需給我們留言

如何在 elDoc 中打造強大的 Enterprise Agentic RAG 平台，實現大規模文件智慧化

⚠️ 被忽視的核心問題

🧠 為什麼僅靠 LLMs 並不足夠

💡 elDoc 的觀點

深入 elDoc：我們的 Agentic RAG 架構如何實現大規模運作

核心突破：混合式檢索架構

多層式檢索系統

🗄️ 上下文層：MongoDB

💡 為什麼這很重要

📄 精準層：全文搜尋

💡 為什麼這很重要

🧠 語意層：向量資料庫

💡 為什麼這很重要

從 RAG 到 Agentic RAG：elDoc 的關鍵轉折

⚠️ 傳統 RAG 的限制

💡 關鍵洞察

關鍵轉變：導入 Agentic RAG

🔑 有哪些改變？

Agentic RAG 的實際應用：elDoc 中的資料分析與智慧能力

為什麼這是一個 Agentic 問題，而不只是傳統 RAG

elDoc 的 Agentic RAG 如何逐步解決這個問題

1. 🧠 理解使用者意圖

2. 📂 上下文擴展（完整文件模式）

3. 🔍 跨文件資料檢索

4. 🧩 資料標準化與對齊

5. 🎯 推理與去重處理

💡 這正是 Agentic 的核心時刻：

6. 🧮 彙整與計算

7. 📊 結構化輸出生成

Agentic RAG 真正展現價值的地方

傳統 RAG 與 Agentic RAG 比較

Enterprise Agentic RAG 的核心差異：以安全性、存取控制與信任為核心設計

透過 elDoc Agentic RAG，從文件走向決策

讓我們聯繫我們

立即預約產品示範，親身體驗 Enterprise Agentic RAG 的實際應用

ABOUT elDoc

PLATFORM KEY CAPABILITIES

CONTACTS

GET SOCIAL WITH US

COMPLIANCE

CUSTOMER SUPPORT

LICENSING

PARTNERS AND INVESTORS