什麼是RAG?

RAG(Retrieval-Augmented Generation,檢索增強生成)是一種企業級 AI 架構設計模式,主要用於解決大型語言模型(Large Language Models, LLM)在企業實務應用中,無法直接存取內部專有知識的問題。

在 EgentHub 中,RAG 是 AI Agent 取得、理解並使用企業知識內容的重要技術基礎。

背景

企業痛點

  • 擁有大量專有知識(SOP、產品文件、合約、研究報告)

  • 文件更新頻繁,內容具有高度時效性

  • 新進或跨部門人員難以快速掌握完整知識

  • 無法承擔高成本與高複雜度的模型再訓練

LLM限制

  • 回答內容可能出現幻覺,偏離事實

  • 缺乏可追溯的資料來源

  • 回答生成過程不透明

  • 知識具有時效性,更新需依賴模型重新訓練,無法即時更新

RAG 的運作流程

在 EgentHub 中,使用者可以透過全文查找知識庫表格查詢知識庫向量知識庫上傳資料,讓AI Agent 依照RAG 流程進行檢索並生成回覆。

1

資訊檢索(Retrieval)

當使用者向 AI Agent 提出問題時,LLM 會啟動 RAG 的即時檢索流程,確保後續生成的回答建立在「與問題高度相關」的知識內容之上。

  1. 問題轉換為可檢索的查詢

    使用者輸入的自然語言問題,會先被轉換為「可在知識庫執行」的查詢表示法,可能是:

    • 向量查詢:用於語意相似度檢索

    • SQL查詢:用於條件篩選、欄位比對、關鍵字與規則型檢索

    此步驟的目標,是把「人類語言」轉成「知識庫能理解並可執行的查詢」。

  2. 智慧檢索策略

    LLM 會根據查詢特性,選擇對應的檢索策略來提高精確度,例如:

    • 語意檢索:系統會根據查詢的語意表示,找出在內容層級上語意最相近的資料片段,用於回答開放式或描述型問題。

    • SQL檢索:系統會依據查詢中的關鍵字、欄位條件、數值範圍、時間區間或邏輯規則,直接在資料表或結構化資料中進行篩選與比對。

透過上述流程,只有與問題高度相關的內容才會被送入生成階段,使 AI Agent 的回答能緊扣實際知識庫內容,避免無關資訊干擾最終輸出。

2

增強(Augmentation)

在進入生成階段之前,系統會先進行提示內容的增強處理。RAG 會將

  • 使用者原始提出的問題

  • 前一階段檢索到的相關資料內容

進行整合,組成一個包含必要背景資訊與上下文的增強提示詞(Augmented Prompt)。此步驟的目的,是將與問題高度相關的企業知識明確提供給模型,作為回答時的依據。

3

生成(Generation)

完成提示增強後,增強提示詞會被送入LLM進行回應生成。

模型會依據提示中所包含的文件內容產生最終回答,使輸出結果建立在實際文件資料之上,而非僅仰賴模型本身的記憶或推論,確保回答內容與企業知識庫保持一致。

應用場景

  • AI 客服與支援中心

    依據知識庫內容即時回覆客戶問題,確保回應一致且可隨文件更新同步調整。

  • 內部 SOP 與行政查詢

    協助員工快速查詢內部制度與流程,降低溝通成本並加速新成員上手。

  • 技術文件即時查詢

    即時檢索技術與產品文件,支援業務與技術人員快速取得關鍵資訊。

  • 報告分析與摘要

    從文件中選擇特定主題,協助快速理解報告與分析結果,產出速報或摘要報告。

  • 市場與產品決策輔助

    整合多份研究與市場資料,支援策略討論與決策參考。

Last updated