什麼是RAG？

RAG（Retrieval-Augmented Generation，檢索增強生成）是一種企業級 AI 架構設計模式，主要用於解決大型語言模型（Large Language Models, LLM）在企業實務應用中，無法直接存取內部專有知識的問題。

在 EgentHub 中，RAG 是 AI Agent 取得、理解並使用企業知識內容的重要技術基礎。

在 EgentHub 中，使用者可以透過全文查找知識庫、表格查詢知識庫、向量知識庫上傳資料，讓AI Agent 依照RAG 流程進行檢索並生成回覆。

當使用者向 AI Agent 提出問題時，LLM 會啟動 RAG 的即時檢索流程，確保後續生成的回答建立在「與問題高度相關」的知識內容之上。

問題轉換為可檢索的查詢
使用者輸入的自然語言問題，會先被轉換為「可在知識庫執行」的查詢表示法，可能是：
- 向量查詢：用於語意相似度檢索
- SQL查詢：用於條件篩選、欄位比對、關鍵字與規則型檢索
此步驟的目標，是把「人類語言」轉成「知識庫能理解並可執行的查詢」。
智慧檢索策略
LLM 會根據查詢特性，選擇對應的檢索策略來提高精確度，例如：
- 語意檢索：系統會根據查詢的語意表示，找出在內容層級上語意最相近的資料片段，用於回答開放式或描述型問題。
- SQL檢索：系統會依據查詢中的關鍵字、欄位條件、數值範圍、時間區間或邏輯規則，直接在資料表或結構化資料中進行篩選與比對。

透過上述流程，只有與問題高度相關的內容才會被送入生成階段，使 AI Agent 的回答能緊扣實際知識庫內容，避免無關資訊干擾最終輸出。

在進入生成階段之前，系統會先進行提示內容的增強處理。RAG 會將

進行整合，組成一個包含必要背景資訊與上下文的增強提示詞（Augmented Prompt）。此步驟的目的，是將與問題高度相關的企業知識明確提供給模型，作為回答時的依據。

完成提示增強後，增強提示詞會被送入LLM進行回應生成。

模型會依據提示中所包含的文件內容產生最終回答，使輸出結果建立在實際文件資料之上，而非僅仰賴模型本身的記憶或推論，確保回答內容與企業知識庫保持一致。

Last updated 1 month ago