什麼是RAG?
RAG(Retrieval-Augmented Generation,檢索增強生成)是一種企業級 AI 架構設計模式,主要用於解決大型語言模型(Large Language Models, LLM)在企業實務應用中,無法直接存取內部專有知識的問題。
在 EgentHub 中,RAG 是 AI Agent 取得、理解並使用企業知識內容的重要技術基礎。
背景
RAG 的運作流程
在 EgentHub 中,使用者可以透過全文查找知識庫、表格查詢知識庫、向量知識庫上傳資料,讓AI Agent 依照RAG 流程進行檢索並生成回覆。
資訊檢索(Retrieval)
當使用者向 AI Agent 提出問題時,LLM 會啟動 RAG 的即時檢索流程,確保後續生成的回答建立在「與問題高度相關」的知識內容之上。
問題轉換為可檢索的查詢
使用者輸入的自然語言問題,會先被轉換為「可在知識庫執行」的查詢表示法,可能是:
向量查詢:用於語意相似度檢索
SQL查詢:用於條件篩選、欄位比對、關鍵字與規則型檢索
此步驟的目標,是把「人類語言」轉成「知識庫能理解並可執行的查詢」。
智慧檢索策略
LLM 會根據查詢特性,選擇對應的檢索策略來提高精確度,例如:
語意檢索:系統會根據查詢的語意表示,找出在內容層級上語意最相近的資料片段,用於回答開放式或描述型問題。
SQL檢索:系統會依據查詢中的關鍵字、欄位條件、數值範圍、時間區間或邏輯規則,直接在資料表或結構化資料中進行篩選與比對。
透過上述流程,只有與問題高度相關的內容才會被送入生成階段,使 AI Agent 的回答能緊扣實際知識庫內容,避免無關資訊干擾最終輸出。
應用場景
AI 客服與支援中心
依據知識庫內容即時回覆客戶問題,確保回應一致且可隨文件更新同步調整。
內部 SOP 與行政查詢
協助員工快速查詢內部制度與流程,降低溝通成本並加速新成員上手。
技術文件即時查詢
即時檢索技術與產品文件,支援業務與技術人員快速取得關鍵資訊。
報告分析與摘要
從文件中選擇特定主題,協助快速理解報告與分析結果,產出速報或摘要報告。
市場與產品決策輔助
整合多份研究與市場資料,支援策略討論與決策參考。
Last updated
