如何選擇合適的知識庫?
表格查詢知識庫
支援格式:
CSV、XLSX、XLS
運作邏輯:
LLM 會把使用者的自然語言轉成 SQL 查詢語句,直接在表格中做篩選、統計與計算。
需求理解:
如果你需要「精確查詢數據資料,進行計算、篩選或統整」,請選擇此方式。
優點:
結果精準,不會猜
可做統計、排序、條件過濾
適合報表與營運數據
限制:
僅會讀取第一個工作表(sheet)
需為結構化表格
💡結構化表格(Tabular Data) 指具有單一標題列,且每一列代表一筆資料的標準化表格格式,可被轉換為 SQL 資料表進行精準查詢、統計與計算。
建議情境:
業績報表、庫存管理、價格表、客戶名單、生產數據等
上傳前檢查:
第一列是欄位名稱
每一列代表一筆資料
不可有合併儲存格、多層表頭、特殊排版
Agent 向量知識庫
支援格式:
PDF、DOCX、TXT、CSV、XLSX、XLS、MD、HTML
運作邏輯:
將文件的文字轉換為「語意向量」,當使用者提問時,Agent 會用語意相似度從文件中找出最相關的段落,再組合成答案。
需求理解:
如果你需要「讓某一個 Agent 擁有自己專屬的一套知識,能透過語意理解回答問題」,請選擇此方式。
優點:
可理解自然語言,不需精準關鍵字
可跨多份文件找答案
適合規章、政策、說明書、SOP
限制:
回答是「語意最佳匹配」,不是逐字精準
建議情境:
客服知識庫、內部流程問答、產品說明文件、報告摘要與查詢、FAQ
上傳前檢查:
檔案應為「文字型」的 PDF(不是掃描圖片)
圖片無法被向量知識庫理解,即使圖片中有文字也一樣
檔案請避免複雜版型與干擾元素(如浮水印、LOGO等)
Last updated
