RAG是什麼?
RAG(Retrieval-Augmented Generation)檢索增強生成
作用:解决傳統LLM(如GPT系列)固有的幾個問題:
1. 知識過時(Staleness)
2. 缺乏特定領域 or 私有知識
3. 容易產生幻覺-編造不存在的內容(Hallucination)
核心思想:
當使用者提出一個問題(查詢 Query)時,不是直接讓 LLM 憑空生成答案。
先從外部的、可信賴的、通常是海量的知識庫中,檢索出與該問題最相關的文件片段(Chunks)。
將檢索到的相關文件片段(作為上下文 Context)和使用者的原始問題一起「餵」給 LLM。
LLM 基於提供的上下文(檢索到的知識)和自身的語言理解與生成能力,綜合生成最終的回答。
簡單來說:RAG = 檢索Retrieval(找到相關知識) + 增強Augmented(用知識豐富輸入) + 生成Generation(基於知識生成答案)
· 即是將本地知識庫分拆為可以檢索的Chunks,方便檢索。