RAGFlow 教學:開源 RAG 引擎怎麼裝、怎麼餵文件、怎麼讓 AI 不亂講

2026年6月12日

把公司一整櫃的 PDF 丟給 AI,然後它開始一本正經地胡說八道——這大概是每個想做企業知識庫的人都遇過的場面。RAGFlow 用「深度文件理解」加上可追溯引用來治這個病。這篇從 Docker 安裝、建知識庫、設模型,一路講到怎麼讓答案附上出處。

前言:當 AI 把 PDF 讀成一團亂

這就是 RAG 真正難的地方——不是接模型,是把那些版面複雜、有表格、有掃描檔的文件,正確地切成模型吃得下的片段。RAGFlow 主打的就是這件事。這篇帶你實際裝起來、餵文件、讓它附上出處。

RAGFlow 是什麼

RAGFlow 是 InfiniFlow 出的開源 RAG(檢索增強生成)引擎,程式碼在 GitHub 上公開。如果你還不確定 RAG 是什麼,先看我們的什麼是 RAG 會比較好懂——簡單說,就是讓 AI 回答前先去你的資料堆裡查資料,再根據查到的東西作答,而不是憑記憶亂講。

RAGFlow 跟其他 RAG 工具最不一樣的地方,是它叫做 DeepDoc 的「深度文件理解」。一般工具讀 PDF 就是把文字硬抽出來,版面一複雜就亂套。RAGFlow 會去理解版面結構——哪裡是標題、哪裡是表格、哪裡是段落,連掃描檔(圖片型 PDF)都能透過 OCR 處理。它支援 Word、簡報、Excel、純文字、圖片、掃描檔、結構化資料、網頁等多種格式。

另一個重點是可追溯的引用。它回答時會把答案的依據標出來,讓你看到「這句話是從哪份文件的哪一段來的」,大幅降低你被 AI 唬住的機率。它也整合了 Dify 那類平台在做的 Agent 編排,支援把 RAG、工具、MCP 兜成視覺化工作流。

能拿來做什麼

企業內部知識庫:把產品手冊、SOP、合約範本餵進去,員工用自然語言問,答案附出處。
客服問答後台:接上常見問題與技術文件,當聊天機器人的大腦。
研究與分析:法律判例、財報、論文這類版面複雜、需要精準引用的文件,正好打中 DeepDoc 的強項。
個人第二大腦:把你長年累積的筆記、電子書丟進去,變成能對話的知識庫。

想搞懂 RAG 系統整體怎麼搭,可以搭配 RAG 實作指南一起看。

怎麼用:第一次上手

RAGFlow 用 Docker 部署,流程不算難,但對機器有點要求,先看規格。

1. 確認系統需求

官方建議:CPU 至少 4 核、記憶體至少 16GB、硬碟至少 50GB,Docker 24 以上、Docker Compose v2.26 以上。記憶體這條很關鍵——它要跑向量檢索引擎,記憶體不夠會一直當,別想用 4GB 的小機器硬上。

2. 拉專案、啟動

從 GitHub clone 下來後,進到 docker 目錄,啟動:

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
docker compose up -d

第一次跑會抓不少映像檔,泡杯咖啡等它。跑完用 docker ps 確認容器都起來了。

3. 開後台、設模型

服務起來後,瀏覽器開 http://你的主機IP(預設 80 埠)。註冊一個帳號登入,接著去設定裡填模型的 API 金鑰——這步不能跳過。RAGFlow 自己不附模型,你要告訴它用哪個 LLM(回答用)跟哪個嵌入模型(embedding,把文字轉成向量用)。可以填 OpenAI、各家雲端模型,也能接本地的 Ollama。

4. 建知識庫、餵文件

建立一個 Knowledge Base,把你的 PDF、Word 上傳進去。重點來了:上傳後要選一個切塊模板(chunk method)。RAGFlow 提供多種模板對應不同文件型態——一般文件、論文、書本、法律、簡報、表格、問答對等等。選對模板,切塊品質差很多。選好後按解析(parse),它會跑 DeepDoc 把文件拆成片段。

5. 檢查切塊結果

這是 RAGFlow 最該用的功能:解析完它會把切塊結果視覺化給你看,你能看到每一塊長什麼樣、對應原文哪個位置。發現切壞了——比如表格被切斷——可以人工調整。別嫌麻煩,這一步直接決定後面回答準不準。

6. 建聊天助理、測問答

切塊沒問題後,建一個 Chat,把這個知識庫掛上去,就能開始問問題了。它回答時會附上引用來源,點下去能跳到原文片段。

進階技巧

模板要按文件型態分庫:不要把法律合約跟產品簡報丟同一個知識庫用同一個模板。版面差太多,切塊邏輯不一樣。分開建庫、各選各的模板,準確率會明顯提升。

善用混合檢索:RAGFlow 同時做向量檢索跟 BM25 關鍵字檢索,再加重排序(re-rank)。純向量檢索對「精確名詞、料號、條文編號」這種查詢常常抓不準,關鍵字檢索正好補上。預設就有,但你可以調權重。

接 Ollama 跑本地模型:在意資料隱私、不想把公司文件送上雲端的,可以把 LLM 跟嵌入模型都指向本地 Ollama,整套離線跑。代價是要更好的硬體。

用 API 串進自己的系統:RAGFlow 有提供 API,你可以把它當成後端檢索層,前端用自己的介面,或接到既有的客服系統。要做更複雜的工作流,也能用它的 Agent 編排功能,概念跟 AI Agent 開發那套相通。

常見錯誤與注意事項

記憶體開太小硬裝:16GB 是底線不是建議,低於這個容器會反覆崩潰,新手常卡在這裡找不到原因。
忘了設嵌入模型:很多人只設了回答用的 LLM,忘了嵌入模型,結果文件根本沒被正確向量化,問什麼都答不準。兩個都要設。
切塊模板隨便選或不檢查:用預設模板餵一份結構複雜的 PDF,然後抱怨答案爛——問題八成出在切塊。一定要看視覺化結果,壞了就調。
以為有引用就 100% 正確:可追溯引用是讓你「能驗證」,不是「保證對」。引用降低幻覺風險,但模型仍可能誤讀片段。重要場景請人工複核出處。想多了解 AI 為什麼會亂講,看 AI 幻覺是什麼。
資料隱私沒想清楚:用雲端模型,你的文件片段會送到模型廠商那。敏感資料請走本地模型方案。

TheAI學院評語

市面上能接 RAG 的工具一大堆,但多數把重心放在「怎麼接模型、怎麼存向量」,卻假設文件能乾淨地讀進來。實務上,文件解析才是九成專案翻車的地方。RAGFlow 把力氣花在 DeepDoc 跟切塊視覺化,等於是承認並正面處理這個最髒的工。對要做企業知識庫、又被表格跟掃描檔搞瘋的團隊,這個取捨很對。

做 RAG 久了會懂一句話:答案的品質不是贏在模型多強,是贏在文件有沒有被好好讀進去。RAGFlow 把賭注押在這裡,押對了。

要注意它是工程取向的工具,得會 Docker、要一台像樣的機器,不是裝了就能用的雲端服務。如果你只是個人想簡單試 RAG,門檻可能偏高;但若你要自架、要可控、要處理複雜文件,它值得花一個下午裝起來玩。

資料來源

常見問題

RAGFlow 是免費的嗎?自架要錢嗎?

RAGFlow 本身是開源的,你自己用 Docker 部署在自己的伺服器上,軟體不用付費。但要花的成本有兩塊:一是硬體(建議 16GB 記憶體以上的機器),二是模型費用——你接的雲端 LLM 跟嵌入模型 API 是另外算錢的。如果全部改用本地 Ollama 模型,理論上可以做到零 API 費用,代價是需要更好的硬體。官方另外也有提供雲端版的付費方案,不想自己架的人可以考慮。

我不太會寫程式,裝得起來嗎?

RAGFlow 的安裝主要靠 Docker,只要照著指令 clone 專案、跑 docker compose up,不太需要寫程式。但你得對命令列、Docker 有基本概念,遇到容器起不來、記憶體不足時要能自己 debug,所以說它是工程取向的工具。完全沒碰過終端機的純新手,門檻會偏高,建議先找會 Docker 的同事協助第一次部署。

為什麼一定要選切塊模板?用預設不行嗎?

可以用預設,但結果往往不理想。RAGFlow 的切塊模板是針對不同文件型態設計的——論文、書本、法律、簡報、表格各有對應邏輯。版面複雜的文件用錯模板,會把表格切斷、把標題跟內文混在一起,直接拖垮回答準確度。花一分鐘選對模板、解析後看一下視覺化結果,是性價比最高的一步,別省。

RAGFlow 跟 Dify、LangChain 這類工具差在哪?

定位不同。LangChain 是開發框架,給工程師寫程式組 RAG 流程用;Dify 偏向 LLM 應用開發平台,涵蓋面廣。RAGFlow 則把重心壓在「文件理解與檢索品質」這一段,DeepDoc 深度解析跟切塊視覺化是它的招牌。如果你的痛點是「文件讀不乾淨、答案不準」,RAGFlow 對症;如果你要的是完整的應用編排平台,可能要搭配或改用 Dify 那類工具。

資料來源：theai