使用 Milvus 的 Kotaemon RAG
Kotaemon是一個開放原始碼、簡潔且可自訂的 RAG UI,用來與您的文件聊天。以最終使用者和開發者為中心而建立。
Kotaemon 提供可客製化、多使用者的文件 QA 網頁使用者介面,支援本機和以 API 為基礎的 LLM。它提供混合 RAG 輸送管道,包含全文檢索與向量檢索、含圖表文件的多模式 QA,以及含文件預覽的進階引文。它支援 ReAct 和 ReWOO 等複雜的推理方法,並提供可設定的擷取與產生設定。
本教學將引導您如何使用Milvus 自訂您的 kotaemon 應用程式。
先決條件
安裝
我們建議使用此方式安裝 kotaemon:
# optional (setup env)
conda create -n kotaemon python=3.10
conda activate kotaemon
git clone https://github.com/Cinnamon/kotaemon
cd kotaemon
pip install -e "libs/kotaemon[all]"
pip install -e "libs/ktem"
除了這種方式,還有一些其他的方式來安裝 kotaemon。您可以參考官方文件以獲得更多詳細資訊。
設定 Milvus 為預設向量儲存空間
若要變更預設向量儲存為 Milvus,您必須修改flowsettings.py
檔案,將KH_VECTORSTORE
切換為:
"__type__": "kotaemon.storages.MilvusVectorStore"
設定環境變數
您可以透過.env
檔案,設定連接 LLM 和嵌入模型所需的資訊。例如:OpenAI、Azure、Ollama 等。
執行 Kotaemon
設定環境變數並變更向量儲存後,您可以執行以下指令來執行 kotaemon:
python app.py
預設使用者名稱 / 密碼為 admin
/admin
使用 kotaemon 啟動 RAG
1.新增您的 AI 模型
在Resources
標籤中,您可以新增並設定您的 LLM 和嵌入模型。您可以新增多個模型,並將它們設定為作用中或非作用中。您只需要提供至少一個。您也可以提供多個模型,以便在它們之間切換。
2.上傳您的文件
為了對您的文件進行 QA,您需要先將它們上傳到應用程式。導覽到File Index
索引標籤,您就可以上傳和管理您的自訂文件。
預設情況下,所有應用程式資料都儲存在./ktem_app_data
資料夾。Milvus 資料庫資料儲存在./ktem_app_data/user_data/vectorstore
。您可以備份或複製這個資料夾,以便將安裝移到新的機器上。
3.與您的文件聊天
現在導航回到Chat
標籤。聊天」標籤由 3 個區域組成:「會談設定面板」,您可在此管理會談和檔案參考;「聊天面板」,用於與聊天機器人互動;以及「資訊面板」,用於顯示支持證據、置信度分數和答案的相關性評分。
您可以在「會話設定面板」中選擇您的文件。然後只要在輸入框中輸入訊息,就可以用您的文件啟動 RAG,並將訊息傳送給聊天機器人。
如果您想深入了解如何使用 kotaemon,您可以從官方文件獲得完整的指導。