使用 Milvus 的知識表
由WhyHow AI 所開發的Knowledge Table 是一套開放原始碼套件,設計用來協助從非結構化文檔中萃取與探索結構化資料。它為使用者提供類似試算表的介面,並可透過自然語言查詢介面建立表格和圖表等知識表象。該套件包括可自訂的擷取規則、格式化選項,以及透過來源進行的資料追溯,使其適用於各種不同的應用程式。它支援與 RAG 工作流程的無縫整合,同時滿足需要友善使用者介面的企業用戶和需要彈性後端以進行有效文件處理的開發人員的需求。
在預設情況下,Knowledge Table 使用 Milvus 資料庫來儲存和檢索擷取的資料。這使得用戶可以使用 Milvus 的強大功能輕鬆地搜索、過濾和分析數據。在本教程中,我們將介紹如何開始使用 Knowledge Table 和 Milvus。
先決條件
- Docker
- Docker Compose
克隆專案
$ git clone https://github.com/whyhow-ai/knowledge-table.git
設定環境
您可以在專案根目錄中找到.env.example
檔案。複製這個檔案到.env
並填入所需的環境變數。
對於 Milvus,您應該設定MILVUS_DB_URI
和MILVUS_DB_TOKEN
環境變數。以下是一些提示:
- 將
MILVUS_DB_URI
設定為本機檔案,例如./milvus.db
,是最方便的方法,因為它會自動利用Milvus Lite將所有資料儲存在這個檔案中。- 如果您有大規模的資料,例如超過一百萬個向量,您可以在Docker 或 Kubernetes 上架設效能更高的 Milvus 伺服器。在此設定中,請使用伺服器位址和連接埠作為您的 uri,例如
http://localhost:19530
。如果您啟用 Milvus 上的驗證功能,請使用「<your_username>:<your_password>」作為令牌,否則請勿設定令牌。- 如果您要使用Zilliz Cloud,Milvus 的完全管理雲端服務,請調整
MILVUS_DB_URI
和MILVUS_DB_TOKEN
,對應 Zilliz Cloud 的Public Endpoint 和 Api key。
除了 Milvus,您也應該設定其他環境,例如OPENAI_API_KEY
。您可以從各個網站取得這些設定。
啟動應用程式
$ docker compose up -d --build
停止應用程式
$ docker compose down
存取專案
前台可從http://localhost:3000
存取,後台可從http://localhost:8000
存取。
您可以玩弄 UI 並嘗試使用自己的文件。
如需進一步的使用示範,您可以參考官方的Knowledge Table 文件。