🚀 免費嘗試 Zilliz Cloud,完全托管的 Milvus,體驗速度提升 10 倍!立即嘗試

milvus-logo
LFAI
  • Home
  • Blog
  • Milvus 元資料管理 (2) 元資料表中的欄位

Milvus 元資料管理 (2) 元資料表中的欄位

  • Engineering
December 27, 2019
Yihua Mo

元資料表中的欄位

作者:莫毅華

日期: 2019-12-27

在上一篇博客中,我們提到了如何使用 MySQL 或 SQLite 檢視元資料。本文主要想詳細介紹一下元資料表中的欄位。

Tables" 表中的欄位

以 SQLite 為例。以下結果來自 0.5.0。有些欄位是在 0.6.0 加入的,稍後會介紹。在Tables 中有一列指定了一個 512 維向量表,其名稱為table_1 。表建立時,index_file_size 是 1024 MB,engine_type 是 1 (FLAT),nlist 是 16384,metric_type 是 1 (歐氏距離 L2)。id 是表的唯一識別碼。state 是表的狀態,0 表示正常狀態。created_on 是建立時間。flag 是保留給內部使用的標誌。

tables 表格

下表顯示Tables 中的欄位類型和說明。

欄位名稱資料類型說明
idint64向量表的唯一識別碼。id 自動遞增。
table_id字串向量表的名稱。table_id 必須由使用者定義,並遵循 Linux 檔名指引。
stateint32向量表的狀態。0 代表正常,1 代表已刪除 (軟刪除)。
dimensionint16向量表的向量尺寸。必須由使用者定義。
created_onint64從 1970 年 1 月 1 日到資料表建立時間的毫秒數。
flagint64內部使用的旗標,例如向量 id 是否是使用者定義。預設為 0。
index_file_sizeint64如果資料檔案的大小達到index_file_size ,該檔案不會合併,而是用來建立索引。預設為 1024 (MB)。
engine_typeint32要為向量表建立的索引類型。預設為 0,表示無效索引。1 指定 FLAT。2 指定 IVFLAT。3 指定 IVFSQ8。4 指定 NSG。5 指定 IVFSQ8H。
nlistint32建立索引時,每個資料檔中向量所分成的叢集數。預設為 16384。
metric_typeint32計算向量距離的方法。1 指定 Euclidean distance (L1),2 指定 inner product。

0.6.0 啟用了表分割,並新增了一些欄位,包括owner_tablepartition_tagversion 。一個向量表table_1 ,有一個分區叫table_1_p1 ,也是一個向量表。partition_name 對應於table_id 。分区表中的字段继承自所有者表,其中owner table 字段指定所有者表的名称,partition_tag 字段指定分区的标记。

tables_new 表_新

下表顯示 0.6.0 新增的欄位:

欄位名稱資料類型說明
owner_table字串分區的父表。
partition_tag字串分區的標籤。不得為空字串。
version字串Milvus 版本。

TableFiles" 表中的欄位

以下範例包含兩個檔案,都屬於table_1 向量表。第一個檔案的索引類型 (engine_type) 是 1 (FLAT);檔案狀態 (file_type) 是 7 (原始檔案的備份);file_size 是 411200113 位元組;向量行數是 200,000。第二個檔案的索引類型是 2 (IVFLAT);檔案狀態是 3 (索引檔案)。第二個檔案實際上是第一個檔案的索引。我們會在接下來的文章中介紹更多資訊。

tablefiles 表檔案

下表顯示TableFiles 的欄位和說明:

欄位名稱資料類型說明
idint64向量表的唯一識別碼。id 自動遞增。
table_id字串向量表的名稱。
engine_typeint32要為向量表建立的索引類型。預設為 0,表示無效索引。1 指定 FLAT。2 指定 IVFLAT。3 指定 IVFSQ8。4 指定 NSG。5 指定 IVFSQ8H。
file_id字串從檔案建立時間產生的檔案名稱。等於 1000 乘以從 1970 年 1 月 1 日到表格建立時間的毫秒數。
file_typeint32檔案狀態。0 表示新產生的原始向量資料檔案。1 指定原始向量資料檔案。2 表示將為檔案建立索引。3 表示檔案是索引檔案。4 表示將刪除檔案(軟刪除)。5 指定檔案為新產生,用於儲存組合資料。6 指定該檔案為新產生,並用於儲存索引資料。7 指定原始向量資料檔案的備份狀態。
file_sizeint64檔案大小(位元組)。
row_countint64檔案中向量的數量。
updated_timeint64最新更新時間的時間戳記,指定從 1970 年 1 月 1 日到資料表建立時間的毫秒數。
created_onint64從 1970 年 1 月 1 日到資料表建立時間的毫秒數。
dateint32建立資料表的日期。由於歷史原因仍保留在此,將在未來版本中移除。

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started

Like the article? Spread the word

繼續閱讀