Milvus 元資料管理 (2) 元資料表中的欄位
元資料表中的欄位
作者:莫毅華
日期: 2019-12-27
在上一篇博客中,我們提到了如何使用 MySQL 或 SQLite 檢視元資料。本文主要想詳細介紹一下元資料表中的欄位。
Tables
" 表中的欄位
以 SQLite 為例。以下結果來自 0.5.0。有些欄位是在 0.6.0 加入的,稍後會介紹。在Tables
中有一列指定了一個 512 維向量表,其名稱為table_1
。表建立時,index_file_size
是 1024 MB,engine_type
是 1 (FLAT),nlist
是 16384,metric_type
是 1 (歐氏距離 L2)。id
是表的唯一識別碼。state
是表的狀態,0 表示正常狀態。created_on
是建立時間。flag
是保留給內部使用的標誌。
表格
下表顯示Tables
中的欄位類型和說明。
欄位名稱 | 資料類型 | 說明 |
---|---|---|
id | int64 | 向量表的唯一識別碼。id 自動遞增。 |
table_id | 字串 | 向量表的名稱。table_id 必須由使用者定義,並遵循 Linux 檔名指引。 |
state | int32 | 向量表的狀態。0 代表正常,1 代表已刪除 (軟刪除)。 |
dimension | int16 | 向量表的向量尺寸。必須由使用者定義。 |
created_on | int64 | 從 1970 年 1 月 1 日到資料表建立時間的毫秒數。 |
flag | int64 | 內部使用的旗標,例如向量 id 是否是使用者定義。預設為 0。 |
index_file_size | int64 | 如果資料檔案的大小達到index_file_size ,該檔案不會合併,而是用來建立索引。預設為 1024 (MB)。 |
engine_type | int32 | 要為向量表建立的索引類型。預設為 0,表示無效索引。1 指定 FLAT。2 指定 IVFLAT。3 指定 IVFSQ8。4 指定 NSG。5 指定 IVFSQ8H。 |
nlist | int32 | 建立索引時,每個資料檔中向量所分成的叢集數。預設為 16384。 |
metric_type | int32 | 計算向量距離的方法。1 指定 Euclidean distance (L1),2 指定 inner product。 |
0.6.0 啟用了表分割,並新增了一些欄位,包括owner_table
,partition_tag
和version
。一個向量表table_1
,有一個分區叫table_1_p1
,也是一個向量表。partition_name
對應於table_id
。分区表中的字段继承自所有者表,其中owner table
字段指定所有者表的名称,partition_tag
字段指定分区的标记。
表_新
下表顯示 0.6.0 新增的欄位:
欄位名稱 | 資料類型 | 說明 |
---|---|---|
owner_table | 字串 | 分區的父表。 |
partition_tag | 字串 | 分區的標籤。不得為空字串。 |
version | 字串 | Milvus 版本。 |
TableFiles"
表中的欄位
以下範例包含兩個檔案,都屬於table_1
向量表。第一個檔案的索引類型 (engine_type
) 是 1 (FLAT);檔案狀態 (file_type
) 是 7 (原始檔案的備份);file_size
是 411200113 位元組;向量行數是 200,000。第二個檔案的索引類型是 2 (IVFLAT);檔案狀態是 3 (索引檔案)。第二個檔案實際上是第一個檔案的索引。我們會在接下來的文章中介紹更多資訊。
表檔案
下表顯示TableFiles
的欄位和說明:
欄位名稱 | 資料類型 | 說明 |
---|---|---|
id | int64 | 向量表的唯一識別碼。id 自動遞增。 |
table_id | 字串 | 向量表的名稱。 |
engine_type | int32 | 要為向量表建立的索引類型。預設為 0,表示無效索引。1 指定 FLAT。2 指定 IVFLAT。3 指定 IVFSQ8。4 指定 NSG。5 指定 IVFSQ8H。 |
file_id | 字串 | 從檔案建立時間產生的檔案名稱。等於 1000 乘以從 1970 年 1 月 1 日到表格建立時間的毫秒數。 |
file_type | int32 | 檔案狀態。0 表示新產生的原始向量資料檔案。1 指定原始向量資料檔案。2 表示將為檔案建立索引。3 表示檔案是索引檔案。4 表示將刪除檔案(軟刪除)。5 指定檔案為新產生,用於儲存組合資料。6 指定該檔案為新產生,並用於儲存索引資料。7 指定原始向量資料檔案的備份狀態。 |
file_size | int64 | 檔案大小(位元組)。 |
row_count | int64 | 檔案中向量的數量。 |
updated_time | int64 | 最新更新時間的時間戳記,指定從 1970 年 1 月 1 日到資料表建立時間的毫秒數。 |
created_on | int64 | 從 1970 年 1 月 1 日到資料表建立時間的毫秒數。 |
date | int32 | 建立資料表的日期。由於歷史原因仍保留在此,將在未來版本中移除。 |
相關部落格
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word