Gestion des métadonnées Milvus (2) Champs de la table des métadonnées
Champs dans la table des métadonnées
Auteur : Yihua Mo
Date : 2019-12-27
Dans le dernier blog, nous avons mentionné comment afficher vos métadonnées à l'aide de MySQL ou de SQLite. Cet article vise principalement à présenter en détail les champs des tables de métadonnées.
Champs de la table "Tables
Prenons l'exemple de SQLite. Le résultat suivant provient de la version 0.5.0. Certains champs ont été ajoutés à la version 0.6.0 et seront présentés ultérieurement. Il y a une ligne dans Tables
qui spécifie une table vectorielle de 512 dimensions avec le nom table_1
. Lors de la création de la table, index_file_size
vaut 1024 Mo, engine_type
vaut 1 (FLAT), nlist
vaut 16384, metric_type
vaut 1 (distance euclidienne L2). id
est l'identifiant unique de la table. state
est l'état de la table, 0 indiquant un état normal. created_on
est l'heure de création. flag
est l'indicateur réservé à un usage interne.
tables
Le tableau suivant indique les types de champs et les descriptions des champs de Tables
.
Nom du champ | Type de données | Description |
---|---|---|
id | int64 | Identifiant unique de la table vectorielle. id s'incrémente automatiquement. |
table_id | string | Nom de la table vectorielle. table_id doit être défini par l'utilisateur et respecter les directives Linux relatives aux noms de fichiers. |
state | int32 | État de la table vectorielle. 0 signifie normal et 1 signifie supprimé (soft delete). |
dimension | int16 | Dimension du tableau vectoriel. Doit être définie par l'utilisateur. |
created_on | int64 | Nombre de millisecondes entre le 1er janvier 1970 et le moment où la table est créée. |
flag | int64 | Indicateur à usage interne, indiquant par exemple si l'identifiant du vecteur est défini par l'utilisateur. La valeur par défaut est 0. |
index_file_size | int64 | Si la taille d'un fichier de données atteint index_file_size , le fichier n'est pas combiné et est utilisé pour construire des index. La valeur par défaut est 1024 (MB). |
engine_type | int32 | Type d'index à construire pour une table vectorielle. La valeur par défaut est 0, ce qui signifie que l'index n'est pas valide. 1 spécifie FLAT. 2 spécifie IVFLAT. 3 spécifie IVFSQ8. 4 spécifie NSG. 5 spécifie IVFSQ8H. |
nlist | int32 | Nombre de grappes dans lesquelles les vecteurs de chaque fichier de données sont divisés lors de la construction de l'index. La valeur par défaut est 16384. |
metric_type | int32 | Méthode de calcul de la distance entre les vecteurs. 1 spécifie la distance euclidienne (L1) et 2 spécifie le produit intérieur. |
Le partitionnement des tables est activé dans la version 0.6.0 avec quelques nouveaux champs, dont owner_table
,partition_tag
et version
. Une table vectorielle, table_1
, possède une partition appelée table_1_p1
, qui est également une table vectorielle. partition_name
correspond à table_id
. Les champs d'une table de partition sont hérités de la table propriétaire, le champ owner table
spécifiant le nom de la table propriétaire et le champ partition_tag
spécifiant l'étiquette de la partition.
tables_new
Le tableau suivant présente les nouveaux champs de la version 0.6.0 :
Nom du champ | Type de données | Type de données Description |
---|---|---|
owner_table | string (chaîne de caractères) | Table parent de la partition. |
partition_tag | chaîne | Étiquette de la partition. Ne doit pas être une chaîne vide. |
version | chaîne | Version de Milvus. |
Champs de la table "TableFiles"
L'exemple suivant contient deux fichiers appartenant tous deux à la table vectorielle table_1
. Le type d'index (engine_type
) du premier fichier est 1 (FLAT) ; l'état du fichier (file_type
) est 7 (sauvegarde du fichier original) ; file_size
est 411200113 octets ; le nombre de lignes du vecteur est 200 000. Le type d'index du deuxième fichier est 2 (IVFLAT) ; l'état du fichier est 3 (fichier d'index). Le deuxième fichier est en fait l'index du premier fichier. Nous présenterons plus d'informations dans les prochains articles.
fichiers de table
Le tableau suivant présente les champs et les descriptions de TableFiles
:
Nom du champ | Type de données | Description |
---|---|---|
id | int64 | Identifiant unique d'une table vectorielle. id s'incrémente automatiquement. |
table_id | string | Nom de la table vectorielle. |
engine_type | int32 | Type d'index à construire pour une table vectorielle. La valeur par défaut est 0, ce qui signifie que l'index n'est pas valide. 1 spécifie FLAT. 2 spécifie IVFLAT. 3 spécifie IVFSQ8. 4 spécifie NSG. 5 spécifie IVFSQ8H. |
file_id | chaîne | Nom de fichier généré à partir de l'heure de création du fichier. Egal à 1000 multiplié par le nombre de millisecondes entre le 1er janvier 1970 et l'heure de création de la table. |
file_type | int32 | État du fichier. 0 indique un fichier de données vectorielles brutes nouvellement généré. 1 spécifie un fichier de données vectorielles brutes. 2 indique qu'un index sera créé pour le fichier. 3 indique que le fichier est un fichier d'index. 4 indique que le fichier sera supprimé (suppression douce). 5 spécifie que le fichier est nouvellement généré et utilisé pour stocker les données de combinaison. 6 indique que le fichier est nouvellement créé et utilisé pour stocker des données d'index. 7 indique l'état de la sauvegarde du fichier de données vectorielles brutes. |
file_size | int64 | Taille du fichier en octets. |
row_count | int64 | Nombre de vecteurs dans un fichier. |
updated_time | int64 | Horodatage de la dernière heure de mise à jour, qui spécifie le nombre de millisecondes entre le 1er janvier 1970 et l'heure de création de la table. |
created_on | int64 | Nombre de millisecondes entre le 1er janvier 1970 et la date de création du tableau. |
date | int32 | Date de création de la table. Elle est encore présente pour des raisons historiques et sera supprimée dans les versions futures. |
Blogs associés
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word