Panoramica dell'architettura di Milvus
Costruito sulla base delle più diffuse librerie di ricerca vettoriale, tra cui Faiss, HNSW, DiskANN, SCANN e altre, Milvus è stato progettato per la ricerca di similarità su insiemi di dati vettoriali densi, contenenti milioni, miliardi o addirittura trilioni di vettori. Prima di procedere, è bene familiarizzare con i principi di base dell'embedding retrieval.
Milvus supporta anche lo sharding dei dati, l'ingestione di dati in streaming, lo schema dinamico, la ricerca combinata di dati vettoriali e scalari, la ricerca ibrida e multi-vettore, il vettore sparse e molte altre funzioni avanzate. La piattaforma offre prestazioni on demand e può essere ottimizzata per adattarsi a qualsiasi scenario di embedding retrieval. Si consiglia di distribuire Milvus utilizzando Kubernetes per ottenere disponibilità ed elasticità ottimali.
Milvus adotta un'architettura di storage condiviso che prevede la disaggregazione dello storage e dell'elaborazione e la scalabilità orizzontale dei nodi di elaborazione. Seguendo il principio della disaggregazione del piano dati e del piano di controllo, Milvus comprende quattro livelli: livello di accesso, servizio di coordinamento, nodo lavoratore e storage. Questi livelli sono indipendenti l'uno dall'altro per quanto riguarda la scalabilità o il disaster recovery.
Diagramma_architettura
Cosa c'è dopo
- Per saperne di più sulla disaggregazione tra calcolo e storage in Milvus
- Scopri i componenti principali di Milvus.