milvus-logo
LFAI
Casa
  • Guida per l'utente

Con gli iteratori

Milvus fornisce iteratori di ricerca e di query per iterare i risultati con un grande volume di entità. Poiché Milvus limita TopK a 16384, gli utenti possono usare gli iteratori per restituire grandi numeri o addirittura intere entità in una collezione in modalità batch.

Panoramica

Gli iteratori sono strumenti potenti che consentono di iterare un grande volume di dati o tutti i dati all'interno di un insieme utilizzando valori di chiavi primarie ed espressioni booleane. Questo può migliorare significativamente il modo in cui si recuperano i dati. A differenza dell'uso tradizionale dei parametri offset e limit, che possono diventare meno efficienti nel tempo, gli iteratori offrono una soluzione più scalabile.

Vantaggi dell'uso degli iteratori

  • Semplicità: Eliminano le complesse impostazioni di offset e limite.

  • Efficienza: Fornisce un recupero scalabile dei dati, recuperando solo i dati necessari.

  • Coerenza: Assicura una dimensione coerente del set di dati con i filtri booleani.

note

  • Questa funzione è disponibile per Milvus 2.3.x o successivo.

Preparazione

I passaggi seguenti ripropongono il codice per connettersi a Milvus, impostare rapidamente una raccolta e inserire oltre 10.000 entità generate casualmente nella raccolta.

Passo 1: Creare una collezione

Utilizzare MilvusClient per connettersi al server Milvus e create_collection() per creare una raccolta.

Utilizzare MilvusClientV2 per connettersi al server Milvus e createCollection() per creare una raccolta.

from pymilvus import MilvusClient

# 1. Set up a Milvus client
client = MilvusClient(
    uri="http://localhost:19530"
)

# 2. Create a collection
client.create_collection(
    collection_name="quick_setup",
    dimension=5,
)
import io.milvus.client.MilvusServiceClient;
import io.milvus.param.ConnectParam;
import io.milvus.param.highlevel.collection.CreateSimpleCollectionParam;

String CLUSTER_ENDPOINT = "http://localhost:19530";

// 1. Connect to Milvus server
ConnectParam connectParam = ConnectParam.newBuilder()
        .withUri(CLUSTER_ENDPOINT)
        .build();

MilvusServiceClient client  = new MilvusServiceClient(connectParam);

// 2. Create a collection
CreateSimpleCollectionParam createCollectionParam = CreateSimpleCollectionParam.newBuilder()
        .withCollectionName("quick_setup")
        .withDimension(5)
        .build();

client.createCollection(createCollectionParam);

Passo 2: Inserire entità generate casualmente

Utilizzare insert() per inserire le entità nell'insieme.

Utilizzare insert() per inserire entità nell'insieme.

# 3. Insert randomly generated vectors 
colors = ["green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey"]
data = []

for i in range(10000):
    current_color = random.choice(colors)
    current_tag = random.randint(1000, 9999)
    data.append({
        "id": i,
        "vector": [ random.uniform(-1, 1) for _ in range(5) ],
        "color": current_color,
        "tag": current_tag,
        "color_tag": f"{current_color}_{str(current_tag)}"
    })

print(data[0])

# Output
#
# {
#     "id": 0,
#     "vector": [
#         -0.5705990742218152,
#         0.39844925120642083,
#         -0.8791287928610869,
#         0.024163154953680932,
#         0.6837669917169638
#     ],
#     "color": "purple",
#     "tag": 7774,
#     "color_tag": "purple_7774"
# }

res = client.insert(
    collection_name="quick_setup",
    data=data,
)

print(res)

# Output
#
# {
#     "insert_count": 10000,
#     "ids": [
#         0,
#         1,
#         2,
#         3,
#         4,
#         5,
#         6,
#         7,
#         8,
#         9,
#         "(9990 more items hidden)"
#     ]
# }
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Random;

import com.alibaba.fastjson.JSONObject;

import io.milvus.param.R;
import io.milvus.param.dml.InsertParam;
import io.milvus.response.MutationResultWrapper;
import io.milvus.grpc.MutationResult;


// 3. Insert randomly generated vectors into the collection
List<String> colors = Arrays.asList("green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey");
List<JSONObject> data = new ArrayList<>();

for (int i=0; i<10000; i++) {
    Random rand = new Random();
    String current_color = colors.get(rand.nextInt(colors.size()-1));
    JSONObject row = new JSONObject();
    row.put("id", Long.valueOf(i));
    row.put("vector", Arrays.asList(rand.nextFloat(), rand.nextFloat(), rand.nextFloat(), rand.nextFloat(), rand.nextFloat()));
    row.put("color_tag", current_color + "_" + String.valueOf(rand.nextInt(8999) + 1000));
    data.add(row);
}

InsertParam insertParam = InsertParam.newBuilder()
    .withCollectionName("quick_setup")
    .withRows(data)
    .build();

R<MutationResult> insertRes = client.insert(insertParam);

if (insertRes.getStatus() != R.Status.Success.getCode()) {
    System.err.println(insertRes.getMessage());
}

MutationResultWrapper wrapper = new MutationResultWrapper(insertRes.getData());
System.out.println(wrapper.getInsertCount());

Ricerca con iteratore

Gli iteratori rendono le ricerche di similarità più scalabili.

Per cercare con un iteratore, chiamare il metodo search_iterator():

Per cercare con un iteratore, chiamare il metodo searchIterator():

  1. Inizializzare l'iteratore di ricerca per definire i parametri di ricerca e i campi di output.

  2. Utilizzare il metodo next() all'interno di un ciclo per scorrere i risultati della ricerca.

    • Se il metodo restituisce un array vuoto, il ciclo termina e non sono disponibili altre pagine.

    • Tutti i risultati contengono i campi di output specificati.

  3. Chiamare manualmente il metodo close() per chiudere l'iteratore una volta recuperati tutti i dati.

from pymilvus import Collection

# 4. Search with iterator
connections.connect(host="127.0.0.1", port=19530)
collection = Collection("quick_setup")

query_vectors = [[0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]]
search_params = {
    "metric_type": "IP",
    "params": {"nprobe": 10}
}

iterator = collection.search_iterator(
    data=query_vectors,
    anns_field="vector",
    batch_size=10,
    param=search_params,
    output_fields=["color_tag"],
    limit=3
)

results = []

while True:
    result = iterator.next()
    if not result:
        iterator.close()
        break
        
    results.extend(result)
    
    for hit in result:
        results.append(hit.to_dict())

print(results)

# Output
#
# [
#     {
#         "id": 1756,
#         "distance": 2.0642056465148926,
#         "entity": {
#             "color_tag": "black_9109"
#         }
#     },
#     {
#         "id": 6488,
#         "distance": 1.9437453746795654,
#         "entity": {
#             "color_tag": "purple_8164"
#         }
#     },
#     {
#         "id": 3338,
#         "distance": 1.9107104539871216,
#         "entity": {
#             "color_tag": "brown_8121"
#         }
#     }
# ]
import io.milvus.param.dml.QueryIteratorParam;
import io.milvus.param.dml.SearchIteratorParam;
import io.milvus.response.QueryResultsWrapper;
import io.milvus.orm.iterator.SearchIterator;

// 4. Search with iterators
SearchIteratorParam iteratorParam = SearchIteratorParam.newBuilder()
    .withCollectionName("quick_setup")
    .withVectorFieldName("vector")
    // Use withFloatVectors() in clusters compatible with Milvus 2.4.x
    .withVectors(Arrays.asList(0.3580376395471989f, -0.6023495712049978f, 0.18414012509913835f, -0.26286205330961354f, 0.9029438446296592f))
    .withBatchSize(10L)
    .withParams("{\"metric_type\": \"COSINE\", \"params\": {\"level\": 1}}")
    .build();
        

R<SearchIterator> searchIteratorRes = client.searchIterator(iteratorParam);

if (searchIteratorRes.getStatus() != R.Status.Success.getCode()) {
    System.err.println(searchIteratorRes.getMessage());
}

SearchIterator searchIterator = searchIteratorRes.getData();
List<QueryResultsWrapper.RowRecord> results = new ArrayList<>();

while (true) {
    List<QueryResultsWrapper.RowRecord> batchResults = searchIterator.next();
    if (batchResults.isEmpty()) {
        searchIterator.close();
        break;
    }
    for (QueryResultsWrapper.RowRecord rowRecord : batchResults) {
        results.add(rowRecord);
    }
}

System.out.println(results.size());
Parametro Descrizione
data Un elenco di incorporazioni vettoriali.
Milvus cerca le incorporazioni vettoriali più simili a quelle specificate.
anns_field Il nome del campo vettoriale nella collezione corrente.
batch_size Il numero di entità da restituire ogni volta che si chiama next() sull'iteratore corrente.
Il valore predefinito è 1000. Impostare un valore corretto per controllare il numero di entità da restituire per ogni iterazione.
param Le impostazioni dei parametri specifiche per questa operazione.
  • metric_type: Il tipo di metrica applicata a questa operazione. Deve essere lo stesso utilizzato quando si indicizza il campo vettoriale specificato sopra. I valori possibili sono L2, IP, COSINE, JACCARD, HAMMING.
  • params: Parametri aggiuntivi. Per i dettagli, fare riferimento a search_iterator().
output_fields Un elenco di nomi di campi da includere in ogni entità restituita.
Il valore predefinito è Nessuno. Se non specificato, viene incluso solo il campo primario.
limit Il numero totale di entità da restituire.
Il valore predefinito è -1, a indicare che tutte le entità corrispondenti saranno restituite.
Parametro Descrizione
withCollectionName Imposta il nome della raccolta. Il nome della collezione non può essere vuoto o nullo.
withVectorFieldName Impostare il nome del campo del vettore di destinazione. Il nome del campo non può essere vuoto o nullo.
withVectors Impostare i vettori di destinazione. Sono ammessi fino a 16384 vettori.
withBatchSize Il numero di entità da restituire ogni volta che si richiama next() sull'iteratore corrente.
Il valore predefinito è 1000. Impostare un valore corretto per controllare il numero di entità da restituire per ogni iterazione.
withParams Specifica i parametri della ricerca in formato JSON. Per ulteriori informazioni, consultare searchIterator().

Interrogazione con un iteratore

Per eseguire una query con un iteratore, chiamare il metodo query_iterator():

Per effettuare una ricerca con un iteratore, chiamare il metodo queryIterator():

# 6. Query with iterator
iterator = collection.query_iterator(
    batch_size=10, # Controls the size of the return each time you call next()
    expr="color_tag like \"brown_8\"",
    output_fields=["color_tag"]
)

results = []

while True:
    result = iterator.next()
    if not result:
        iterator.close()
        break
        
    results.extend(result)
    
# 8. Check the search results
print(len(results))

print(results[:3])

# Output
#
# [
#     {
#         "color_tag": "brown_8785",
#         "id": 94
#     },
#     {
#         "color_tag": "brown_8568",
#         "id": 176
#     },
#     {
#         "color_tag": "brown_8721",
#         "id": 289
#     }
# ]
import io.milvus.param.dml.QueryIteratorParam;
import io.milvus.orm.iterator.QueryIterator;

// 5. Query with iterators

try {
    Files.write(Path.of("results.json"), JSON.toJSONString(new ArrayList<>()).getBytes(), StandardOpenOption.CREATE, StandardOpenOption.TRUNCATE_EXISTING);
} catch (Exception e) {
    // TODO: handle exception
    e.printStackTrace();
}

QueryIteratorParam queryIteratorParam = QueryIteratorParam.newBuilder()
    .withCollectionName("quick_setup")
    .withExpr("color_tag like \"brown_8%\"")
    .withBatchSize(50L)
    .addOutField("vector")
    .addOutField("color_tag")
    .build();

R<QueryIterator> queryIteratRes = client.queryIterator(queryIteratorParam);

if (queryIteratRes.getStatus() != R.Status.Success.getCode()) {
    System.err.println(queryIteratRes.getMessage());
}

QueryIterator queryIterator = queryIteratRes.getData();

while (true) {
    List<QueryResultsWrapper.RowRecord> batchResults = queryIterator.next();
    if (batchResults.isEmpty()) {
        queryIterator.close();
        break;
    }

    String jsonString = "";
    List<JSONObject> jsonObject = new ArrayList<>();
    try {
        jsonString = Files.readString(Path.of("results.json"));
        jsonObject = JSON.parseArray(jsonString).toJavaList(null);
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

    for (QueryResultsWrapper.RowRecord queryResult : batchResults) {
        JSONObject row = new JSONObject();
        row.put("id", queryResult.get("id"));
        row.put("vector", queryResult.get("vector"));
        row.put("color_tag", queryResult.get("color_tag"));
        jsonObject.add(row);
    }

    try {
        Files.write(Path.of("results.json"), JSON.toJSONString(jsonObject).getBytes(), StandardOpenOption.WRITE);
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}
Parametro Descrizione
batch_size Il numero di entità da restituire ogni volta che si richiama next() sull'iteratore corrente.
Il valore predefinito è 1000. Impostare un valore appropriato per controllare il numero di entità da restituire per ogni iterazione.
expr Una condizione di filtraggio scalare per filtrare le entità corrispondenti.
Il valore predefinito è None, a indicare che il filtraggio scalare è ignorato. Per creare una condizione di filtraggio scalare, fare riferimento a Regole di espressione booleana.
output_fields Un elenco di nomi di campi da includere in ogni entità di ritorno.
Il valore predefinito è Nessuno. Se non viene specificato, viene incluso solo il campo primario.
limit Il numero totale di entità da restituire.
Il valore predefinito è -1, a indicare che tutte le entità corrispondenti saranno restituite.
Parametro Descrizione
withCollectionName Imposta il nome della raccolta. Il nome della collezione non può essere vuoto o nullo.
withExpr Impostare l'espressione per interrogare le entità. Per creare una condizione di filtraggio scalare, fare riferimento a Regole di espressione booleana.
withBatchSize Il numero di entità da restituire ogni volta che si richiama next() sull'iteratore corrente.
Il valore predefinito è 1000. Impostare un valore corretto per controllare il numero di entità da restituire per ogni iterazione.
addOutField Specifica un campo scalare di uscita (facoltativo).

Tradotto daDeepLogo

Feedback

Questa pagina è stata utile?