RegexCompatible with Milvus 2.5.11+

El filtro regex es un filtro de expresión regular: cualquier token producido por el tokenizador se mantiene sólo si coincide con la expresión que proporcione; todo lo demás se descarta.

Configuración

El filtro regex es un filtro personalizado de Milvus. Para utilizarlo, especifique "type": "regex" en la configuración del filtro, junto con un parámetro expr para especificar las expresiones regulares deseadas.

{
    "tokenizer": "standard",
    "filter": [{
        "type": "regex",
        "expr": "^(?!test)" # keep tokens that do NOT start with "test"
    }]
}
// java
// node
// go
# curl

El filtro regex acepta los siguientes parámetros configurables.

Parámetro

Descripción

expr

Un patrón de expresión regular aplicado a cada token. Los tokens que coinciden se conservan; los que no coinciden se eliminan. Para obtener más información sobre la sintaxis de expresiones regulares, consulte Sintaxis.

El filtro regex funciona con los términos generados por el tokenizador, por lo que debe utilizarse en combinación con un tokenizador.

Después de definir analyzer_params, puede aplicarlos a un campo VARCHAR al definir un esquema de colección. Esto permite a Milvus procesar el texto de ese campo utilizando el analizador especificado para una tokenización y filtrado eficientes. Para más detalles, consulte Ejemplo de uso.

Ejemplos

Antes de aplicar la configuración del analizador a su esquema de recopilación, verifique su comportamiento utilizando el método run_analyzer.

Configuración del analizador

{
    "tokenizer": "standard",
    "filter": [{
        "type": "regex",
        "expr": "^(?!test)"
    }]
}
// java
// node
// go
# curl

Verificación mediante run_analyzer

# Sample text to analyze
sample_text = "testItem apple testCase banana"

# Run the standard analyzer with the defined configuration
result = MilvusClient.run_analyzer(sample_text, analyzer_params)
print(result)
// java
// node
// go
# curl

Salida esperada

['apple', 'banana']

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started
Feedback

¿Fue útil esta página?