RegexCompatible with Milvus 2.5.11+
El filtro regex es un filtro de expresión regular: cualquier token producido por el tokenizador se mantiene sólo si coincide con la expresión que proporcione; todo lo demás se descarta.
Configuración
El filtro regex es un filtro personalizado de Milvus. Para utilizarlo, especifique "type": "regex" en la configuración del filtro, junto con un parámetro expr para especificar las expresiones regulares deseadas.
{
"tokenizer": "standard",
"filter": [{
"type": "regex",
"expr": "^(?!test)" # keep tokens that do NOT start with "test"
}]
}
// java
// node
// go
# curl
El filtro regex acepta los siguientes parámetros configurables.
Parámetro |
Descripción |
|---|---|
|
Un patrón de expresión regular aplicado a cada token. Los tokens que coinciden se conservan; los que no coinciden se eliminan. Para obtener más información sobre la sintaxis de expresiones regulares, consulte Sintaxis. |
El filtro regex funciona con los términos generados por el tokenizador, por lo que debe utilizarse en combinación con un tokenizador.
Después de definir analyzer_params, puede aplicarlos a un campo VARCHAR al definir un esquema de colección. Esto permite a Milvus procesar el texto de ese campo utilizando el analizador especificado para una tokenización y filtrado eficientes. Para más detalles, consulte Ejemplo de uso.
Ejemplos
Antes de aplicar la configuración del analizador a su esquema de recopilación, verifique su comportamiento utilizando el método run_analyzer.
Configuración del analizador
{
"tokenizer": "standard",
"filter": [{
"type": "regex",
"expr": "^(?!test)"
}]
}
// java
// node
// go
# curl
Verificación mediante run_analyzer
# Sample text to analyze
sample_text = "testItem apple testCase banana"
# Run the standard analyzer with the defined configuration
result = MilvusClient.run_analyzer(sample_text, analyzer_params)
print(result)
// java
// node
// go
# curl
Salida esperada
['apple', 'banana']