Zhentu: el detector de fraudes fotográficos basado en Milvus
imagen de portada
Este artículo ha sido escrito por Yan Shi y Minwei Tang, ingenieros superiores de algoritmos de BestPay, y traducido por Rosie Zhang.
En los últimos años, a medida que el comercio electrónico y las transacciones en línea se han convertido en algo habitual en todo el mundo, también ha florecido el fraude en el comercio electrónico. Mediante el uso de fotos generadas por ordenador en lugar de las reales para pasar la verificación de identidad en las plataformas de negocios en línea, los estafadores crean cuentas falsas masivas y se aprovechan de las ofertas especiales de las empresas (por ejemplo, regalos de membresía, cupones, fichas), lo que conlleva pérdidas irrecuperables tanto para los consumidores como para las empresas.
Los métodos tradicionales de control de riesgos ya no son eficaces ante la gran cantidad de datos. Para resolver el problema, BestPay creó un detector de fraudes fotográficos, denominado Zhentu (que significa detectar imágenes en chino), basado en tecnologías de aprendizaje profundo (DL) y procesamiento digital de imágenes (DIP). Zhentu es aplicable a varios escenarios que implican el reconocimiento de imágenes, y una rama importante es la identificación de licencias comerciales falsas. Si la foto de la licencia comercial enviada por un usuario es muy similar a otra foto ya existente en la biblioteca de fotos de una plataforma, es probable que el usuario haya robado la foto en algún lugar o haya falsificado una licencia con fines fraudulentos.
Los algoritmos tradicionales para medir la similitud de imágenes, como PSNR y ORB, son lentos e imprecisos, solo aplicables a tareas offline. El aprendizaje profundo, en cambio, es capaz de procesar datos de imágenes a gran escala en tiempo real y es el método definitivo para emparejar imágenes similares. Con los esfuerzos conjuntos del equipo de I+D de BestPay y la comunidad Milvus, se desarrolla un sistema de detección de fraudes fotográficos como parte de Zhentu. Funciona convirtiendo cantidades masivas de datos de imágenes en vectores de características mediante modelos de aprendizaje profundo e insertándolos en Milvus, un motor de búsqueda vectorial. Con Milvus, el sistema de detección es capaz de indexar billones de vectores y recuperar eficientemente fotos similares entre decenas de millones de imágenes.
Ir a:
- Visión general de Zhentu
- Estructura del sistema
- Despliegue
- Rendimiento en el mundo real
- Referencia
- Acerca de BestPay
Una visión general de Zhentu
Zhentu es un producto multimedia de control de riesgos visuales diseñado por BestPay y profundamente integrado con tecnologías de aprendizaje automático (ML) y de reconocimiento de imágenes mediante redes neuronales. Su algoritmo incorporado puede identificar con precisión a los defraudadores durante la autenticación del usuario y responder al nivel de milisegundos. Con su tecnología líder en el sector y su solución innovadora, Zhentu ha obtenido cinco patentes y dos derechos de autor de software. Actualmente se utiliza en varios bancos e instituciones financieras para ayudar a identificar con antelación posibles riesgos.
Estructura del sistema
BestPay cuenta actualmente con más de 10 millones de fotos de licencias comerciales, y el volumen real sigue creciendo exponencialmente a medida que crece el negocio. Para recuperar rápidamente fotos similares de una base de datos tan grande, Zhentu ha elegido Milvus como motor de cálculo de similitud de vectores de características. La estructura general del sistema de detección de fraude fotográfico se muestra en el siguiente diagrama.
img
El procedimiento puede dividirse en cuatro pasos:
Preprocesamiento de la imagen. El preprocesamiento, que incluye la reducción de ruido, la eliminación de ruido y la mejora del contraste, garantiza tanto la integridad de la información original como la eliminación de información inútil de la señal de la imagen.
Extracción de vectores de características. Se utiliza un modelo de aprendizaje profundo especialmente entrenado para extraer los vectores de características de la imagen. La conversión de las imágenes en vectores para la posterior búsqueda de similitudes es una operación rutinaria.
Normalización. La normalización de los vectores de características extraídos ayuda a mejorar la eficiencia del procesamiento posterior.
Búsqueda vectorial con Milvus. Inserción de los vectores de características normalizados en la base de datos Milvus para la búsqueda de similitud vectorial.
Despliegue
A continuación se describe brevemente cómo se despliega el sistema de detección de fraude fotográfico de Zhentu.
Arquitectura del sistema Milvus
Desplegamos nuestro clúster Milvus en Kubernetes para garantizar la alta disponibilidad y la sincronización en tiempo real de los servicios en la nube. Los pasos generales son los siguientes:
Ver los recursos disponibles. Ejecute el comando
kubectl describe nodes
para ver los recursos que el clúster Kubernetes puede asignar a los casos creados.Asignar recursos. Ejecute el comando
kubect`` -- apply xxx.yaml
para asignar recursos de memoria y CPU para los componentes del clúster Milvus utilizando Helm.Aplique la nueva configuración. Ejecute el comando
helm upgrade my-release milvus/milvus --reuse-values -fresources.yaml
.Aplique la nueva configuración al cluster Milvus. El clúster desplegado de esta forma no sólo nos permite ajustar la capacidad del sistema en función de las diferentes necesidades empresariales, sino que también satisface mejor los requisitos de alto rendimiento para la recuperación masiva de datos vectoriales.
Puede configurar Milvus para optimizar el rendimiento de la búsqueda para diferentes tipos de datos de diferentes escenarios empresariales, como se muestra en los dos ejemplos siguientes.
Al construir el índice vectorial, parametrizamos el índice de acuerdo con el escenario real del sistema de la siguiente manera:
index = {"index_type": "IVF_PQ", "params": {"nlist": 2048}, "metric_type": "IP"}
IVF_PQ realiza la agrupación del índice IVF antes de cuantificar el producto de los vectores. Se caracteriza por una consulta de disco de alta velocidad y un consumo de memoria muy bajo, lo que satisface las necesidades de la aplicación real de Zhentu.
Además, establecemos los parámetros de búsqueda óptimos de la siguiente manera:
search_params = {"metric_type": "IP", "params": {"nprobe": 32}}
Como los vectores ya están normalizados antes de introducirlos en Milvus, se elige el producto interior (PI) para calcular la distancia entre dos vectores. Los experimentos han demostrado que la tasa de recuperación aumenta en torno a un 15% utilizando el PI en lugar de la distancia euclídea (L2).
Los ejemplos anteriores demuestran que podemos probar y configurar los parámetros de Milvus en función de diferentes escenarios empresariales y requisitos de rendimiento.
Además, Milvus no sólo integra diferentes bibliotecas de índices, sino que también admite diferentes tipos de índices y métodos de cálculo de similitud. Milvus también proporciona SDK oficiales en varios idiomas y API enriquecidas para la inserción, consulta, etc., lo que permite a nuestros grupos de negocio front-end utilizar los SDK para llamar a la central de control de riesgos.
Rendimiento en el mundo real
Hasta ahora, el sistema de detección de fraude fotográfico ha funcionado de manera constante, ayudando a las empresas a identificar a posibles defraudadores. En 2021, detectó más de 20.000 licencias falsas a lo largo del año. En términos de velocidad de consulta, una consulta de vector único entre decenas de millones de vectores tarda menos de 1 segundo, y el tiempo medio de consulta por lotes es inferior a 0,08 segundos. La búsqueda de alto rendimiento de Milvus satisface las necesidades de precisión y concurrencia de las empresas.
Referencia
Aglave P, Kolkure V S. Implementation of High Performance Feature Extraction Method Using Oriented Fast and Rotated Brief Algorithm[J]. Int. J. Res. Eng. Technol, 2015, 4: 394-397.
Acerca de BestPay
China Telecom BestPay Co, Ltd es una filial de propiedad total de China Telecom. Opera los negocios de pago y finanzas. BestPay se compromete a utilizar tecnologías de vanguardia como big data, inteligencia artificial y computación en la nube para potenciar la innovación empresarial, proporcionando productos inteligentes, soluciones de control de riesgos y otros servicios. Hasta enero de 2016, la app llamada BestPay ha atraído a más de 200 millones de usuarios y se ha convertido en el tercer operador de plataformas de pago en China, siguiendo de cerca a Alipay y WeChat Payment.
- Una visión general de Zhentu
- Estructura del sistema
- Despliegue
- Rendimiento en el mundo real
- Referencia
- Acerca de BestPay
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word