Milvus en la protección de la PI:Creación de un sistema de búsqueda de similitud de marcas con Milvus
En los últimos años, la cuestión de la protección de la propiedad intelectual se ha convertido en el centro de atención a medida que aumenta la concienciación de la gente sobre la infracción de la propiedad intelectual. En particular, el gigante multinacional de la tecnología Apple Inc. ha presentado activamente demandas contra varias empresas por infracción de la propiedad intelectual, incluida la infracción de marcas, patentes y diseños. Aparte de esos casos más notorios, Apple Inc. también impugnó en 2009 una solicitud de marca de Woolworths Limited, una cadena de supermercados australiana, por infracción de marca. Apple. Inc argumentó que el logotipo de la marca australiana, una "w" estilizada, se parece a su propio logotipo de una manzana. Por ello, Apple Inc. se opuso a la gama de productos, incluidos aparatos electrónicos, que Woolworths solicitó vender con el logotipo. La historia termina con Woolworths modificando su logotipo y Apple retirando su oposición.
Logotipo de Woolworths.png
Logotipo de Apple Inc.png
Con la creciente concienciación sobre la cultura de marca, las empresas vigilan más de cerca cualquier amenaza que perjudique sus derechos de propiedad intelectual (PI). La infracción de la PI incluye
- Infracción de los derechos de autor
- Infracción de patentes
- Infracción de marcas
- Infracción de diseños
- Ciberocupación
El mencionado litigio entre Apple y Woolworths se debe principalmente a una infracción de marca, precisamente por la similitud entre las imágenes de marca de ambas entidades. Para evitar convertirse en otro Woolworths, una búsqueda exhaustiva de similitudes de marcas es un paso crucial para los solicitantes, tanto antes de la presentación como durante la revisión de las solicitudes de marca. El recurso más habitual es realizar una búsqueda en la base de datos de la Oficina de Patentes y Marcas de los Estados Unidos (USPTO ), que contiene todos los registros y solicitudes de marca activos e inactivos. A pesar de que la interfaz de usuario no es muy atractiva, este proceso de búsqueda también es muy defectuoso por su naturaleza basada en texto, ya que se basa en palabras y códigos de diseño de marcas (que son etiquetas de características de diseño anotadas a mano) para buscar imágenes.
8.png
Este artículo pretende mostrar cómo construir un sistema eficaz de búsqueda de similitudes de marcas basado en imágenes utilizando Milvus, una base de datos vectorial de código abierto.
Un sistema de búsqueda vectorial de marcas similares
Para crear un sistema de búsqueda de similitudes vectoriales para marcas comerciales, es necesario seguir los siguientes pasos:
- Preparar un conjunto de datos masivo de logotipos. Es probable que el sistema pueda utilizar un conjunto de datos como éste,).
- Entrenar un modelo de extracción de características de imagen utilizando el conjunto de datos y modelos basados en datos o algoritmos de IA.
- Convertir los logotipos en vectores utilizando el modelo o algoritmo entrenado en el paso 2.
- Almacenar los vectores y realizar búsquedas de similitud de vectores en Milvus, la base de datos de vectores de código abierto.
Nike.png
En las siguientes secciones, vamos a examinar más de cerca los dos pasos principales en la construcción de un sistema de búsqueda de similitud vectorial para marcas: el uso de modelos de IA para la extracción de características de imagen, y el uso de Milvus para la búsqueda de similitud vectorial. En nuestro caso, utilizamos VGG16, una red neuronal convolucional (CNN), para extraer características de imagen y convertirlas en vectores de incrustación.
Uso de VGG16 para la extracción de características de imagen
VGG16 es una CNN diseñada para el reconocimiento de imágenes a gran escala. El modelo es rápido y preciso en el reconocimiento de imágenes y puede aplicarse a imágenes de todos los tamaños. A continuación se muestran dos ilustraciones de la arquitectura de VGG16.
9.png
10.png
El modelo VGG16, como su nombre indica, es una CNN con 16 capas. Todos los modelos VGG, incluidos VGG16 y VGG19, contienen 5 bloques VGG, con una o más capas convolucionales en cada bloque VGG. Y al final de cada bloque, se conecta una capa de agrupación máxima para reducir el tamaño de la imagen de entrada. El número de núcleos es equivalente en cada capa convolucional, pero se duplica en cada bloque VGG. Por lo tanto, el número de núcleos del modelo pasa de 64 en el primer bloque a 512 en el cuarto y quinto. Todos los kernels convolucionalestienen un tamaño de 33, mientras que los kernels de agrupación tienen todos un tamaño de 22. Esto favorece la conservación de los datos. Esto permite conservar más información sobre la imagen de entrada.
Por lo tanto, VGG16 es un modelo adecuado para el reconocimiento de imágenes de conjuntos de datos masivos en este caso. Puede utilizar Python, Tensorflow y Keras para entrenar un modelo de extracción de características de imagen basado en VGG16.
Uso de Milvus para la búsqueda de similitud vectorial
Después de usar el modelo VGG16 para extraer características de imagen y convertir imágenes de logotipos en vectores de incrustación, necesita buscar vectores similares en un conjunto de datos masivo.
Milvus es una base de datos nativa de la nube que ofrece una gran escalabilidad y elasticidad. Además, como base de datos, puede garantizar la coherencia de los datos. Para un sistema de búsqueda de similitudes de marcas como este, los nuevos datos, como los últimos registros de marcas, se cargan en el sistema en tiempo real. Y estos datos recién cargados deben estar disponibles inmediatamente para la búsqueda. Por lo tanto, este artículo adopta Milvus, la base de datos vectorial de código abierto, para llevar a cabo la búsqueda de similitud vectorial.
Al insertar los vectores de logotipos, puede crear colecciones en Milvus para diferentes tipos de vectores de logotipos según la Clasificación Internacional (de Niza) de Productos y Servicios, un sistema de clasificación de productos y servicios para el registro de marcas. Por ejemplo, puede insertar un grupo de vectores de logotipos de marcas de ropa en una colección denominada "ropa" en Milvus e insertar otro grupo de vectores de logotipos de marcas tecnológicas en otra colección denominada "tecnología". De este modo, puede aumentar enormemente la eficacia y la velocidad de su búsqueda de similitud vectorial.
Milvus no sólo admite múltiples índices para la búsqueda de similitud vectorial, sino que también proporciona API y herramientas enriquecidas para facilitar DevOps. El siguiente diagrama ilustra la arquitectura de Milvus. Puede obtener más información sobre Milvus leyendo su introducción.
11.png
¿Busca más recursos?
Construya más sistemas de búsqueda de similitud vectorial para otros escenarios de aplicación con Milvus:
Participe en nuestra comunidad de código abierto:
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word