🚀 Testen Sie Zilliz Cloud, die vollständig verwaltete Milvus, kostenlos – erleben Sie 10x schnellere Leistung! Jetzt testen>>

milvus-logo
LFAI
  • Home
  • Blog
  • Zhentu - der auf Milvus basierende Fotobetrugsdetektor

Zhentu - der auf Milvus basierende Fotobetrugsdetektor

  • Scenarios
June 20, 2022
Yan Shi, Minwei Tang

cover image Titelbild

Dieser Artikel wurde von Yan Shi und Minwei Tang, Senior Algorithm Engineers bei BestPay, geschrieben und von Rosie Zhang übersetzt.

In den letzten Jahren, als E-Commerce und Online-Transaktionen in der ganzen Welt alltäglich wurden, florierte auch der E-Commerce-Betrug. Durch die Verwendung von computergenerierten Fotos anstelle echter Fotos zur Identitätsprüfung auf Online-Geschäftsplattformen erstellen Betrüger massenhaft gefälschte Konten und profitieren von den Sonderangeboten der Unternehmen (z. B. Mitgliedsgeschenke, Gutscheine, Token), was sowohl den Verbrauchern als auch den Unternehmen unwiederbringliche Verluste beschert.

Herkömmliche Methoden der Risikokontrolle sind angesichts der großen Datenmengen nicht mehr wirksam. Um das Problem zu lösen, hat BestPay einen Fotobetrugsdetektor namens Zhentu (was auf Chinesisch "Bilder erkennen" bedeutet) entwickelt, der auf Deep Learning (DL) und digitalen Bildverarbeitungstechnologien (DIP) basiert. Zhentu kann in verschiedenen Szenarien der Bilderkennung eingesetzt werden, wobei ein wichtiger Nebeneffekt die Identifizierung von gefälschten Geschäftslizenzen ist. Wenn das von einem Nutzer eingereichte Foto einer Geschäftslizenz einem anderen, bereits in der Fotobibliothek einer Plattform vorhandenen Foto sehr ähnlich ist, ist es wahrscheinlich, dass der Nutzer das Foto irgendwo gestohlen oder eine Lizenz zu betrügerischen Zwecken gefälscht hat.

Herkömmliche Algorithmen zur Messung der Bildähnlichkeit, wie PSNR und ORB, sind langsam und ungenau und nur für Offline-Aufgaben geeignet. Deep Learning hingegen ist in der Lage, große Bilddatenmengen in Echtzeit zu verarbeiten und ist die ultimative Methode für den Abgleich ähnlicher Bilder. Mit den gemeinsamen Bemühungen des Forschungs- und Entwicklungsteams von BestPay und der Milvus-Community wurde als Teil von Zhentu ein System zur Erkennung von Fotobetrug entwickelt. Es funktioniert, indem es riesige Mengen von Bilddaten mit Hilfe von Deep-Learning-Modellen in Merkmalsvektoren umwandelt und diese in Milvus, eine Vektorsuchmaschine, einfügt. Mit Milvus ist das Erkennungssystem in der Lage, Billionen von Vektoren zu indizieren und ähnliche Fotos unter mehreren Millionen Bildern effizient zu finden.

Springe zu:

Ein Überblick über Zhentu

Zhentu ist ein von BestPay selbst entwickeltes multimediales Produkt zur visuellen Risikokontrolle, das tief in Technologien für maschinelles Lernen (ML) und neuronale Netze zur Bilderkennung integriert ist. Sein integrierter Algorithmus kann Betrüger während der Benutzerauthentifizierung genau identifizieren und auf Millisekunden-Ebene reagieren. Mit seiner branchenführenden Technologie und innovativen Lösung hat Zhentu fünf Patente und zwei Software-Urheberrechte erhalten. Es wird jetzt in einer Reihe von Banken und Finanzinstituten eingesetzt, um potenzielle Risiken im Voraus zu erkennen.

Aufbau des Systems

BestPay verfügt derzeit über mehr als 10 Millionen Fotos von Geschäftslizenzen, und das tatsächliche Volumen wächst mit dem Wachstum des Unternehmens weiter exponentiell an. Um schnell ähnliche Fotos aus einer so großen Datenbank abrufen zu können, hat Zhentu Milvus als Engine zur Berechnung der Ähnlichkeit von Merkmalsvektoren gewählt. Die allgemeine Struktur des Systems zur Erkennung von Fotofälschungen ist im folgenden Diagramm dargestellt.

img img

Das Verfahren kann in vier Schritte unterteilt werden:

  1. Vorverarbeitung des Bildes. Die Vorverarbeitung, einschließlich Rauschunterdrückung, Rauschentfernung und Kontrastverbesserung, gewährleistet sowohl die Integrität der ursprünglichen Informationen als auch die Entfernung von unbrauchbaren Informationen aus dem Bildsignal.

  2. Extraktion von Merkmalsvektoren. Ein speziell trainiertes Deep-Learning-Modell wird verwendet, um die Merkmalsvektoren des Bildes zu extrahieren. Die Umwandlung von Bildern in Vektoren für die weitere Ähnlichkeitssuche ist ein Routinevorgang.

  3. Normalisierung. Die Normalisierung der extrahierten Merkmalsvektoren trägt zur Verbesserung der Effizienz der nachfolgenden Verarbeitung bei.

  4. Vektorsuche mit Milvus. Einfügen der normalisierten Merkmalsvektoren in die Milvus-Datenbank für die vektorielle Ähnlichkeitssuche.

Einsatz

Im Folgenden wird kurz beschrieben, wie das Zhentu-System zur Erkennung von Fotobetrug eingesetzt wird.

Milvus system architecture Milvus-Systemarchitektur

Wir haben unseren Milvus-Cluster auf Kubernetes implementiert, um eine hohe Verfügbarkeit und Echtzeitsynchronisation der Cloud-Dienste zu gewährleisten. Die allgemeinen Schritte sind wie folgt:

  1. Verfügbare Ressourcen anzeigen. Führen Sie den Befehl kubectl describe nodes aus, um die Ressourcen zu sehen, die der Kubernetes-Cluster den erstellten Fällen zuweisen kann.

  2. Zuweisen von Ressourcen. Führen Sie den Befehl kubect`` -- apply xxx.yaml aus, um Speicher- und CPU-Ressourcen für Milvus-Cluster-Komponenten mit Helm zuzuweisen.

  3. Wenden Sie die neue Konfiguration an. Führen Sie den Befehl helm upgrade my-release milvus/milvus --reuse-values -fresources.yaml aus.

  4. Wenden Sie die neue Konfiguration auf den Milvus-Cluster an. Der auf diese Weise bereitgestellte Cluster ermöglicht nicht nur die Anpassung der Systemkapazität an unterschiedliche Geschäftsanforderungen, sondern erfüllt auch besser die Hochleistungsanforderungen für die Abfrage massiver Vektordaten.

Sie können Milvus so konfigurieren, dass die Suchleistung für verschiedene Datentypen aus unterschiedlichen Geschäftsszenarien optimiert wird, wie die beiden folgenden Beispiele zeigen.

Beim Aufbau des Vektorindexes parametrisieren wir den Index entsprechend dem tatsächlichen Szenario des Systems wie folgt:

index = {"index_type": "IVF_PQ", "params": {"nlist": 2048}, "metric_type": "IP"}

IVF_PQ führt ein IVF-Indexclustering durch, bevor das Produkt der Vektoren quantisiert wird. Er zeichnet sich durch eine schnelle Plattenabfrage und einen sehr geringen Speicherverbrauch aus, was den Anforderungen der realen Anwendung von Zhentu entspricht.

Außerdem legen wir die optimalen Suchparameter wie folgt fest:

search_params = {"metric_type": "IP", "params": {"nprobe": 32}}

Da die Vektoren bereits vor der Eingabe in Milvus normalisiert werden, wird das innere Produkt (IP) gewählt, um den Abstand zwischen zwei Vektoren zu berechnen. Experimente haben gezeigt, dass die Wiederfindungsrate mit IP um etwa 15% höher ist als mit dem euklidischen Abstand (L2).

Die obigen Beispiele zeigen, dass wir die Parameter von Milvus entsprechend den verschiedenen Geschäftsszenarien und Leistungsanforderungen testen und einstellen können.

Darüber hinaus integriert Milvus nicht nur verschiedene Indexbibliotheken, sondern unterstützt auch verschiedene Indextypen und Ähnlichkeitsberechnungsmethoden. Milvus bietet auch offizielle SDKs in mehreren Sprachen und umfangreiche APIs für das Einfügen, Abfragen usw., so dass unsere Front-End-Geschäftsgruppen die SDKs nutzen können, um das Risikokontrollzentrum aufzurufen.

Leistung in der realen Welt

Bislang läuft das System zur Erkennung von Fotobetrug stabil und hilft Unternehmen, potenzielle Betrüger zu identifizieren. Im Jahr 2021 wurden über 20 000 gefälschte Führerscheine entdeckt. Was die Abfragegeschwindigkeit angeht, so dauert eine einzelne Vektorabfrage unter mehreren Millionen Vektoren weniger als 1 Sekunde, und die durchschnittliche Zeit für eine Batch-Abfrage beträgt weniger als 0,08 Sekunden. Die Hochleistungssuche von Milvus erfüllt die Anforderungen von Unternehmen an Genauigkeit und Gleichzeitigkeit gleichermaßen.

Referenz

Aglave P, Kolkure V S. Implementation of High Performance Feature Extraction Method Using Oriented Fast and Rotated Brief Algorithm[J]. Int. J. Res. Eng. Technol, 2015, 4: 394-397.

Über BestPay

China Telecom BestPay Co. Ltd. ist eine hundertprozentige Tochtergesellschaft von China Telecom. Sie betreibt das Zahlungs- und Finanzgeschäft. BestPay ist bestrebt, Spitzentechnologien wie Big Data, künstliche Intelligenz und Cloud Computing zu nutzen, um Geschäftsinnovationen zu fördern und intelligente Produkte, Lösungen zur Risikokontrolle und andere Dienstleistungen anzubieten. Bis Januar 2016 hat die App namens BestPay über 200 Millionen Nutzer angezogen und ist zum drittgrößten Zahlungsplattformbetreiber in China geworden, dicht nach Alipay und WeChat Payment.

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started

Like the article? Spread the word

Weiterlesen