🚀 Testen Sie Zilliz Cloud, die vollständig verwaltete Milvus, kostenlos – erleben Sie 10x schnellere Leistung! Jetzt testen>>

milvus-logo
LFAI
  • Home
  • Blog
  • Mit Milvus KI-gestützte Nachrichtenempfehlung in Xiaomis mobilem Browser erstellen

Mit Milvus KI-gestützte Nachrichtenempfehlung in Xiaomis mobilem Browser erstellen

  • Scenarios
June 04, 2020
milvus

Von Social-Media-Feeds bis hin zu Playlist-Empfehlungen auf Spotify - künstliche Intelligenz spielt bereits eine wichtige Rolle bei den Inhalten, die wir jeden Tag sehen und mit denen wir interagieren. Um seinen mobilen Webbrowser zu differenzieren, hat der multinationale Elektronikhersteller Xiaomi eine KI-gestützte Nachrichtenempfehlungsmaschine entwickelt. Milvus, eine Open-Source-Vektordatenbank, die speziell für die Ähnlichkeitssuche und künstliche Intelligenz entwickelt wurde, diente als zentrale Datenmanagementplattform der Anwendung. Dieser Artikel erklärt, wie Xiaomi seine KI-gestützte Nachrichtenempfehlungsmaschine entwickelt hat und wie Milvus und andere KI-Algorithmen verwendet wurden.


Einsatz von KI zur Empfehlung personalisierter Inhalte und zum Durchbrechen des Nachrichtenrauschens

Allein die New York Times veröffentlicht täglich mehr als 230 Artikel. Die schiere Menge an Artikeln macht es für den Einzelnen unmöglich, sich einen umfassenden Überblick über alle Nachrichten zu verschaffen. Um die großen Mengen an Inhalten zu sichten und die relevantesten oder interessantesten Artikel zu empfehlen, wenden wir uns zunehmend an KI. Obwohl Empfehlungen noch lange nicht perfekt sind, wird maschinelles Lernen immer notwendiger, um den ständigen Strom neuer Informationen aus unserer immer komplexeren und vernetzten Welt zu durchdringen.

Xiaomi produziert und investiert in Smartphones, mobile Apps, Laptops, Haushaltsgeräte und viele weitere Produkte. Um einen mobilen Browser, der auf vielen der mehr als 40 Millionen Smartphones, die das Unternehmen jedes Quartal verkauft, vorinstalliert ist, von anderen abzuheben, hat Xiaomi ein Nachrichtenempfehlungssystem eingebaut. Wenn Benutzer den mobilen Browser von Xiaomi starten, wird künstliche Intelligenz eingesetzt, um ähnliche Inhalte auf der Grundlage des Suchverlaufs, der Interessen und mehr zu empfehlen. Milvus ist eine Open-Source-Datenbank für die vektorielle Ähnlichkeitssuche, die dazu dient, die Suche nach verwandten Artikeln zu beschleunigen.


Wie funktioniert die KI-gestützte Empfehlung von Inhalten?

Im Kern geht es bei der Empfehlung von Nachrichten (oder jeder anderen Art von Inhaltsempfehlungssystemen) darum, Eingabedaten mit einer umfangreichen Datenbank zu vergleichen, um ähnliche Informationen zu finden. Erfolgreiche Inhaltsempfehlungen erfordern ein Gleichgewicht zwischen Relevanz und Aktualität sowie die effiziente Einbeziehung großer Mengen neuer Daten - oft in Echtzeit.

Um große Datenmengen zu verarbeiten, werden Empfehlungssysteme in der Regel in zwei Stufen unterteilt:

  1. Abruf: Bei der Suche werden die Inhalte aus der umfangreichen Bibliothek auf der Grundlage der Interessen und des Verhaltens der Benutzer eingegrenzt. Im mobilen Browser von Xiaomi werden Tausende von Inhalten aus einem riesigen Datensatz ausgewählt, der Millionen von Nachrichtenartikeln enthält.
  2. Sortieren: Anschließend werden die beim Abruf ausgewählten Inhalte nach bestimmten Indikatoren sortiert, bevor sie dem Nutzer angezeigt werden. Während sich die Nutzer mit den empfohlenen Inhalten beschäftigen, passt sich das System in Echtzeit an, um relevantere Vorschläge zu machen.

Die Empfehlungen für Nachrichteninhalte müssen in Echtzeit auf der Grundlage des Nutzerverhaltens und der kürzlich veröffentlichten Inhalte erfolgen. Außerdem müssen die vorgeschlagenen Inhalte so weit wie möglich den Interessen und der Suchabsicht der Nutzer entsprechen.


Milvus + BERT = intelligente Inhaltsvorschläge

Milvus ist eine Open-Source-Datenbank für die Suche nach Vektorähnlichkeit, die mit Deep-Learning-Modellen integriert werden kann, um Anwendungen für die Verarbeitung natürlicher Sprache, die Identitätsprüfung und vieles mehr zu unterstützen. Milvus indiziert große Vektordatensätze, um die Suche effizienter zu gestalten, und unterstützt eine Vielzahl gängiger KI-Frameworks, um den Prozess der Entwicklung von Anwendungen für maschinelles Lernen zu vereinfachen. Diese Eigenschaften machen die Plattform zur idealen Lösung für die Speicherung und Abfrage von Vektordaten, einer entscheidenden Komponente vieler Anwendungen für maschinelles Lernen.

Xiaomi hat Milvus für die Verwaltung von Vektordaten für sein intelligentes Nachrichtenempfehlungssystem ausgewählt, weil es schnell und zuverlässig ist und nur minimale Konfiguration und Wartung erfordert. Milvus muss jedoch mit einem KI-Algorithmus gepaart werden, um einsatzfähige Anwendungen zu erstellen. Xiaomi wählte BERT, kurz für Bidirectional Encoder Representation Transformers, als Sprachrepräsentationsmodell in seiner Empfehlungsmaschine. BERT kann als allgemeines NLU-Modell (Natural Language Understanding) verwendet werden, das eine Reihe verschiedener NLP-Aufgaben (Natural Language Processing) ausführen kann. Seine wichtigsten Merkmale sind:

  • Der BERT-Transformer wird als Hauptrahmen des Algorithmus verwendet und ist in der Lage, explizite und implizite Beziehungen innerhalb und zwischen Sätzen zu erfassen.
  • Multi-Task-Lernziele, maskierte Sprachmodellierung (MLM) und Vorhersage des nächsten Satzes (NSP).
  • BERT ist bei größeren Datenmengen leistungsfähiger und kann andere Techniken zur Verarbeitung natürlicher Sprache wie Word2Vec verbessern, indem es als Konvertierungsmatrix fungiert.

Blog_Xiaomi_1.jpeg Blog_Xiaomi_1.jpeg


Die Netzwerkarchitektur von BERT verwendet eine mehrschichtige Transformatorstruktur, die sich von den traditionellen neuronalen Netzwerken RNN und CNN unterscheidet. Es funktioniert, indem es den Abstand zwischen zwei Wörtern an einer beliebigen Position durch seinen Aufmerksamkeitsmechanismus in ein Wort umwandelt, und löst das Abhängigkeitsproblem, das im NLP seit einiger Zeit besteht.

Blog-Xiaomi-2.jpeg Blog-Xiaomi-2.jpeg


Blog-Xiaomi-3.jpeg Blog-Xiaomi-3.jpeg


BERT bietet ein einfaches und ein komplexes Modell. Die entsprechenden Hyperparameter lauten wie folgt: BERT BASE: L = 12, H = 768, A = 12, Gesamtparameter 110M; BERT LARGE: L = 24, H = 1024, A = 16, die Gesamtzahl der Parameter beträgt 340M.

Bei den oben genannten Hyperparametern steht L für die Anzahl der Schichten im Netz (d. h. die Anzahl der Transformer-Blöcke), A für die Anzahl der Selbstaufmerksamkeit bei Multi-Head Attention und die Filtergröße beträgt 4H.


Xiaomis Inhaltsempfehlungssystem

Das browserbasierte Xiaomi-Nachrichtenempfehlungssystem stützt sich auf drei Schlüsselkomponenten: Vektorisierung, ID-Zuordnung und ANN-Dienst (Approximate Nearest Neighbour).

Die Vektorisierung ist ein Prozess, bei dem Artikelüberschriften in allgemeine Satzvektoren umgewandelt werden. Das SimBert-Modell, das auf BERT basiert, wird im Empfehlungssystem von Xiaomi verwendet. SimBert ist ein 12-Schichten-Modell mit einer versteckten Größe von 768. Simbert verwendet das Trainingsmodell Chinese L-12_H-768_A-12 für kontinuierliches Training (Trainingsaufgabe "metrisches Lernen +UniLM") und hat 1,17 Millionen Schritte auf einem signle TITAN RTX mit dem Adam-Optimierer trainiert (Lernrate 2e-6, Stapelgröße 128). Einfach ausgedrückt, handelt es sich um ein optimiertes BERT-Modell.

ANN-Algorithmen vergleichen vektorisierte Artikeltitel mit der gesamten in Milvus gespeicherten Nachrichtenbibliothek und geben dann ähnliche Inhalte für die Nutzer zurück. Die ID-Zuordnung wird verwendet, um relevante Informationen wie Seitenaufrufe und Klicks für entsprechende Artikel zu erhalten.

Blog-Xiaomi-N1.jpeg Blog-Xiaomi-N1.jpeg


Die in Milvus gespeicherten Daten, die die Nachrichtenempfehlungsmaschine von Xiaomi antreiben, werden ständig aktualisiert, einschließlich zusätzlicher Artikel und Aktivitätsinformationen. Wenn das System neue Daten einbezieht, müssen alte Daten bereinigt werden. In diesem System werden in den ersten T-1 Tagen vollständige Datenaktualisierungen und in den darauf folgenden T Tagen inkrementelle Aktualisierungen vorgenommen.

In festgelegten Abständen werden alte Daten gelöscht und die verarbeiteten Daten der T-1 Tage in die Sammlung eingefügt. Dabei werden neu generierte Daten in Echtzeit aufgenommen. Sobald neue Daten eingefügt sind, wird eine Ähnlichkeitssuche in Milvus durchgeführt. Die abgerufenen Artikel werden wiederum nach Klickrate und anderen Faktoren sortiert, und die besten Inhalte werden den Nutzern angezeigt. In einem Szenario wie diesem, in dem Daten häufig aktualisiert werden und Ergebnisse in Echtzeit geliefert werden müssen, ermöglicht die Fähigkeit von Milvus, neue Daten schnell zu integrieren und zu durchsuchen, eine drastische Beschleunigung der Empfehlung von Nachrichteninhalten im mobilen Browser von Xiaomi.


Milvus macht die Vektorähnlichkeitssuche besser

Die Vektorisierung von Daten und die anschließende Berechnung der Ähnlichkeit zwischen Vektoren ist die am häufigsten verwendete Suchtechnologie. Der Aufstieg von ANN-basierten Vektorähnlichkeitssuchmaschinen hat die Effizienz von Vektorähnlichkeitsberechnungen erheblich verbessert. Im Vergleich zu ähnlichen Lösungen bietet Milvus eine optimierte Datenspeicherung, eine Vielzahl von SDKs und eine verteilte Version, die den Arbeitsaufwand für den Aufbau einer Retrieval-Schicht erheblich reduziert. Darüber hinaus ist die aktive Open-Source-Community von Milvus eine leistungsstarke Ressource, die bei der Beantwortung von Fragen und der Behebung von Problemen helfen kann.

Wenn Sie mehr über die vektorielle Ähnlichkeitssuche und Milvus erfahren möchten, lesen Sie die folgenden Ressourcen:

Lesen Sie andere Anwenderberichte, um mehr über die Arbeit mit Milvus zu erfahren.

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    Weiterlesen