Zero-Shot-Learning löst mehrere Probleme beim maschinellen Lernen, aber wie funktioniert es und wie verbessert es die KI?

Die zentralen Thesen

  • Die Generalisierung ist beim Deep Learning unerlässlich, um genaue Vorhersagen mit neuen Daten sicherzustellen. Zero-Shot-Learning trägt dazu bei, dies zu erreichen, indem es der KI ermöglicht, vorhandenes Wissen zu nutzen, um genaue Vorhersagen über neue oder unbekannte Klassen ohne gekennzeichnete Daten zu treffen.
  • Zero-Shot-Learning ahmt nach, wie Menschen Daten lernen und verarbeiten. Durch die Bereitstellung zusätzlicher semantischer Informationen kann ein vorab trainiertes Modell neue Klassen genau identifizieren, so wie ein Mensch lernen kann, eine Hohlkörpergitarre zu identifizieren, indem er deren Eigenschaften versteht.
  • Zero-Shot-Learning verbessert die KI, indem es die Generalisierung und Skalierbarkeit verbessert, Überanpassungen reduziert und kostengünstiger ist. Es ermöglicht das Trainieren von Modellen anhand größerer Datensätze, den Gewinn von mehr Wissen durch Transferlernen, ein besseres Kontextverständnis und die Reduzierung des Bedarfs an umfangreichen beschrifteten Daten. Mit fortschreitender KI wird Zero-Shot-Learning bei der Bewältigung komplexer Herausforderungen in verschiedenen Bereichen noch wichtiger.
    instagram viewer

Eines der größten Ziele des Deep Learning ist das Trainieren von Modellen, die verallgemeinertes Wissen erworben haben. Die Generalisierung ist unerlässlich, da sie sicherstellt, dass das Modell aussagekräftige Muster gelernt hat und genaue Vorhersagen oder Entscheidungen treffen kann, wenn es mit neuen oder unbekannten Daten konfrontiert wird. Das Training solcher Modelle erfordert oft eine beträchtliche Menge an gekennzeichneten Daten. Allerdings können solche Daten kostspielig, arbeitsintensiv und manchmal unmöglich sein.

Um diese Lücke zu schließen, wird Zero-Shot-Learning implementiert, das es der KI ermöglicht, ihr vorhandenes Wissen zu nutzen, um trotz des Mangels an gekennzeichneten Daten ziemlich genaue Vorhersagen zu treffen.

Was ist Zero-Shot-Lernen?

Zero-Shot-Learning ist eine spezielle Art der Transfer-Lerntechnik. Der Schwerpunkt liegt auf der Verwendung eines vorab trainierten Modells zur Identifizierung neuer oder noch nie zuvor gesehener Klassen, indem einfach zusätzliche Informationen bereitgestellt werden, die die Einzelheiten der neuen Klasse beschreiben.

Durch die Nutzung des allgemeinen Wissens eines Modells zu bestimmten Themen und die Bereitstellung zusätzlicher Semantik für die Suche danach sollte es in der Lage sein, ziemlich genau zu bestimmen, welches Thema es identifizieren soll.

Nehmen wir an, wir müssen ein Zebra identifizieren. Wir haben jedoch kein Modell, das solche Tiere identifizieren kann. Wir trainieren also ein bereits vorhandenes Modell, um Pferde zu identifizieren und dem Modell mitzuteilen, dass es sich bei Pferden mit schwarzen und weißen Streifen um Zebras handelt. Wenn wir beginnen, das Modell durch die Bereitstellung von Bildern von Zebras und Pferden abzuleiten, besteht eine gute Chance, dass das Modell jedes Tier korrekt identifiziert.

Wie viele Deep-Learning-Techniken ahmt Zero-Shot-Learning nach, wie Menschen Daten lernen und verarbeiten. Es ist bekannt, dass Menschen von Natur aus Zero-Shot-Lerner sind. Wenn Sie in einem Musikgeschäft nach einer Hollowbody-Gitarre suchen müssten, könnten Sie Probleme bei der Suche haben. Aber wenn ich Ihnen sage, dass ein Hohlkörper im Grunde eine Gitarre mit einem F-förmigen Loch auf einer oder beiden Seiten ist, werden Sie wahrscheinlich sofort eines finden.

Als Beispiel aus der Praxis verwenden wir die Zero-Shot-Klassifizierungs-App von Open-Source-LLM-Hosting-Site Hugging Face mit dem Clip-Vit-Large-Modell.

Dieses Foto zeigt ein Bild von Brot in einer Einkaufstüte, die auf einem Hochstuhl festgeschnallt ist. Da das Modell anhand eines großen Bilddatensatzes trainiert wurde, kann das Modell wahrscheinlich jeden Gegenstand auf dem Foto identifizieren, z. B. Brot, Lebensmittel, Stühle und Sicherheitsgurte.

Jetzt möchten wir, dass das Modell das Bild mithilfe bisher nicht sichtbarer Klassen klassifiziert. In diesem Fall wären die neuartigen oder unbekannten Klassen „Entspanntes Brot“, „Sicheres Brot“, „Sitzendes Brot“, „Driving Grocery“ und „Safe Grocery“.

Beachten Sie, dass wir absichtlich ungewöhnliche, unsichtbare Klassen und Bilder verwendet haben, um die Wirksamkeit der Zero-Shot-Klassifizierung an einem Bild zu demonstrieren.

Nach der Schlussfolgerung des Modells war es in der Lage, mit etwa 80 %iger Sicherheit die am besten geeignete Klassifizierung für das zu klassifizieren Das Bild war „Sicheres Brot“. Dies liegt wahrscheinlich daran, dass das Model der Meinung ist, dass ein Hochstuhl eher der Sicherheit dient als dem Sitzen, der Entspannung usw Fahren.

Eindrucksvoll! Ich persönlich würde der Leistung des Modells zustimmen. Aber wie genau kam das Modell zu einer solchen Ausgabe? Hier finden Sie einen allgemeinen Überblick darüber, wie Zero-Shot-Lernen funktioniert.

Wie Zero-Shot-Lernen funktioniert

Zero-Shot-Learning kann einem vorab trainierten Modell dabei helfen, neue Klassen zu identifizieren, ohne gekennzeichnete Daten bereitzustellen. In seiner einfachsten Form erfolgt das Zero-Shot-Lernen in drei Schritten:

1. Vorbereitung

Zero-Shot-Lernen beginnt mit der Vorbereitung von drei Arten von Daten

  • Gesehene Klasse: Daten, die beim Training des vorab trainierten Modells verwendet werden. Das Modell stellt bereits gesehene Klassen bereit. Die besten Modelle für Zero-Shot-Lernen sind Modelle, die auf Klassen trainiert wurden, die eng mit der neuen Klasse verwandt sind, die das Modell identifizieren soll.
  • Unsichtbare/Roman-Klasse: Daten, die während des Trainings des Modells nie verwendet wurden. Sie müssen diese Daten selbst kuratieren, da Sie sie nicht aus dem Modell abrufen können.
  • Semantische/Hilfsdaten: Zusätzliche Datenbits, die dem Modell helfen können, die neuartige Klasse zu identifizieren. Dies kann in Wörtern, Phrasen, Worteinbettungen oder Klassennamen erfolgen.

2. Semantische Zuordnung

Der nächste Schritt besteht darin, die Merkmale der unsichtbaren Klasse abzubilden. Dies geschieht durch die Erstellung von Worteinbettungen und die Erstellung einer semantischen Karte, die die Attribute oder Merkmale der unsichtbaren Klasse mit den bereitgestellten Hilfsdaten verknüpft. KI-Transferlernen beschleunigt den Prozess erheblich, da viele Attribute im Zusammenhang mit der unsichtbaren Klasse bereits zugeordnet wurden.

3. Schlussfolgerungen

Unter Inferenzierung versteht man die Verwendung des Modells zur Generierung von Vorhersagen oder Ausgaben. Bei der Zero-Shot-Bildklassifizierung werden Worteinbettungen für die gegebene Bildeingabe generiert und dann grafisch dargestellt und mit den Hilfsdaten verglichen. Der Grad der Sicherheit hängt von der Ähnlichkeit zwischen der Eingabe und den bereitgestellten Hilfsdaten ab.

Wie Zero-Shot-Learning die KI verbessert

Zero-Shot-Learning verbessert KI-Modelle, indem es mehrere Herausforderungen beim maschinellen Lernen angeht, darunter:

  • Verbesserte Generalisierung: Durch die Verringerung der Abhängigkeit von gekennzeichneten Daten können Modelle in größeren Datensätzen trainiert werden, was die Generalisierung verbessert und das Modell robuster und zuverlässiger macht. Je erfahrener und verallgemeinerter die Modelle werden, Möglicherweise ist es sogar möglich, dass Modelle den gesunden Menschenverstand erlernen statt der typischen Art der Informationsanalyse.
  • Skalierbarkeit: Modelle können kontinuierlich trainiert werden und durch Transferlernen mehr Wissen erlangen. Unternehmen und unabhängige Forscher können ihre Modelle kontinuierlich verbessern, um in Zukunft leistungsfähiger zu sein.
  • Reduzierte Wahrscheinlichkeit einer Überanpassung: Eine Überanpassung kann auftreten, wenn das Modell auf einem kleinen Datensatz trainiert wird, der nicht genügend Vielfalt enthält, um alle möglichen Eingaben darzustellen. Das Training des Modells durch Zero-Shot-Learning verringert die Wahrscheinlichkeit einer Überanpassung, indem das Modell trainiert wird, um ein besseres kontextuelles Verständnis der Themen zu erhalten.
  • Kosteneffizient: Die Bereitstellung einer großen Menge gekennzeichneter Daten kann Zeit und Ressourcen in Anspruch nehmen. Mithilfe des Zero-Shot-Transfer-Lernens kann das Training eines robusten Modells mit viel weniger Zeitaufwand und beschrifteten Daten durchgeführt werden.

Mit fortschreitender KI werden Techniken wie Zero-Shot-Learning noch wichtiger.

Die Zukunft des Zero-Shot-Lernens

Zero-Shot-Learning ist zu einem wesentlichen Bestandteil des maschinellen Lernens geworden. Es ermöglicht Modellen, neue Klassen ohne explizites Training zu erkennen und zu klassifizieren. Mit der kontinuierlichen Weiterentwicklung von Modellarchitekturen, attributbasierten Ansätzen und multimodaler Integration ist Zero-Shot-Learning möglich Sie tragen erheblich dazu bei, Modelle viel anpassungsfähiger zu machen, um komplexe Herausforderungen in der Robotik, im Gesundheitswesen und im Computerbereich zu bewältigen Vision.