Große Sprachmodelle (LLMs) gibt es in allen Formen und Größen und unterstützen Sie auf jede Art und Weise, die Sie für richtig halten. Aber welches ist das Beste? Wir stellen die dominanten KIs von Alphabet, OpenAI und Meta auf die Probe.

Was Sie über KI-Chatbots wissen müssen

Künstliche allgemeine Intelligenz ist seit Jahrzehnten ein Ziel von Informatikern, und KI dient Science-Fiction-Autoren und Filmemachern noch länger als tragende Säule.

AGI weist eine Intelligenz auf, die den kognitiven Fähigkeiten des Menschen ähnelt, und der Turing-Test– ein Test der Fähigkeit einer Maschine, intelligentes Verhalten zu zeigen, das nicht von dem eines Menschen zu unterscheiden ist – blieb in den sieben Jahrzehnten seit seiner Einführung nahezu unangefochten.

Die jüngste Konvergenz von extrem großem Rechenaufwand, riesigen Geldmengen und der erstaunlichen Menge freier Informationen Die im offenen Internet verfügbare Technologie ermöglichte es Technologiegiganten, Modelle zu trainieren, die den nächsten Wortabschnitt – oder das nächste Token – in einer Folge von Wörtern vorhersagen können Token.

instagram viewer

Zum Zeitpunkt des Schreibens beides Googles Barde Und ChatGPT von OpenAI stehen Ihnen über ihre Webschnittstellen zum Nutzen und Testen zur Verfügung.

Das Sprachmodell von Meta, LLaMa, ist nicht im Internet verfügbar, aber Sie können es problemlos finden Laden Sie LLaMa herunter und führen Sie es auf Ihrer eigenen Hardware aus und verwenden Sie es über eine Befehlszeile oder Führen Sie Dalai auf Ihrem eigenen Computer aus– eine von mehreren Apps mit einer benutzerfreundlichen Oberfläche.

Für den Test verwenden wir das Alpaca 7B-Modell der Stanford University – eine Adaption von LLaMa – und stellen es Bard und ChatGPT gegenüber.

Die folgenden Vergleiche und Tests erheben keinen Anspruch auf Vollständigkeit, sondern geben Ihnen vielmehr einen Hinweis auf die wichtigsten Punkte und Fähigkeiten.

Welches ist das am einfachsten zu verwendende große Sprachmodell?

Sowohl Bard als auch ChatGPT erfordern ein Konto, um den Dienst nutzen zu können. Sowohl Google- als auch OpenAI-Konten lassen sich einfach und kostenlos erstellen und Sie können sofort mit dem Stellen von Fragen beginnen.

Um LLaMa jedoch lokal ausführen zu können, benötigen Sie spezielle Kenntnisse oder die Fähigkeit, einem Tutorial zu folgen. Sie benötigen außerdem viel Stauraum.

Welches ist das privateste große Sprachmodell?

Sowohl Bard als auch ChatGPT verfügen über umfangreiche Datenschutzrichtlinien, worauf Google in seinen Dokumenten immer wieder betont dass Sie „keine Informationen angeben sollten, die dazu verwendet werden könnten, Sie oder andere in Ihrem Bard zu identifizieren.“ Gespräche.“

Standardmäßig erfasst Google Ihre Gespräche und Ihren allgemeinen Standort basierend auf Ihrer IP-Adresse, Ihrem Feedback und Nutzungsinformationen. Diese Informationen werden in Ihrem Google-Konto bis zu 18 Monate lang gespeichert. Obwohl Sie das Speichern Ihrer Bard-Aktivitäten pausieren können, sollten Sie sich darüber im Klaren sein, dass „menschliche Prüfer Ihre Bard-Gespräche lesen, kommentieren und verarbeiten, um die Qualität zu verbessern und unsere Produkte zu verbessern“.

Die Verwendung von Bard unterliegt ebenfalls dem Standard Google-Datenschutzerklärung.

Die Datenschutzrichtlinie von OpenAI ist im Großen und Ganzen ähnlich und erfasst IP-Adressen und Nutzungsdaten. Im Gegensatz zur zeitlich begrenzten Aufbewahrung durch Google speichert OpenAI „Ihre personenbezogenen Daten nur so lange, wie wir sie für die Bereitstellung unserer Daten benötigen.“ Service für Sie oder für andere legitime Geschäftszwecke wie die Beilegung von Streitigkeiten, Sicherheitsgründe oder die Einhaltung unserer gesetzlichen Bestimmungen Verpflichtungen.“

Im Gegensatz dazu ist für ein lokales Modell auf Ihrem eigenen Computer kein Konto erforderlich und auch die Weitergabe von Benutzerdaten an niemanden ist erforderlich.

Welches LLM verfügt über das beste Allgemeinwissen?

Um zu testen, welcher LLM über das beste Allgemeinwissen verfügt, haben wir drei Fragen gestellt.

Die erste Frage: „Welche Nationalflagge hat fünf Seiten?“ wurde nur von Bard richtig beantwortet, der identifizierte, dass die Nationalflagge Nepals fünf Seiten habe.

ChatGPT behauptete selbstbewusst: „Es gibt keine Nationalflagge, die fünf Seiten hat.“ Nationalflaggen haben typischerweise eine rechteckige oder quadratische Form und zeichnen sich durch unterschiedliche Farben, Muster und Symbole aus.“

Unser lokales Modell kam dem nahe und erklärte: „Die indische Nationalflagge hat fünf Seiten und wurde 1916 entworfen, um die Seiten Indiens darzustellen.“ Unabhängigkeitsbewegung.“ Obwohl diese Flagge existierte und fünf Seiten hatte, war sie die Flagge der Indian Home Rule Movement – ​​keine Nationalflagge.

Keines unserer Modelle konnte mit ChatGPT antworten, dass der korrekte Begriff für ein erbsenförmiges Objekt „pisiform“ sei soweit es darauf hindeutet, dass Erbsen eine „dreidimensionale geometrische Form haben, die perfekt rund ist und symmetrisch."

Alle drei Chatbots identifizierten Franco Malerba korrekt als italienischen Astronauten und Mitglied der Europäisches Parlament, wobei Bard eine Antwort gab, deren Wortlaut identisch mit einem Abschnitt von Malerbas Wikipedia war Eintrag.

Welches LLM eignet sich für technische Unterweisungen?

Wenn Sie technische Probleme haben, könnten Sie versucht sein, sich an einen Chatbot zu wenden, um Hilfe zu erhalten. Während die Technologie voranschreitet, bleiben einige Dinge gleich. Der elektrische Stecker BS 1363 wird seit 1947 in Großbritannien, Irland und vielen anderen Ländern verwendet. Wir haben die Sprachmodelle gefragt, wie man es richtig verkabelt.

An den Stecker angeschlossene Kabel verfügen über einen stromführenden Leiter (braun), einen Erdungsleiter (gelb/grün) und einen Neutralleiter (blau). Diese müssen an den richtigen Anschlüssen im Steckergehäuse angebracht werden.

Unsere Dalai-Implementierung hat den Stecker korrekt als „englischen Stecker“ identifiziert, ist dann vom Kurs abgekommen und hat stattdessen Anweisungen für den älteren rundpoligen BS 546-Stecker zusammen mit älteren Kabelfarben gegeben.

ChatGPT war etwas hilfreicher. Es beschriftete die Kabelfarben korrekt und gab eine Materialliste sowie acht Anleitungen. ChatGPT schlug außerdem vor, das braune Kabel in die mit „L“ gekennzeichnete Klemme und das blaue Kabel in die mit „N“ gekennzeichnete Klemme zu stecken. Klemme und das gelbe Kabel in „E“. Dies wäre richtig, wenn BS1363-Terminals beschriftet wären, aber sie sind nicht.

Bard identifizierte die richtigen Farben für die Drähte und wies uns an, sie an die Strom-, Neutral- und Erdungsklemmen anzuschließen. Es gab keine Anweisungen, wie diese identifiziert werden könnten.

Gemäß unserer Meinung. Keiner der Chatbots gab ausreichende Anweisungen, um jemandem bei der korrekten Verkabelung eines BS 1363-Steckers zu helfen. Eine prägnante und korrekte Antwort wäre: „Links blau, rechts braun.“

Welches LLM eignet sich zum Schreiben von Code?

Python ist eine nützliche Programmiersprache das auf den meisten modernen Plattformen läuft. Wir haben unsere Modelle angewiesen, Python zu verwenden und „ein einfaches Taschenrechnerprogramm zu erstellen, das arithmetische Operationen wie Addition, Subtraktion, Multiplikation und Division ausführen kann.“ Es sollte Benutzereingaben entgegennehmen und das Ergebnis anzeigen.“ Dies ist eines davon beste Programmierprojekte für Anfänger.

Während sowohl Bard als auch ChatGPT sofort verwendbaren und gründlich kommentierten Code zurückgaben, den wir testen und verifizieren konnten, konnte kein Code aus unserem lokalen Modell ausgeführt werden.

Welches LLM erzählt die besten Witze?

Humor ist eine der Grundlagen des Menschseins und sicherlich eine der besten Möglichkeiten, Mensch und Maschine zu unterscheiden. Wir gaben jedem unserer Modelle die einfache Aufforderung: „Erstelle einen originellen und lustigen Witz.“

Zum Glück für Komiker überall und für die gesamte Menschheit war keines der Models in der Lage, einen originellen Witz zu machen.

Bard brachte den Klassiker heraus: „Warum hat die Vogelscheuche einen Preis gewonnen?“ Er war auf seinem Gebiet herausragend.“

Sowohl unsere lokale Implementierung als auch ChatGPT lieferten die stöhnende Frage: „Warum vertrauen Wissenschaftler Atomen nicht?“ Denn sie machen alles aus!“

Ein abgeleiteter, aber origineller Witz wäre: „Inwiefern ähneln große Sprachmodelle Atomen?“ Sie erfinden beide etwas!“

Ihr lest es zuerst hier, Leute.

Kein Chatbot ist perfekt

Wir haben herausgefunden, dass alle drei großen Sprachmodelle zwar ihre Vor- und Nachteile haben, aber keines von ihnen das echte Fachwissen eines Menschen durch Spezialwissen ersetzen kann.

Während sowohl Bard als auch ChatGPT bessere Antworten auf unsere Codierungsfrage gaben und sehr einfach zu verwenden sind, Wenn Sie ein großes Sprachmodell lokal ausführen, müssen Sie sich keine Sorgen um den Datenschutz machen Zensur.

Wenn Sie großartige KI-Kunstwerke erstellen möchten, ohne befürchten zu müssen, dass Ihnen jemand über die Schulter schaut, können Sie auch ganz einfach ein KI-Kunstmodell auf Ihrem lokalen Computer ausführen.