Die GPT-Modelle von OpenAI haben die Verarbeitung natürlicher Sprache (NLP) revolutioniert, es sei denn, Sie zahlen Premium Wenn Sie keinen Zugriff auf die Dienste von OpenAI haben, können Sie deren GPT-Modelle nicht verfeinern und in Ihre integrieren Anwendungen. Darüber hinaus hat OpenAI Zugriff auf alle Ihre Gespräche, was ein Sicherheitsrisiko darstellen kann, wenn Sie ChatGPT geschäftlich und in anderen sensibleren Bereichen Ihres Lebens verwenden. Wenn Sie daran nicht interessiert sind, sollten Sie GPT4All ausprobieren.

Was genau ist GPT4All? Wie funktioniert es und warum sollte es über ChatGPT verwendet werden?

Was ist GPT4All?

GPT4All ist ein Open-Source-Ökosystem, das zur Integration von LLMs in Anwendungen verwendet wird, ohne für eine Plattform oder ein Hardware-Abonnement zu bezahlen. Es wurde von Nomic AI erstellt, einem Unternehmen für Informationskartografie, das sich zum Ziel gesetzt hat, den Zugang zu KI-Ressourcen zu verbessern.

GPT4All ist so konzipiert, dass es auf modernen bis relativ modernen PCs läuft, ohne dass eine Internetverbindung oder sogar eine GPU erforderlich ist! Dies ist möglich, da die meisten von GPT4All bereitgestellten Modelle auf eine Größe von nur wenigen Gigabyte quantisiert wurden und nur 4–16 GB RAM zum Betrieb benötigen.

instagram viewer

Dadurch können kleinere Unternehmen, Organisationen und unabhängige Forscher ein LLM für bestimmte Anwendungen nutzen und integrieren. Und da GPT4All einfach über ein Ein-Klick-Installationsprogramm installiert werden kann, können Benutzer jetzt GPT4All und verwenden viele seiner LLMs für die Erstellung von Inhalten, das Schreiben von Code, das Verstehen von Dokumenten und Informationen sammeln.

Warum GPT4ALL anstelle von ChatGPT verwenden?

Bildnachweis: Bruce Mars/Unsplash

Es gibt mehrere Gründe, warum Sie GPT4All anstelle von ChatGPT verwenden möchten.

  • Portabilität: Die von GPT4All bereitgestellten Modelle benötigen nur vier bis acht Gigabyte Speicher, benötigen zum Betrieb keine GPU und können mit dem Ein-Klick-Installationsprogramm von GPT4All problemlos auf einem USB-Stick gespeichert werden. Dies macht GPT4All und seine Modelle wirklich portabel und auf nahezu jedem modernen Computer nutzbar.
  • Privatsphäre und Sicherheit: Wie bereits erläutert, sind alle Ihre ChatGPT-Konvertierungen für OpenAI zugänglich, es sei denn, Sie haben Zugriff auf ChatGPT Plus. GPT4All konzentriert sich auf Datentransparenz und Datenschutz. Ihre Daten werden nur auf Ihrer lokalen Hardware gespeichert, es sei denn, Sie geben sie absichtlich an GPT4All weiter, um die Erweiterung ihrer Modelle zu unterstützen.
  • Offline-Modus: GPT ist ein proprietäres Modell, das API-Zugriff und eine ständige Internetverbindung erfordert, um das Modell abzufragen oder darauf zuzugreifen. Wenn Sie Ihre Internetverbindung verlieren oder ein Serverproblem haben, haben Sie keinen Zugriff auf ChatGPT. Dies ist bei GPT4All nicht der Fall. Da alle Daten bereits in einem Paket von vier bis acht Gigabyte gespeichert sind und die Inferenz lokal erfolgt, benötigen Sie keine Internetverbindung, um auf die Modelle in GPT4All zuzugreifen. Sie können auch ohne Internetverbindung weiter chatten und Ihr Modell optimieren.
  • Kostenlos und Open Source: Mehrere von GPT4All bereitgestellte LLMs sind unter GPL-2 lizenziert. Dies ermöglicht es jedem, seine eigenen Modelle für die kommerzielle Nutzung zu verfeinern und zu integrieren, ohne für eine Lizenz bezahlen zu müssen.

So funktioniert GPT4All

Wie bereits erwähnt, ist GPT4All ein Ökosystem, das zum Trainieren und Bereitstellen von LLMs lokal auf Ihrem Computer verwendet wird, was eine unglaubliche Leistung ist! Normalerweise wären zum Laden eines Standard-LLM mit 25 bis 30 GB 32 GB RAM und eine GPU der Enterprise-Klasse erforderlich.

Zum Vergleich: Die LLMs, die Sie mit GPT4All verwenden können, benötigen nur 3 GB bis 8 GB Speicher und können mit 4 GB bis 16 GB RAM ausgeführt werden. Dies ermöglicht die Ausführung eines gesamten LLM auf einem Edge-Gerät, ohne dass eine GPU oder externe Cloud-Unterstützung erforderlich ist.

Die Hardwareanforderungen zum Ausführen von LLMs auf GPT4All wurden dank der Quantisierung neuronaler Netzwerke erheblich reduziert. Durch die Reduzierung des Präzisionsgewichts und der Aktivierungen in einem neuronalen Netzwerk können viele der von GPT4All bereitgestellten Modelle auf den meisten relativ modernen Computern ausgeführt werden.

Die in einigen der verfügbaren Modelle verwendeten Trainingsdaten wurden über den „Stapel“ gesammelt, bei dem es sich lediglich um ausgekratzte Daten aus öffentlich veröffentlichten Inhalten im Internet handelt. Die Daten werden dann an die Atlas AI-Datenbank von Nomic AI gesendet, die anhand von Korrelationen auf einer leicht erkennbaren 2D-Vektorkarte (auch bekannt als) angezeigt werden kann eine KI-Vektordatenbank).

Indem Nomic AI das Groovy-Modell trainierte und öffentlich verfügbare Daten nutzte, konnte Nomic AI das Modell unter einer offenen GPL-Lizenz veröffentlichen, die es jedem ermöglicht, es zu nutzen, auch für kommerzielle Anwendungen.

So installieren Sie GPT4All

Die Installation von GPT4All ist einfach, und jetzt, da GPT4All Version 2 veröffentlicht wurde, ist es noch einfacher! Der beste Weg, GPT4All 2 zu installieren, besteht darin, das Ein-Klick-Installationsprogramm herunterzuladen:

Herunterladen:GPT4All für Windows, macOS oder Linux (kostenlos)

Die folgenden Anweisungen gelten für Windows, Sie können GPT4All jedoch auf jedem größeren Betriebssystem installieren.

Doppelklicken Sie nach dem Herunterladen auf das Installationsprogramm und wählen Sie es aus Installieren. Windows Defender erkennt die Installation möglicherweise als bösartig an, da der Prozess für Microsoft, gültige Signaturen für Anwendungen von Drittanbietern bereitzustellen, lange dauern kann. Dies sollte jedoch bald behoben werden. Solange Sie die GPT4All-Anwendung von der offiziellen Website heruntergeladen haben, sollten Sie zum jetzigen Zeitpunkt auf der sicheren Seite sein. Klicke auf Trotzdem installieren um GPT4All zu installieren.

Sobald Sie die Anwendung öffnen, müssen Sie ein zu verwendendes Modell auswählen. GPT4ALL stellt Ihnen mehrere Modelle zur Verfügung, die alle ihre Stärken und Schwächen haben. Um zu wissen, welches Modell Sie herunterladen sollten, finden Sie hier eine Tabelle mit den Stärken und Schwächen.

Modell

Größe

Notiz

Parameter

Typ

Quantisierung

Hermes

7,58 GB

  • Basierend auf Anweisungen
  • Gibt lange Antworten
  • Kuratiert mit 300.000 unzensierten Anweisungen
  • Nicht kommerziell nutzbar

13 Milliarden

Lama

q4_0

GPT4All Falcon

3,78 GB

  • Schnelle Antworten
  • Anleitungsbasiert
  • Lizenziert für die kommerzielle Nutzung

7 Milliarden

Falke

q4_0

Groovig

8 GB

  • Schnelle Antworten
  • -Kreative Antworten
  • Anleitungsbasiert
  • Lizenziert für die kommerzielle Nutzung

7 Milliarden

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimal

  • Erfordert eine persönliche API
  • Sendet Ihre Chats an OpenAI
  • GPT4All wird nur zur Kommunikation mit OpenAI verwendet

?

GPT

N / A

ChatGPT-4

Minimal

  • Erfordert eine persönliche API
  • Sendet Ihre Chats an OpenAI
  • GPT4All wird nur zur Kommunikation mit OpenAI verwendet

?

GPT

N / A

Schlummernd

7,58 GB

  • Anleitungsbasiert
  • Langsamer als Groovy, aber mit qualitativ hochwertigeren Antworten
  • Nicht kommerziell nutzbar

13 Milliarden

Lama

q4_0

MPT-Chat

4,52 GB

  • Schnelle Antworten
  • Chatbasiert
  • Nicht kommerziell nutzbar

7 Milliarden

MPT

q4_0

Orca

3,53 GB

  • Anleitungsbasiert
  • Erklärt abgestimmte Datensätze
  • Ansätze zur Datensatzkonstruktion im Orca Research Paper
  • Lizenziert für die kommerzielle Nutzung

7 Milliarden

OpenLLaMA

q4_0

Vicuna

3,92 GB

  • Anleitungsbasiert
  • Nicht kommerziell nutzbar

7 Milliarden

Lama

q4_2

Magier

3,92 GB

  • Anleitungsbasiert
  • Nicht kommerziell nutzbar

7 Milliarden

Lama

q4_2

Zauberer unzensiert

7,58 GB

  • Anleitungsbasiert
  • Nicht kommerziell nutzbar

13 Milliarden

Lama

q4_0

Beachten Sie, dass die angebotenen Modelle unterschiedliche Einschränkungen haben. Nicht alle Modelle können kommerziell kostenlos genutzt werden; Einige benötigen mehr Hardwareressourcen, während andere einen API-Schlüssel benötigen. Die am wenigsten restriktiven Modelle in GPT4All sind Groovy, GPT4All Falcon und Orca.

Können Sie GPT4All-Modelle trainieren?

Ja, aber nicht die quantisierten Versionen. Um GPT4All-Modelle effektiv zu optimieren, müssen Sie die Rohmodelle herunterladen und GPUs der Enterprise-Klasse verwenden, z AMDs Instinct-Beschleuniger oder NVIDIAs Ampere- oder Hopper-GPUs. Darüber hinaus müssen Sie das Modell über ein KI-Trainingsframework wie LangChain trainieren, was einige technische Kenntnisse erfordert.

Die Feinabstimmung eines GPT4All-Modells erfordert einige finanzielle Ressourcen und technisches Know-how. Wenn Sie jedoch nur benutzerdefinierte Daten für ein GPT4All-Modell bereitstellen möchten, ist dies möglich Trainieren Sie das Modell weiterhin durch Retrieval Augmented Generation (was einem Sprachmodell hilft, auf Informationen außerhalb seines Basistrainings zuzugreifen und diese zu verstehen). Aufgaben). Sie können dies tun, indem Sie GPT4All auffordern, Ihre benutzerdefinierten Daten zu modellieren, bevor Sie eine Frage stellen. Benutzerdefinierte Daten sollten lokal gespeichert werden, und wenn Sie dazu aufgefordert werden, sollte das Modell in der Lage sein, Ihnen die von Ihnen eingegebenen Informationen bereitzustellen.

Sollten Sie GTP4All verwenden?

Die Idee von GPT4All besteht darin, eine kostenlos nutzbare Open-Source-Plattform bereitzustellen, auf der Menschen große Sprachmodelle auf ihren Computern ausführen können. Derzeit eignen sich GPT4All und seine quantisierten Modelle hervorragend zum Experimentieren, Lernen und Ausprobieren verschiedener LLMs in einer sicheren Umgebung. Für professionelle Workloads würden wir dennoch die Verwendung von ChatGPT empfehlen, da das Modell deutlich leistungsfähiger ist.

Insgesamt gibt es keinen Grund, warum Sie sich auf einen beschränken sollten. Da sich ihre Anwendungsfälle nicht überschneiden, sollten Sie versuchen, beide zu verwenden.