Möchten Sie ChatGPT Ihre benutzerdefinierten Daten zur Verfügung stellen? Hier finden Sie eine Schritt-für-Schritt-Anleitung, wie Sie genau das tun!

Durch die Bereitstellung der GPT-Technologie in einem leistungsstarken und benutzerfreundlichen Chatbot hat sich ChatGPT zum weltweit beliebtesten KI-Tool entwickelt. Viele Menschen nutzen ChatGPT, um spannende Gespräche zu führen, Fragen zu beantworten, kreative Vorschläge zu unterbreiten und beim Codieren und Schreiben zu helfen. ChatGPT ist jedoch eingeschränkt, da Sie Ihre Daten nicht für den langfristigen persönlichen Gebrauch speichern können und der Stichtag für Wissensdaten im September 2021 gilt.

Um dieses Problem zu umgehen, können wir die OpenAI-API und LangChain verwenden, um ChatGPT mit benutzerdefinierten Daten und aktualisierten Informationen über das Jahr 2021 hinaus bereitzustellen und eine benutzerdefinierte ChatGPT-Instanz zu erstellen.

Warum ChatGPT benutzerdefinierte Daten bereitstellen?

Das Füttern von ChatGPT mit benutzerdefinierten Daten und die Bereitstellung aktualisierter Informationen über den Stichtag hinaus bietet mehrere Vorteile gegenüber der einfachen Verwendung von ChatGPT wie gewohnt. Hier sind einige davon:

instagram viewer

  • Personalisierte Interaktionen: Durch die Bereitstellung benutzerdefinierter Daten für ChatGPT können Benutzer ein individuelleres Erlebnis schaffen. Das Modell kann anhand spezifischer Datensätze trainiert werden, die für einzelne Benutzer oder Organisationen relevant sind, was zu Antworten führt, die auf deren individuelle Bedürfnisse und Vorlieben zugeschnitten sind.
  • Domänenspezifische Expertise: Durch die benutzerdefinierte Datenintegration kann sich ChatGPT auf bestimmte Domänen oder Branchen spezialisieren. Es kann auf branchenspezifisches Wissen, Terminologie und Trends geschult werden, was genauere und aufschlussreichere Antworten in diesen spezifischen Bereichen ermöglicht.
  • Aktuelle und genaue Informationen: Der Zugriff auf aktualisierte Informationen stellt sicher, dass ChatGPT über die neuesten Entwicklungen und Erkenntnisse auf dem Laufenden bleibt. Es kann genaue Antworten auf der Grundlage aktueller Ereignisse, Nachrichten oder Forschungsergebnisse liefern und ist somit eine zuverlässigere Informationsquelle.

Nachdem Sie nun verstanden haben, wie wichtig es ist, benutzerdefinierte Daten für ChatGPT bereitzustellen, finden Sie hier eine Schritt-für-Schritt-Anleitung, wie Sie dies auf Ihrem lokalen Computer tun.

Schritt 1: Software und vorgefertigtes Skript installieren und herunterladen

Bitte beachten Sie, dass die folgenden Anweisungen für einen Computer mit Windows 10 oder Windows 11 gelten.

Um benutzerdefinierte Daten für ChatGPT bereitzustellen, müssen Sie die neuesten Versionen von Python3, Git, Microsoft C++ und das ChatGPT-Abrufskript von GitHub installieren und herunterladen. Wenn Sie bereits einen Teil der Software auf Ihrem PC installiert haben, stellen Sie sicher, dass diese auf die neueste Version aktualisiert ist, um Probleme während des Vorgangs zu vermeiden.

Beginnen Sie mit der Installation:

  • Herunterladen:Python3 (Frei)
  • Herunterladen:Git (Frei)
  • Herunterladen:Microsoft Visual Build Tools (Frei)

Installationshinweise für Python3 und Microsoft C++

Stellen Sie bei der Installation von Python3 sicher, dass Sie das Kontrollkästchen aktivieren Fügen Sie python.exe zum PATH hinzu Option, bevor Sie darauf klicken Jetzt installieren. Dies ist wichtig, da Sie so in jedem Verzeichnis auf Ihrem Computer auf Python zugreifen können.

Wenn Sie Microsoft C++ installieren, möchten Sie installieren Microsoft Visual Studio Build-Tools Erste. Nach der Installation können Sie das Häkchen setzen Desktop-Entwicklung mit C++ Option und klicken Sie Installieren Alle optionalen Tools sind in der rechten Seitenleiste automatisch aktiviert.

Nachdem Sie nun die neuesten Versionen von Python3, Git und Microsoft C++ installiert haben, können Sie das Python-Skript herunterladen, um benutzerdefinierte lokale Daten einfach abzufragen.

Herunterladen: ChatGPT-Abrufskript (Frei)

Um das Skript herunterzuladen, klicken Sie auf Code, dann auswählen ZIP herunterladen. Dadurch sollte das Python-Skript in Ihr Standard- oder ausgewähltes Verzeichnis heruntergeladen werden.

Nach dem Herunterladen können wir nun eine lokale Umgebung einrichten.

Schritt 2: Richten Sie die lokale Umgebung ein

Um die Umgebung einzurichten, müssen Sie ein Terminal im heruntergeladenen Ordner chatgpt-retrieval-main öffnen. Öffnen Sie dazu chatgpt-retrieval-main Klicken Sie mit der rechten Maustaste auf den Ordner und wählen Sie ihn aus Im Terminal öffnen.

Sobald das Terminal geöffnet ist, kopieren Sie diesen Befehl und fügen Sie ihn ein:

pip install langchain openai chromadb tiktoken unstrukturiert

Dieser Befehl verwendet den Paketmanager von Python, um Erstellen und verwalten Sie die virtuelle Python-Umgebung erforderlich.

Nachdem wir die virtuelle Umgebung erstellt haben, müssen wir einen OpenAI-API-Schlüssel bereitstellen, um auf ihre Dienste zuzugreifen. Wir müssen zunächst einen API-Schlüssel daraus generieren Website mit OpenAI-API-Schlüsseln indem Sie auf klicken Erstellen Sie einen neuen geheimen Schlüssel, fügen Sie einen Namen für die Taste hinzu und drücken Sie dann die Schaltfläche „Geheimen Schlüssel erstellen“..

Sie erhalten eine Zeichenfolge. Dies ist Ihr OpenAI-API-Schlüssel. Kopieren Sie es, indem Sie auf das Kopiersymbol neben dem API-Schlüssel klicken. Beachten Sie, dass dieser API-Schlüssel geheim gehalten werden sollte. Teilen Sie es nicht mit anderen, es sei denn, Sie beabsichtigen wirklich, dass diese es mit Ihnen verwenden.

Kehren Sie nach dem Kopieren zum Ordner chatgpt-retrieval-main zurück und öffnen Sie die Konstanten mit Notizblock. Ersetzen Sie nun den Platzhalter durch Ihren API-Schlüssel. Denken Sie daran, die Datei zu speichern!

Jetzt haben Sie Ihre virtuelle Umgebung erfolgreich eingerichtet und Ihren OpenAI-API-Schlüssel als Umgebungsvariable hinzugefügt. Sie können ChatGPT jetzt Ihre benutzerdefinierten Daten bereitstellen.

Schritt 3: Benutzerdefinierte Daten hinzufügen

Um benutzerdefinierte Daten hinzuzufügen, platzieren Sie alle Ihre benutzerdefinierten Textdaten im Daten Ordner innerhalb von chatgpt-retrieval-main. Das Format der Textdaten kann im Format PDF, TXT oder DOC vorliegen.

Wie Sie dem Screenshot oben entnehmen können, habe ich eine Textdatei hinzugefügt, die einen persönlichen Zeitplan enthält, einen Artikel, über den ich geschrieben habe AMDs Instinct-Beschleunigerund ein PDF-Dokument.

Schritt 4: ChatGPT über das Terminal abfragen

Mit dem Python-Skript können wir Daten aus den benutzerdefinierten Daten abfragen, die wir dem Datenordner und dem Internet hinzugefügt haben. Mit anderen Worten: Sie haben Zugriff auf das übliche ChatGPT-Backend und alle lokal im Datenordner gespeicherten Daten.

Um das Skript zu verwenden, führen Sie Python aus chatgpt.py Skript und fügen Sie dann Ihre Frage oder Abfrage als Argument hinzu.

Python chatgpt.py "IHRE FRAGE"

Stellen Sie sicher, dass Sie Ihre Fragen in Anführungszeichen setzen.

Um zu testen, ob wir ChatGPT unsere Daten erfolgreich übermittelt haben, stelle ich eine persönliche Frage dazu Persönlicher Sched.txt Datei.

Es funktionierte! Dies bedeutet, dass ChatGPT die zuvor bereitgestellte Datei „Personal Sched.txt“ lesen konnte. Sehen wir uns nun an, ob wir ChatGPT erfolgreich mit Informationen versorgt haben, die es aufgrund seines Wissensstichtags nicht kennt.

Wie Sie sehen können, wurde der AMD Instinct MI250x korrekt beschrieben, der nach dem Stichtag von ChatGPT -3 veröffentlicht wurde.

Einschränkungen von Custom ChatGPT

Obwohl die Bereitstellung von benutzerdefinierten Daten für GPT-3.5 mehr Möglichkeiten zur Anwendung und Nutzung des LLM eröffnet, gibt es einige Nachteile und Einschränkungen.

Zunächst müssen Sie alle Daten selbst bereitstellen. Sie können bis zum Stichtag des Wissens weiterhin auf das gesamte Wissen von GPT-3.5 zugreifen; Sie müssen jedoch alle zusätzlichen Daten angeben. Das heißt, wenn Sie möchten, dass Ihr lokales Modell über ein bestimmtes Thema im Internet Bescheid weiß, das GPT-3.5 noch nicht kennt, Sie müssen ins Internet gehen, die Daten selbst extrahieren und als Text im Datenordner von chatgpt-retrieval-main speichern.

Ein weiteres Problem besteht darin, dass eine solche Abfrage von ChatGPT mehr Zeit zum Laden benötigt als eine direkte Abfrage von ChatGPT.

Schließlich ist das einzige derzeit verfügbare Modell GPT-3.5 Turbo. Selbst wenn Sie also Zugriff auf GPT-4 haben, können Sie es nicht zum Betrieb Ihrer benutzerdefinierten ChatGPT-Instanz verwenden.

Benutzerdefiniertes ChatGPT ist großartig, aber begrenzt

Die Bereitstellung benutzerdefinierter Daten für ChatGPT ist eine leistungsstarke Möglichkeit, mehr aus dem Modell herauszuholen. Mit dieser Methode können Sie das Modell mit beliebigen Textdaten füttern und es wie normales ChatGPT auffordern, allerdings mit einigen Einschränkungen. Dies wird sich jedoch in Zukunft ändern, da es einfacher wird, unsere Daten in das LLM zu integrieren und auf das neueste GPT-4-Modell zuzugreifen.