Modelle der künstlichen Intelligenz wie ChatGPT und Bard werden anhand von Menschen erstellter Daten trainiert. Je mehr Daten sie aufnehmen, desto besser gelingt es ihnen, die menschliche Intelligenz und Kreativität nachzuahmen. Große Akteure der KI-Branche wie OpenAI und Meta haben große Sprachmodelle eingesetzt, die durch das Scrapen von online verfügbaren Texten und Büchern trainiert wurden, um Daten zu extrahieren.
Aufgrund der Art und Weise, wie LLMs ausgebildet werden, war es unvermeidlich, dass es zu einem Konflikt zwischen Urheberrecht und künstlicher Intelligenz kommen würde. Jetzt kommen die Hühner zum Schlafen nach Hause, da Sarah Silverman und andere Künstler OpenAI und Meta wegen Urheberrechtsverletzung verklagen.
In eine Sammelklage [PDF] eingereicht in Kalifornien, fordern die Komikerin Sarah Silverman und andere Autoren (Christopher Golden und Richard Kadrey) Schadensersatz gegen OpenAI und Meta wegen Urheberrechtsverletzung. In der Klage wird behauptet, OpenAI und Meta hätten urheberrechtlich geschützte Bücher von Raubkopien-Websites geklaut, um ihre KI-Modelle zu trainieren. Dies entspricht einem KI-Modell, das seine Trainingsdatensätze von Piratebay herunterlädt, ohne die Autoren zu entschädigen.
Zufälligerweise a separate Sammelklage [PDF] gegen OpenAI behauptet, das Unternehmen habe nicht autorisierte private Informationen verwendet, um ChatGPT zu trainieren. Auch Google steht vor einer ähnlichen Klage wegen angeblicher Verwendung gestohlener Daten zum Trainieren von Google Bard. Deshalb sollten Sie es tun Machen Sie es sich zur Gewohnheit, Ihre persönlichen Daten zu schützen, obwohl Veröffentlichungsarbeiten und private personenbezogene Daten nicht dasselbe sind.
Wie groß sind die Chancen, dass Sarah Silverman die Klage gewinnen könnte?
Silverman und andere Künstler behaupten, dass ChatGPT ihre Bücher auf Aufforderung genau zusammenfassen kann. In der Beschwerde wird argumentiert, dass dies nicht möglich wäre, wenn das KI-Modell keinen Zugriff auf das urheberrechtlich geschützte Material hätte. Wenn ChatGPT jedoch anhand von Milliarden von Internettexten trainiert wurde, stieß es wahrscheinlich auf Artikel, Kommentare und Social-Media-Beiträge, in denen die Bücher diskutiert wurden.
Darüber hinaus gab Meta bekannt, wo es die Bücher erworben hatte, mit denen es sein KI-Modell trainierte – die Quelle wurde auf eine E-Book-Torrent-Website zurückgeführt. In ähnlicher Weise werden in der Sammelklage gegen OpenAI auch illegale Websites erwähnt, bei denen der Verdacht besteht, dass OpenAI die urheberrechtlich geschützten Materialien erhalten hat, OpenAI seine Quellen jedoch noch nicht bestätigt hat.
Wenn sich herausstellt, dass OpenAI und Meta illegale Torrent-Websites genutzt haben, um urheberrechtlich geschütztes Material zum Trainieren ihrer KI-Modelle zu erwerben, könnte Silverman eine Chance haben, die Klage zu gewinnen. Allerdings sind KI-Modelle Neuland und es gibt keinen Präzedenzfall, auf den sich Gerichte stützen könnten, um eine Entscheidung auf der Grundlage einer KI-Urheberrechtsverletzung zu treffen. Tatsächlich ist das einer der Gründe dafür Die EU hat ein KI-Gesetz vorgeschlagen.
Wie sieht die Zukunft von KI-Modellen und Urheberrecht aus?
Wir befinden uns noch in den Anfängen der KI und wissen nicht, wie sie sich an das Urheberrecht anpassen wird. Es ist noch komplexer, es herauszufinden Wer besitzt das Urheberrecht an der KI-Erstellung?. Für menschliche Urheber gibt es jedoch Vorschriften, die sie davor schützen, dass jemand anderes ohne Entschädigung, Zustimmung oder Quellenangabe auf ihr urheberrechtlich geschütztes Material zugreift. Wenn die Regeln für Menschen gelten, gelten sie dann auch für KI-Modelle?
Das EU-Parlament entwarf einen detaillierten Ausblick darauf, wie KI-Modelle künftig dem Urheberrecht entsprechen werden. Wenn das EU-KI-Gesetz in Kraft tritt, müssen KI-Modelle wie ChatGPT und Bard alle ihre Datensatzquellen und urheberrechtlich geschützten Daten, die für das Training verwendet werden, veröffentlichen. Dies wird dazu beitragen, etwaige Verwirrung zu beseitigen, wenn die KI-Modelle über illegale Piraterie-Websites auf urheberrechtlich geschützte Bücher, Filme, Musik und Fotos zu Schulungszwecken zugegriffen haben.
Das Urteil zur AI-Sammelklage wird einen Präzedenzfall schaffen
Große Sprachmodelle können alle Ecken des Internets nach Daten durchsuchen, die für das Training verwendet werden. Aber haften sie für Urheberrechtsverletzungen, wenn sie auf illegale Torrent-Websites zugreifen, um an die Daten zu gelangen? Und wenn ja, können Sie es beweisen?
Unabhängig vom Ergebnis werden die Sammelklagen gegen die Technologieunternehmen, die die beliebtesten KI-Modelle besitzen, einen Präzedenzfall schaffen, der für die Zukunft relevant sein wird.