KI-Tools in der Musikproduktion sind nichts Neues. Aber was ist mit Musik, die von Grund auf mit KI erstellt wurde? Das ist jetzt auch Realität.
Generative KI verbreitet sich langsam in immer mehr Disziplinen der Kreativbranche. Es begann mit KI-Kunstgeneratoren und breitete sich dann auf das Schreiben mit KI-generiertem Text aus. Jetzt können wir dieser Liste Musik hinzufügen.
In naher Zukunft wird KI-generierte Musik, die von Grund auf neu entstanden ist, Realität werden. Tatsächlich ist dies mit Jukebox, dem KI-Modell von OpenAI zum Musizieren, bereits möglich. Es ist noch nicht in einer einfach zu bedienenden Anwendung verfügbar, und es klingt noch nicht gut genug, aber die algorithmischen Knochen sind vorhanden.
Hier ist, was Sie über die Jukebox von OpenAI wissen müssen und was Sie damit tun können.
Jukebox: KI, die Musik als Rohaudio erzeugt
Jukebox ist ein neuronales Netz, das Musik in roher Audioform erzeugen kann, wenn Sie ihm Eingaben wie Genre, Künstler oder Text geben. Es wurde im April 2020 von OpenAI veröffentlicht, demselben Unternehmen, das uns den KI-Kunstgenerator namens Dall-E und den KI-Chatbot namens ChatGPT gebracht hat.
Im Gegensatz zu Dall-E, das sich schnell auf der ganzen Welt verbreitete und KI zu einem fieberhaften Thema in Nachrichten und Medien machte, verzeichnete Jukebox nach seiner Veröffentlichung kein großes Interesse. Ein Grund dafür ist, dass es keine benutzerfreundliche Webanwendung gibt – zumindest noch nicht.
Sie finden den Code auf der OpenAI-Website, neben einer ausführlichen Erklärung, wie der Codierungs- und Decodierungsprozess funktioniert.
Ein weiterer wahrscheinlicher Grund ist, dass es enorm viel Zeit und Rechenleistung in Anspruch nimmt. Um Ihnen eine Vorstellung zu geben: Das Rendern von nur einer Minute Audio kann 9 Stunden dauern. Sie benötigen die Bereitschaft, das Modell in seiner Codeform zu untersuchen, sowie viel Geduld, wenn Sie sehen möchten, was ein KI-Modell tun kann, um Musik zu erzeugen.
Oder Sie können direkt zu den springen Jukebox-Beispiel-Explorer. Hier hat OpenAI seine Experimente zur Generierung von Songs wie Ella Fitzgerald oder 2Pac veröffentlicht.
Deutlich sein, andere KI-Musik-Tools existieren, um Ihnen beim Generieren eines Songs zu helfen, aber sie generieren kein Audio von Grund auf neu. Stattdessen kombinieren sie entweder vorab aufgenommene Samples oder erstellen MIDI-Informationen, die durch einen digitalen Synthesizer geleitet werden.
Wie klingt Jukebox?
Die Ergebnisse von Jukebox sind erkennbar, aber seltsam. Es ist nicht schwer, die Form des Songs und das Genre, zu dem er gehört, zu verstehen, aber die Qualität der Ergebnisse lässt es klingen, als würden Sie einige der frühesten aufgezeichneten Musikstücke hören: das heißt, gedämpft mit viel davon Lärm.
Man kann mit Sicherheit sagen, dass Jukebox nicht die Art von High-Fidelity-Sound erzeugt, die Sie von einem Paar guter Kopfhörer hören würden. Es ist eher so, als würde man Musik von einem Radiosender hören, der nicht vollständig auf die richtige Frequenz eingestellt ist. Einige Songs sind Neuinterpretationen, während andere Fortsetzungen bestehender Songs sind. Es gibt auch eine Kategorie für neuartige Künstler und Stilrichtungen sowie unveröffentlichte Texte.
Trotz der Klangqualität beschreiben frühe Experimentatoren, dass sie von der unheimlichen Schönheit und bizarren Natur der von Jukebox geschaffenen Musik beeindruckt waren. „Wie ein Soundtrack zu einer Dokumentation über ein unbekanntes Land mit einer unbekannten Kultur“, schreibt er Merzmench auf Medium.
Derzeit sind die Ergebnisse bei weitem nicht gut genug, um von Menschen geschaffene Musik zu kopieren oder gar zu ersetzen, aber die Die Technologie entwickelt sich schnell und schon bald werden Modelle wie Jukebox in der Lage sein, diese Kunststücke zu vollbringen zu.
Wie die Jukebox von OpenAI trainiert wurde
Ein Teil der Art und Weise, wie Jukebox in der Lage ist, Musik zu kreieren, die es noch nie zuvor gegeben hat, besteht darin, dass es mit der Musik echter Musiker trainiert wurde. OpenAI erklärt das:
„Um dieses Modell zu trainieren, haben wir das Internet gecrawlt, um einen neuen Datensatz von 1,2 Millionen Songs (davon 600.000 auf Englisch) zu kuratieren, gepaart mit den entsprechenden Texten und Metadaten von LyricWiki.“
Das Crawlen nach Daten ist eine Praxis, die von einigen KI-Unternehmen verwendet wird, um eine Reihe von Daten zu erstellen, aus denen ein KI-Modell lernen und Entscheidungen treffen kann, wenn es ein Bild, einen Text – oder in diesem Fall – Musik generiert. Durch Crawling erstellte Datensätze sind umstritten, da die Zustimmung der Eigentümer der Daten gar nicht erst eingeholt wird. Einige Plattformen erlauben dies jedoch Ihre Inhalte aus Datensätzen ausschließen.
Man könnte meinen, dass 1,2 Millionen Songs viel sind, aber im Vergleich dazu wurde Dall-E 2 mit Hunderten Millionen Bild-Text-Paaren aus dem Internet trainiert. Vor diesem Hintergrund hat Jukebox seine Grenzen.
Sein relativ kleiner Trainingspool kann den Reichtum und die Vielfalt der menschlichen Musik nicht erfassen. OpenAI hat erklärt, dass es weitgehend auf westliche Musik trainiert ist, was eine klare Tendenz darstellt, welche Musik es erzeugen kann.
Was können Sie mit Jukebox tun?
Was können Sie also angesichts der Einschränkungen mit Jukebox tun? Eine schnelle Möglichkeit, diese Frage zu beantworten, besteht darin, zu sagen, was Sie mit Jukebox nicht tun können.
Da es fast einen halben Tag dauert, um eine Minute Musik zu rendern, ist es für die Musikproduktion nicht sehr nützlich. Zumindest nicht im herkömmlichen Sinn. Normalerweise bewegen sich Musiker zwischen dem Herumspielen auf einem Instrument (Improvisieren) und dem Planen der Struktur eines Songs hin und her. Die gleiche Art von Experimentieren ist mit Jukebox nicht möglich.
Da es in diesem Stadium nicht einfach ist, einen Song mit Jukebox zu erstellen, können Sie es sich eher als eine neuartige Methode zum Generieren von Musik-Samples vorstellen. Sobald Sie Audiomaterial erstellt haben, das Ihnen gefällt, können Sie es wie gewohnt in Ihren kreativen Projekten verwenden.
Das folgende Video ist das Ergebnis von jemandem, der mit Jukebox erstellte Musik verwendet, um ein kurzes Montagevideo zu unterstreichen.
Künstliche Intelligenz hat auch außerhalb kreativer Anwendungen ein breites Anwendungsspektrum, weshalb es sich lohnt verstehen, was KI ist und welche Gefahren sie birgt.
Bewegt Sie KI-Musik?
Die von Jukebox erzeugte Musik ist nicht einfach abzutun, und trotz all ihrer Fremdheit und unheimlichen Mensch-Maschine-Qualität klingt sie am Ende wie Musik. Während die Musikindustrie schon seit einiger Zeit KI-Tools einsetzt, ist die Möglichkeit, Musik als Rohaudio zu erzeugen, erst jetzt Realität.
Aber obwohl Modelle wie Jukebox existieren, müssen sie noch in ein kommerzielles Tool verpackt werden und reichen immer noch nicht für die Fähigkeiten menschlicher Musiker aus.