KI-Kunstgeneratoren haben einen schlechten Ruf für die Erstellung ungenauer Darstellungen von Händen. Lassen Sie uns Midjourney v5 gegen Dall-E 2 antreten lassen, um zu sehen, wer es besser macht.
KI-Kunstgeneratoren beeindrucken weiterhin und ermöglichen es uns, so ziemlich alles zu erschaffen, was wir uns vorstellen können. Allerdings scheint die Technologie eine Mauer getroffen zu haben, wenn es darum geht, realistisch aussehende Hände zu erzeugen.
Hier schauen wir uns zwei der führenden generativen Kunst-Apps an und stellen sie Kopf an Kopf – oder Hand an Hand – gegeneinander, um zu sehen, welche bessere Hände erzeugen kann, Midjourney v5 oder Dall-E 2. Haben Sie eine dieser Apps gemeistert? Lass es uns herausfinden!
Das Problem der KI mit den Händen
Seit sich KI-generierte Kunst im Internet verbreitet hat, gibt es Kritik an der Qualität der von KI gezeichneten Hände. Trotz der jüngsten Aktualisierungen, wie in unseren direkten Vergleichen gezeigt, waren die Ergebnisse nicht zufriedenstellend.
Beide Konkurrenten haben ihre Fähigkeiten und die Qualität ihrer Ergebnisse mit jeder Iteration verbessert. Das neuste Update, Version 5 von Midjourney, hat beeindruckende Fortschritte gezeigt. Das Problem mit den von der KI gezeichneten Händen bleibt jedoch ungelöst und kann nicht ignoriert werden.
Vergleich 1: Verwendung der Prompts „Hand“ und „Hands“
Unsere Vergleiche enthalten genau die gleichen Eingabeaufforderungen für Dall-E 2 und Midjourney v5. Wir werden die Eingabeaufforderungen so gestalten, dass sie handspezifisch sind, anstatt einfach Leute zu erstellen, die sehen, wie die Hände aussehen. Außerdem geben wir jeder App nur eine Chance (Wurf) für jede Eingabeaufforderung.
Hand
Beginnen wir mit dem grundlegendsten und relevantesten Prompt: „Hand“.
Zwischendurch v5:
Dall-E 2:
Wir haben keinen guten Start!
Midjourney ging den ungewöhnlichen Weg, eine Hand mit eher kreativen Situationen zu assoziieren. Anstatt sich nur auf eine Hand zu konzentrieren, sehen wir einen Zauberer, Handschuhe, ein Skelett und eine winzige Figur. Dem Handschuhbild fehlt auch ein Finger.
Dall-E 2 geht den umgekehrten Weg und bietet uns nur eine einzige Hand vor einem schlichten Hintergrund. Aber seltsamerweise gibt es einige seltsame Haltungen, insbesondere mit den Daumen, die nicht natürlich oder bequem aussehen. Jede Hand ist auch an einer der Seiten der Bilder abgeschnitten.
Wer gewinnt diese Runde? Wir geben es Dall-E 2 für die Gesamtgenauigkeit.
Hände
Lassen Sie uns nun den Prompt Plural „Hände“ bilden und sehen, was die KIs sich einfallen lassen.
Zwischendurch v5:
Dall-E 2:
Midjourneys Versuch mit „Händen“ fällt diesmal besser aus. Aber alle vier Bilder sind in Schwarzweiß, und wir haben einige fehlende Finger. Bei genauerem Hinsehen erkennt man auch, dass einige der Ziffern seltsam geformt sind oder ineinander übergehen.
Dall-E 2 verfügt weiterhin über Zeiger mit einem einfachen Hintergrund. Es gibt keine fehlenden Ziffern, aber die Hände sind im dritten Bild abgeschnitten und die anderen Versionen wirken irgendwie ungeschickt in der Komposition und es fehlt ihnen insgesamt an Kreativität.
Nennen wir diesen Vergleich ein Unentschieden. Dall-E 2 würde für Genauigkeit gewinnen, wenn das der einzige Faktor wäre, aber Midjourney schafft es, einige zu schaffen schöne Bilder in seinen Schwarz-Weiß-Wiedergaben, auch wenn alle vier Versionen nicht sehr gut sind realistisch.
Du kannst immer Verwenden Sie Photoshop, um Ihre Midjouney-Kunst zu reparieren, einschließlich Hände.
Vergleich 2: Handgesten
Vergleichen wir ein paar Handgesten, die fast überall anerkannt sind.
Daumen drücken
Versuchen wir es zunächst einmal mit „Daumen drücken“.
Zwischendurch v5:
Dall-E 2:
Man kann mit Sicherheit sagen, dass Midjourney diese Eingabeaufforderung komplett vermasselt hat. Uns fehlen Finger und keine der Versionen sieht überhaupt natürlich aus.
Hut ab noch einmal vor Dall-E 2 für die korrekte Fingerzählung, aber das ist die einzige gute Nachricht. Jede Version sieht aus, als würden die Finger in einem Twister-Spiel ihre eigenen Yoga-Posen einnehmen.
Bei diesem Vergleich gibt es keinen Sieger.
Daumen hoch
Als nächstes gehen wir mit "Daumen hoch".
Zwischendurch v5:
Dall-E 2:
Midjourney zählt die Finger richtig, während jede Eingabeaufforderung auf kreative Weise behandelt wird. Beachten Sie die Einführung eines illustrativen Stils?
Dall-E 2 erhält auch Punkte für Genauigkeit, ohne zu versuchen, das Boot mit etwas Kreativem zu rocken, das zu jedem Ergebnis hinzugefügt wird.
Hier gibt es keinen klaren Sieger.
Vergleich 3: Hände mit Gegenständen
Jetzt werden wir die Komplexität erhöhen, indem wir Hände auffordern, mit Objekten zu interagieren.
Hand, die Kristallkugel hält
Beginnen wir mit einem zufälligen Objekt, indem wir den Prompt „Hand holding crystal ball“ verwenden.
Zwischendurch v5:
Dall-E 2:
Wenn wir die Komplexität erhöhen, beginnt Midjourney zu glänzen. Abgesehen von einigen unnatürlich aussehenden Wiedergaben sehen die Hände und die Kristallkugeln wunderschön aus. Midjourney nimmt sich sogar die Zeit, Reflexionen im Glas zu erzeugen, die sicherlich zur Gesamtkreativität beitragen.
Aber zum ersten Mal sehen wir, dass Dall-E 2 in mindestens einer der Hände eine Ziffer fehlt, während die vierte Hand einfach nur seltsam aussieht. Die Kristallkugeln sehen im Vergleich zu Midjourney auch nicht so beeindruckend aus.
Midjourney holt seinen ersten Sieg.
Hand, die Wasser hält
Versuchen wir etwas noch Komplexeres mit der Aufforderung „Hand hält Wasser“.
Zwischendurch v5:
Dall-E 2:
Midjourney schafft es nur, ein Bild mit der richtigen Anzahl von Ziffern zu rollen. Obwohl wunderschön gerendert, sehen wir wieder einmal die Risse in der Glaubwürdigkeitsabteilung.
Dall-E 2 hat auch Probleme damit, natürliche Hände zu erreichen, macht aber einen viel besseren Job. Es ändert auch die Farbe im Hintergrund für etwas Abwechslung.
Wir geben diese Runde Dall-E 2.
Vergleich 4: Arbeitende Hände
Für diesen Vergleich erstellen wir Eingabeaufforderungen, bei denen die Hände an Aktivitäten beteiligt sind.
Hände, die Ton formen
Mal sehen, wie sich die KI-Modelle mit „Hands Molding Clay“ schlagen.
Zwischendurch v5:
Dall-E 2:
Midjourney hat in zwei Bildern einen Finger verfehlt, aber alles andere sieht toll aus.
Die Bilder von Dall-E 2 sehen verwirrend und überfüllt aus und greifen in der Hälfte der Versionen auf die Hinzufügung der Hände einer anderen Person zurück.
Die Kante geht zu Midjourney.
Hände, die Teig drücken
Lassen Sie uns eine ähnliche Aktivität ausprobieren, „Hände, die Teig pressen“.
Zwischendurch v5:
Dall-E 2:
Die Bilder von Midjourney sehen insgesamt großartig aus. Aber noch einmal, die Hälfte von ihnen hat fehlende Ziffern. Aber die Bilder können nicht wegen ihres künstlerischen Stils bemängelt werden.
In den Versionen von Dall-E 2 fehlen in der Hälfte der Wiedergaben ebenfalls Finger und fügen der letzten Hand im Set sogar einen hinzu.
Nennen wir es ein Unentschieden.
Wenn Sie diese Vergleiche selbst ausprobieren möchten, zeigen wir es Ihnen wie man Midjourney verwendet, um KI-Kunst zu erstellen.
Was sagen uns die Ergebnisse?
Es macht Spaß, Vergleiche anzustellen und einen Gesamtsieger zu ermitteln. Und wenn wir uns entscheiden müssten, würden wir uns für Midjourney v5 entscheiden. Obwohl Dall-E 2 häufiger Hände mit der richtigen Anzahl von Fingern erstellte, war es Midjourney, der künstlerisch gerenderte und ansprechendere Bilder erstellte.
Aber beide Apps haben einen Platz auf dem Marktplatz für Künstler, die Dall-E 2- und Midjourney-Bilder für ihre Arbeit wiederverwenden. Beide sind in der Lage, Hände zu erstellen, die als Ausschnitte oder in Composites für künstlerische, redaktionelle und kommerzielle Zwecke verwendet werden können. Es ist nur eine Frage der persönlichen Präferenz.
Die KI wird schließlich die Hände erobern
Generative Kunst-Apps wie Dall-E 2 und Midjourney haben einen langen Weg zurückgelegt in ihrer Fähigkeit, realistische und fantastische Kunst zu schaffen. Sie kämpfen immer noch mit dem Generieren von Händen, aber angesichts der Beschleunigung der generativen Technologie können wir nur in naher Zukunft mit Verbesserungen rechnen.