Vor über 70 Jahren, als künstliche Intelligenz konzipiert wurde, veröffentlichte Alan Turing einen Artikel, in dem beschrieben wurde, wie man sie identifiziert. Er wurde später als Turing-Test bekannt und wird seit Jahrzehnten zur Unterscheidung zwischen einem Menschen und einer KI eingesetzt.
Mit der Einführung fortschrittlicher KI-Chatbots wie ChatGPT und Google Bard wird es jedoch immer schwieriger zu erkennen, ob Sie mit einer KI sprechen. Es stellt sich die Frage; Ist der Turing-Test veraltet? Und wenn ja, welche Alternativen gibt es?
Ist der Turing-Test veraltet?
Um festzustellen, ob der Turing-Test veraltet ist, müssen Sie zunächst Folgendes tun verstehen, wie es funktioniert. Damit eine KI den Turing-Test besteht, muss sie einen menschlichen Vernehmer davon überzeugen, dass es sich um einen Menschen handelt. Aber es gibt einen Haken: Die KI wird zusammen mit einem Menschen bewertet und muss per Text antworten.
Stellen Sie sich das so vor; Wenn Sie der Vernehmer sind und zwei Teilnehmern online per Text Fragen stellen, einer von ihnen jedoch ein KI-Modell ist – würden Sie sie dann nach fünf Minuten unterscheiden? Bedenken Sie, dass das Ziel des Turing-Tests nicht darin besteht, das KI-Modell anhand der richtigen Antworten zu identifizieren, sondern zu bewerten, ob die KI wie ein Mensch denken oder sich verhalten kann.
Das Problem beim Turing-Testansatz, der nur menschenähnliche Reaktionen identifiziert, besteht darin, dass andere Faktoren nicht berücksichtigt werden. Zum Beispiel die Intelligenz des KI-Modells oder das Wissen des Vernehmers. Darüber hinaus beschränkt sich der Turing-Test nur auf Text und es wird immer schwieriger, eine KI zu identifizieren, die eine menschliche Stimme erzeugt oder Deepfake-Videos, die menschliches Verhalten nachahmen.
Allerdings sind die aktuellen KI-Modelle wie ChatGPT-4 und Google Bard noch nicht so weit fortgeschritten, dass sie den Turing-Test dauerhaft bestehen können. Wenn Sie sich mit KI auskennen, ist das sogar möglich Erkennen Sie KI-generierten Text.
Die 5 besten Turing-Test-Alternativen
Es ist möglich dass zukünftige KI-Modelle wie ChatGPT-5 könnte den Turing-Test bestehen. In diesem Fall benötigen wir verschiedene Tests in Kombination mit dem Turing-Test, um festzustellen, ob wir mit einer KI oder einem Menschen sprechen. Hier sind die besten Turing-Testalternativen:
1. Der Marcus-Test
Gary Marcus, ein renommierter Kognitionswissenschaftler und KI-Forscher, schlug eine Alternative zum Turing-Test vor, der im veröffentlicht wurde New-Yorker um die kognitiven Fähigkeiten einer KI zu identifizieren. Der Test ist einfach: Sie beurteilen ein KI-Modell anhand seiner Fähigkeit, YouTube-Videos und Fernsehsendungen ohne Untertitel oder Text anzusehen und zu verstehen. Damit die KI den Marcus-Test besteht, sollte sie beim Ansehen der Videos Sarkasmus, Humor, Ironie und die Handlung verstehen und wie ein Mensch erklären.
Im Augenblick, GPT-4 kann Bilder beschreiben, aber bisher gibt es noch kein KI-Modell, das Videos wie ein Mensch verstehen kann. Selbstfahrende Fahrzeuge kommen nahe heran, aber sie sind nicht völlig autonom und benötigen Sensoren, da sie nicht alles in ihrer Umgebung verstehen können.
2. Der visuelle Turing-Test
Laut einem am veröffentlichten Forschungsbericht PNASMit dem visuellen Turing-Test lässt sich mithilfe von Bildfragebögen feststellen, ob man mit einem Menschen oder einer KI spricht. Es funktioniert wie der Turing-Test, aber anstatt Fragen mit Texten zu beantworten, werden den Teilnehmern Bilder gezeigt und von ihnen wird erwartet, dass sie einfache Fragen beantworten und dabei wie ein Mensch denken. Allerdings ist die Der visuelle Turing-Test unterscheidet sich von CAPTCHAs Da alle Antworten richtig sind – aber um den Test zu bestehen, muss die KI die Bilder ähnlich wie ein Mensch verarbeiten.
Darüber hinaus hätte der Mensch die kognitive Fähigkeit, den Test zu bestehen, wenn einer KI und einem Menschen mehrere Bilder nebeneinander gezeigt würden und sie aufgefordert würden, realistische Bilder zu identifizieren. Dies liegt daran, dass es KI-Modellen schwer fällt, Bilder zu unterscheiden, die nicht so aussehen, als wären sie in der realen Welt aufgenommen worden. Tatsächlich ist das der Grund, warum Sie es können KI-generierte Bilder identifizieren Verwendung von Anomalien, die keinen Sinn ergeben.
3. Der Lovelace 2.0-Test
Die Theorie, dass ein Computer keine originellen Ideen entwickeln kann, die über das hinausgehen, wofür er programmiert wurde, wurde erstmals von Ada Lovelace vor dem Turing-Test konzipiert. Alan Turing widersprach dieser Theorie jedoch und argumentierte, dass KI Menschen immer noch überraschen kann. Erst 2001 wurden die Richtlinien für den Lovelace-Test entwickelt, um eine KI von einem Menschen zu unterscheiden – und laut dem thekurzweillibrary Die Regeln wurden später im Jahr 2014 überarbeitet.
Damit eine KI den Lovelace-Test besteht, muss sie nachweisen, dass sie originelle Ideen generieren kann, die über ihr Training hinausgehen. Aktuelle KI-Modelle wie GPT-4 sind nicht in der Lage, neue Erfindungen hervorzubringen, die über unser vorhandenes Wissen hinausgehen. Jedoch, Künstliche allgemeine Intelligenz kann diese Fähigkeit erreichen und den Lovelace-Test bestehen.
4. Reverse-Turing-Test
Wie wäre es mit dem Turing-Test, aber umgekehrt durchgeführt? Anstatt herauszufinden, ob Sie mit einem Menschen sprechen, ist das Ziel des umgekehrter Turing-Test besteht darin, die KI dazu zu verleiten, zu glauben, dass Sie eine KI sind. Allerdings benötigen Sie auch ein anderes KI-Modell, um dieselben Fragen per Text zu beantworten.
Wenn beispielsweise ChatGPT-4 der Vernehmer ist, könnten Sie Google Bard und einen anderen Menschen als Teilnehmer registrieren. Wenn das KI-Modell den menschlichen Teilnehmer anhand der Antworten korrekt identifizieren kann, hat es den Test bestanden.
Der Nachteil des umgekehrten Turing-Tests besteht darin, dass er unzuverlässig ist, insbesondere wenn man bedenkt, dass dies manchmal der Fall ist KI kann KI-generiertes nicht unterscheiden und von Menschen geschriebene Inhalte.
5. KI-Klassifizierungsrahmen
Gemäß dem von entwickelten KI-Klassifizierungsrahmen Chris Saad, der Turing-Test ist nur eine Bewertungsmethode, um herauszufinden, ob Sie mit einer KI sprechen. Genauer gesagt basiert das KI-Klassifizierungsrahmen auf der Theorie der multiplen Intelligenz, die erfordert, dass die menschliche Intelligenz mindestens acht verschiedene Kriterien erfüllt Dazu gehören: musikalischer Rhythmus, logisch-mathematische Intelligenz, visuelle Identifikation, emotionale Intelligenz, selbstreflexive Intelligenz, existenzielle Denkfähigkeit und Körper Bewegung.
Da die KI anhand von acht verschiedenen Parametern bewertet wird, ist es unwahrscheinlich, dass sie als Mensch durchgeht, selbst wenn sie in bestimmten Benchmarks überdurchschnittlich gut abschneidet. Zum Beispiel, ChatGPT kann mathematische Probleme lösen, Bilder beschreiben und sich in einer natürlichen Sprache wie ein Mensch unterhalten, aber andere Kategorien, die im KI-Klassifizierungsrahmen definiert sind, würden es nicht schaffen.
Der Turing-Test ist nicht schlüssig
Der Turing-Test sollte eher ein Gedankenexperiment als ein abschließender Test zur Unterscheidung zwischen Menschen und KI sein. Als es ursprünglich vorgeschlagen wurde, war es der entscheidende Maßstab für die Messung der Maschinenintelligenz.
Angesichts der jüngsten Entwicklung von KI-Modellen mit Sprach-, Seh- und Hörinteraktionsfähigkeiten greift der Turing-Test jedoch zu kurz, da er auf Textkonversationen beschränkt ist. Die effektivste Lösung wäre die Einführung von Turing-Testalternativen, die KI-Modelle weiter von Menschen unterscheiden.