Werbung
Kürzlich arbeitete ich an einer Geschichte mit einer Person, die einen Anruf tätigte, die aufgezeichnet wurde. Diese Person weigerte sich später zuzugeben, dass sie jemals überhaupt angerufen hatte.
Mit der aufgezeichneten Stimme aus dem Telefonanruf und einem Clip der Person, die den Vorwurf bestritt, machte ich mich an die Arbeit, um einen Weg zu finden, um zu beweisen, dass die Stimmen ein und dieselbe waren.
Ich gebe zu, dass ich ein bisschen von Sprachtechnologien besessen bin. Deshalb habe ich gewartet Google Voice So verwenden Sie Google Voice zum Bloggen über das Telefon Weiterlesen mit seiner Spracherkennungstechnologie weiterentwickelt zu werden, und deshalb liebe ich PC-Sprachsteuerungs-Apps wie Tazti Aktivieren Sie die Sprach- und Textsteuerung, indem Sie die Spracherkennung in Windows einrichtenDie Spracherkennung bleibt leistungsfähiger als Cortana. Es steuert die Sprach-, Text- und Sprachsteuerung. Dieser Artikel zeigt Ihnen, was die Spracherkennung tun kann, wie Sie sie einrichten, trainieren und verwenden. Weiterlesen
. Wenn es jedoch darum geht, Stimmen digital zu vergleichen, war ich ratlos. Sie haben wahrscheinlich Spionagefilme gesehen, in denen der Computer die Stimme eines bekannten Verbrechers automatisch nur mit dem Stimmabdruck identifizieren kann.Um ehrlich zu sein, als ich Sonogram Visible Speech entdeckte, wurde mir klar, dass die Spektrogramm-Sprachtechnologie tatsächlich funktioniert ist Derzeit ist dies eine praktikable Möglichkeit, eine Person allein anhand ihrer Stimme eindeutig zu identifizieren.
Spektrogramm verstehen
Wenn Sie sich mit chemischen Isotopen auskennen, wissen Sie, dass Chemiker mit Isotopen die chemische Zusammensetzung von Isotopen identifizieren können Verbindungen durch Isolieren der Grundelemente und Verwenden der Aufschlüsselung, um die einzelnen Komponenten von irgendwelchen zu identifizieren Mischung. In ähnlicher Weise zerlegt ein Audio-Spektrogramm Audio-Sound in Grundfrequenzen. Das Interessante an der menschlichen Stimme ist, dass niemand in einer Frequenz spricht. Ihr Mund, Ihre Nasenwege und die Struktur Ihrer Sprachbox bestimmen die Mischung der Frequenzen, aus denen Ihre etwas einzigartige Stimme besteht.
Sonogram Visible Speech ist eine kostenlose Spektrogramm-Softwareanwendung, mit der Video- oder Audiodateien aufgenommen und unterbrochen werden können die Audiospur in das gesamte Spektrum hinunter - alle Frequenzen während des gesamten Zeitrahmens des Spur. Ein fertiges Spektrogramm sieht wie im Bild unten aus.

Wie Sie sehen können, sieht die untere Spur wie die grundlegende Schallwelle aus, die Sie in einem Programm wie diesem sehen würden Kühnheit 3 Kühnheitstipps zur Verbesserung Ihrer aufgezeichneten InterviewsKlares Audio ist für jeden Podcast oder jede Aufnahme, die Sie veröffentlichen möchten, von entscheidender Bedeutung. Steigern Sie Ihre Audioqualität mit Audacity in drei einfachen Schritten. Weiterlesen Im mittleren Bereich wird jedoch jedes Segment der Audiodatei in seinem gesamten Frequenzlayout angezeigt. Das Erstaunliche an dieser Software ist, dass es viele andere Wellenformen gibt, mit denen Sie Ihre Sounddatei untersuchen können. Diese sind speziell für fortgeschrittene Benutzer.

Sie können konfigurieren, wie jede dieser Wellenformen angezeigt wird, indem Sie im Menü „Optionen“ die Option „Allgemein“ auswählen Einstellung." Hier können Sie definieren, wie die logarithmischen Diagramme die Ausgabe berechnen, und den allgemeinen Anzeigeaufbau aller verfügbaren Diagramme.

Wenn der Ton ziemlich leise ist oder die Stimme, die Sie analysieren, ein Flüstern ist, sollten Sie die logarithmische Frequenzanzeige verwenden. Sie aktivieren es über das Menü "Optionen" und wählen "Logarithmische Frequenz". Dadurch werden die signifikanten Frequenzbereiche im Spektrogramm etwas "vergrößert".

Dies kann wirklich dazu beitragen, klare Frequenzmuster zu identifizieren, die jemanden anhand des Klangs seiner Stimme identifizieren. Wenn Sie völlig verloren sind und nicht wissen, wo Sie anfangen sollen, wird durch Klicken auf "Hilfe" und "Online-Hilfe" das sehr gut geschriebene Handbuch zur Sonogram Online-Hilfe geöffnet. Dies ist ein guter Ausgangspunkt, wenn Sie mit der Spektrogramm-Audioanalyse noch nicht vertraut sind.

Ein Experiment mit Spektrogrammen mit Ghost Hunting
Das Schöne an dieser Software ist, dass sie für viele verschiedene Zwecke geeignet ist. Eines der Artefakte, die bei der Geisterjagd häufig auftauchen, ist mein persönliches Interesse "Elektronisches Sprachphänomen" - wo die Stimme einer Erscheinung oder eines Geistes angeblich auf Audio erscheint Aufnahmen. Diese Aufnahmen sind über das gesamte Web verteilt, daher habe ich beschlossen, einige der Ghost Hunter-Websites zu entfernen und eine Spektrogrammanalyse durchzuführen.

Das Spektrogramm zeigt, dass die Frequenzen der Stimme im Allgemeinen niedrig sind. Um jedoch ein besseres Bild der Stimmen in der Aufnahme zu erhalten, müssen Sie die zusätzlichen Wellenformen öffnen. Die Autokorrelationsansicht berechnet die Tonhöhe in dem Zeitraum, in dem Sie den Mauszeiger bewegen.

Der "Geist" hat eine durchschnittliche Tonhöhenfrequenz von etwa 129,0 Hz. Scrollen Sie zum Ende der Aufnahme, wo Sie die Stimme des Ermittlers hören, die berechnete Tonhöhe Die Frequenz liegt bei etwa 208,0 Hz (was sinnvoll ist, da es sich um eine weibliche Stimme handelt und die Geisteraufnahme klingt männlich.)

Durch Öffnen des Fast Fourier-Displays werden noch detailliertere Informationen zu den Stimmen angezeigt. In dieser Tabelle werden die Primärfrequenzen schnell aufgeschlüsselt und in einem Farbcode angezeigt.

In diesem Fall ist die Aufteilung der Frequenzen getrennt, wobei einige hohe, aber auch eine gute Anzahl niedriger Frequenzen in der Mischung enthalten sind. Der Ermittler im Raum spricht jedoch eindeutig mit einer Stimme, deren Frequenz mehr zum oberen Ende des Bereichs hin gruppiert ist, wie hier gezeigt.

Diese schnelle Analyse hat gezeigt, dass die beiden Stimmen sehr unterschiedlich sind, aber dies ist nur ein grundlegendes Beispiel für die Fähigkeiten dieser leistungsstarken Software. Grundsätzlich jede Situation, in der eine Aufteilung der Frequenzen einer Schallwelle hilfreich sein kann - dies ist die Software für Sie. Es ist leicht zu erlernen, schnell einzurichten und zu konfigurieren und funktioniert genauso gut oder besser als jede kostenpflichtige Spektrogrammsoftware auf dem Markt.
Haben Sie Projekte, die ein Spektrogramm verwenden könnten? Haben Sie schon einmal Sonogram Visible Speech ausprobiert? Teilen Sie Ihre Erkenntnisse in den Kommentaren unten.
Ryan hat einen BSc-Abschluss in Elektrotechnik. Er hat 13 Jahre in der Automatisierungstechnik, 5 Jahre in der IT gearbeitet und ist jetzt Apps Engineer. Als ehemaliger Managing Editor von MakeUseOf sprach er auf nationalen Konferenzen zur Datenvisualisierung und wurde im nationalen Fernsehen und Radio vorgestellt.