Hörbücher erfreuen sich gegenüber herkömmlichen eBooks immer größerer Beliebtheit. Sie sind bequemer, da Sie sie jederzeit und überall anhören können.

Sie können ein eBook-PDF mit einem einfachen Python-Skript in ein Hörbuch konvertieren. Mit einigen einfachen Bibliotheken können Sie ein Projekt entwickeln, das ein PDF ausliest und das Hörbuch als neue Datei speichert.

Erforderliche Pakete installieren

Sie müssen die installieren PyPDF3, pyttsx3, und pdfKlempner Pakete, um loszulegen. Sie können diese Pakete mit dem Pip-Paketmanager installieren. Stellen Sie sicher, dass Sie dies bereits getan haben Pip auf Ihrem System installiert. Führen Sie den folgenden Befehl in der Eingabeaufforderung aus, um die Pakete zu installieren:

Pip Installieren PyPDF3 pyttsx3 pdfplumber
  • Du kannst den... benutzen PyPDF3 Bibliothek zum Lesen und Bearbeiten von PDF-Dateien in Python.
  • Das pyttsx3 Bibliothek bietet Text-zu-Sprache-Konvertierung.
  • pdfKlempner ist eine Bibliothek, mit der Sie Text und Tabellen aus PDF-Dateien extrahieren können.
instagram viewer

Der in diesem Projekt verwendete Code ist in a GitHub-Repository und steht Ihnen unter der MIT-Lizenz kostenlos zur Verfügung.

Konvertieren einer PDF-Datei in ein Hörbuch mit Python

Sobald Sie die obigen Pakete installiert haben, können Sie sie in Ihre Python-Datei importieren:

importieren PyPDF3
importieren pyttsx3
importieren pdfKlempner

Sie müssen den Namen und Speicherort der PDF-Datei angeben, die Sie konvertieren möchten. Der Einfachheit halber können Sie eine beliebige PDF-Beispieldatei verwenden. Kopieren Sie es in dasselbe Verzeichnis wie Ihr Skript und speichern Sie seinen Namen in einer Variablen. wenn es heißt Lorem.pdf, zum Beispiel:

Datei = 'Lorem.pdf'

Erstellen Sie als Nächstes ein Dateiobjekt für die PDF-Datei und ein PDF-Reader-Objekt:

Buch = öffnen (Datei, 'rb')
pdfReader = PyPDF3.PdfFileReader (Buch)

Später durchlaufen Sie alle Seiten der PDF-Datei. Um die Gesamtzahl der Seiten zu ermitteln, verwenden Sie die AnzahlSeiten Eigentum:

Seiten = pdfReader.numSeiten

Jetzt können Sie den Text aus der PDF-Datei extrahieren:

finalText = ""

mit pdfinstallateur.open(Datei) wie pdf:
für i im Bereich (0, Seiten):
page = pdf.seiten[i]
text = seite.extract_text()
finalText += Text

Verwenden Sie eine for-Schleife, um alle Seiten zu durchlaufen und den Text aus der PDF-Datei zu extrahieren. Sie können das pdfplumber-Paket verwenden, um die PDF-Datei und die extrahieren_text Methode zum Abrufen von Text von einer Seite.

Da der Volltext in einer Variablen gespeichert ist, können Sie ihn je nach Bedarf weiterverarbeiten. Wenn Sie den Text in Audio umwandeln und in einer neuen Datei speichern möchten, verwenden Sie den folgenden Code:

engine = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
Motor.runAndWait()

Wenn du Führen Sie diesen Python-Code aus, wird eine Hörbuchdatei in seinem Verzeichnis erstellt.

Wenn Sie das Hörbuch nicht speichern und beispielsweise die PDF-Datei vortragen möchten, können Sie stattdessen den folgenden Code verwenden:

engine = pyttsx3.init()
Motor.sagen(finalText)
Motor.runAndWait()

Wenn Sie dieses Skript ausführen, wird es die PDF-Datei vorlesen.

Entwickeln Sie Projekte mit Python

Python ist bekannt für seine Vielseitigkeit. Mit Python können Sie ganz einfach Projekte mit praktischen Anwendungen erstellen.

Wenn Sie sich mit Python-Code die Hände schmutzig machen möchten, können Sie mit der Entwicklung von Miniprojekten beginnen. Einige gute Startideen sind eine Quiz-App, ein Chatbot, ein Snake-Spiel, ein URL-Shortener, ein Web-Scraper oder ein Einheitenumrechner.