Im Gegensatz zu einer Textdatei können Sie ein PDF nicht direkt bearbeiten. Es gibt mehrere Möglichkeiten, PDF-Dateien mit Text zu generieren. Aber was ist, wenn Sie den umgekehrten Weg gehen und PDFs in Textdateien konvertieren möchten?
Glücklicherweise können Sie diese Dateien mit Linux einfach vom Terminal aus ändern. In diesem Artikel wird gezeigt, wie Sie eine PDF-Datei unter Linux in ein Textdokument konvertieren.
Konvertieren von PDF in Text über das Terminal
Poppler ist eine Softwarebibliothek zum Rendern und Ändern von PDF-Dateien. Es enthält ein Dienstprogramm, bekannt als pdftotext, mit dem Benutzer Textdateien aus PDFs generieren können. Schon seit poppler-utils nicht Teil der Standard-Linux-Pakete ist, müssen Sie es manuell mit einem Paketmanager installieren.
Unter Ubuntu und Debian:
sudo apt installieren poppler-utils
So installieren Sie Poppler unter Arch Linux:
sudo pacman -S poppler
Installation des poppler-utils Paket auf CentOS, Fedora und anderen RHEL-basierten Distributionen ist einfach.
sudo dnf installiere poppler-utils
sudo yum installiere poppler-utils
Konvertieren einer gesamten PDF-Datei in Text
Die grundlegende Syntax des Befehls pdftotext lautet:
pdftotext [Optionen] pdffile Textdatei
...wo PDF Datei der absolute oder relative Pfad zur PDF-Datei ist und Textdatei ist der Name der Ausgabedatei.
Zum Beispiel umzuwandeln lorem-ipsum.pdf in eine Textdatei:
pdftotext lorem-ipsum.pdf text.txt
Wenn die zu konvertierende Datei Wasserzeichen oder nicht ausgerichteten Text enthält, können Sie diese in der Ausgabe verwerfen, indem Sie die -nodiag Flagge.
pdftotext -nodiag lorem-ipsum.pdf random.text
Seiten innerhalb eines bestimmten Bereichs verarbeiten
Verwenden Sie die -f und -l Flag, wenn Sie Seiten konvertieren möchten, die in einen bestimmten Bereich fallen. Zum Beispiel, um die Seiten eins bis fünf in convert zu konvertieren lorem-ipsum.pdf jemandem eine SMS schicken:
pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt
So konvertieren Sie nur die erste Seite der PDF-Datei:
pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt
Konvertieren Sie passwortgeschützte PDF-Dateien in Text
Pdftotext kann sogar passwortgeschützte PDFs in Textdateien umwandeln. Das -upw und -opw Fahnen, die stehen für Benutzer-Passwort und Besitzer-Passwort Achten Sie beim Konvertieren der PDF-Dateien jeweils auf den Authentifizierungsprozess.
pdftotext -upw Passwort lorem-ipsum.pdf output.txt
pdftotext -opw Passwort lorem-ipsum.pdf output.txt
Stellen Sie sicher, dass Sie ersetzen Passwort mit dem Passwort der PDF-Datei.
Sie können auch mehrere Flags kombinieren, um die gewünschte Ausgabe zu erhalten. So konvertieren Sie beispielsweise die Seiten eins bis drei einer passwortgeschützten PDF-Datei in Text:
pdftotext -f 1 -l 3 -upw Passwort lorem-ipsum.pdf output.txt
Verbunden: So konvertieren Sie eine PDF-Datei in Bilder unter Linux
PDF grafisch in eine Textdatei konvertieren
Wenn die Arbeit mit der Befehlszeile nicht Ihre Sache ist, können Sie PDFs mit grafischer Software wie Calibre in Textdateien konvertieren. Es ist eine E-Book-Verwaltungsanwendung, die Sie zum Anzeigen, Organisieren und, PDF-Dateien ändern auf Ihrem System.
Calibre ist in den offiziellen Linux-Distributions-Repositorys verfügbar und kann von jedem mit einem Paketmanager heruntergeladen werden.
So installieren Sie Calibre unter Ubuntu und Debian:
sudo apt install Calibre
Unter Arch-Linux:
sudo pacman -S Kaliber
Auf RHEL-basierten Distributionen wie CentOS und Fedora können Sie Calibre entweder mit DNF oder Yum herunterladen.
sudo dnf install kaliber
sudo yum install Calibre
So verwenden Sie Calibre zum Konvertieren von PDF-Dateien
Starten Sie Calibre nach der Installation auf Ihrem System mit dem Anwendungsmenü. Alternativ können Sie Calibre vom Terminal aus starten, indem Sie Folgendes eingeben:
Kaliber
So generieren Sie Textdateien mit PDF mit Calibre:
- Klick auf das Bücher hinzufügen Option aus dem Menü.
- Suchen Sie die PDF-Datei, die Sie konvertieren möchten, und wählen Sie sie aus.
- Markieren Sie die PDF-Datei im mittleren Bereich und wählen Sie Bücher konvertieren aus dem Menü.
- Von dem Ausgabeformat Dropdown, wählen Sie TXT.
- Klicken Sie abschließend auf OK weitermachen.
Calibre beginnt nun mit der Konvertierung der angegebenen PDF-Datei in ein Textdokument. Sie können den Status des Prozesses überprüfen, indem Sie auf das Arbeitsplätze Option, die sich unten rechts im Fenster befindet.
Arbeiten mit PDF-Dateien unter Linux
Wenn Sie ein Dokument mit jemandem teilen möchten, ist es am effizientesten, es vor dem Teilen in ein PDF zu konvertieren. Früher mussten Benutzer einen dedizierten PDF-Viewer auf ihrem System installieren, um PDF-Dateien anzuzeigen, aber jetzt verfügt fast jeder Browser über einen integrierten PDF-Viewer.
Sie können mehrere Anwendungen finden, die es einem Benutzer ermöglichen, PDF-Dateien einfach anzuzeigen und zu bearbeiten. Viele Linux-Installationen werden mit LibreOffice ausgeliefert, einer Office-Software-Suite, die als PDF-Editor verwendet werden kann.
Müssen Sie eine PDF-Datei unter Linux bearbeiten? Diese Linux-PDF-Editoren sind kostenlos zu installieren und einfach zu bedienen.
Weiter lesen
- Linux
- PDF-Editor
- Linux

Deepesh ist Junior Editor für Linux bei MUO. Er schreibt seit über 3 Jahren Informationsinhalte im Internet. In seiner Freizeit schreibt er gerne, hört Musik und spielt Gitarre.
Abonnieren Sie unseren Newsletter
Abonnieren Sie unseren Newsletter für technische Tipps, Rezensionen, kostenlose E-Books und exklusive Angebote!
Noch ein Schritt…!
Bitte bestätigen Sie Ihre E-Mail-Adresse in der E-Mail, die wir Ihnen gerade gesendet haben.