Im Gegensatz zu einer Textdatei können Sie ein PDF nicht direkt bearbeiten. Es gibt mehrere Möglichkeiten, PDF-Dateien mit Text zu generieren. Aber was ist, wenn Sie den umgekehrten Weg gehen und PDFs in Textdateien konvertieren möchten?

Glücklicherweise können Sie diese Dateien mit Linux einfach vom Terminal aus ändern. In diesem Artikel wird gezeigt, wie Sie eine PDF-Datei unter Linux in ein Textdokument konvertieren.

Konvertieren von PDF in Text über das Terminal

Poppler ist eine Softwarebibliothek zum Rendern und Ändern von PDF-Dateien. Es enthält ein Dienstprogramm, bekannt als pdftotext, mit dem Benutzer Textdateien aus PDFs generieren können. Schon seit poppler-utils nicht Teil der Standard-Linux-Pakete ist, müssen Sie es manuell mit einem Paketmanager installieren.

Unter Ubuntu und Debian:

sudo apt installieren poppler-utils

So installieren Sie Poppler unter Arch Linux:

sudo pacman -S poppler

Installation des poppler-utils Paket auf CentOS, Fedora und anderen RHEL-basierten Distributionen ist einfach.

instagram viewer
sudo dnf installiere poppler-utils
sudo yum installiere poppler-utils

Konvertieren einer gesamten PDF-Datei in Text

Die grundlegende Syntax des Befehls pdftotext lautet:

pdftotext [Optionen] pdffile Textdatei

...wo PDF Datei der absolute oder relative Pfad zur PDF-Datei ist und Textdatei ist der Name der Ausgabedatei.

Zum Beispiel umzuwandeln lorem-ipsum.pdf in eine Textdatei:

pdftotext lorem-ipsum.pdf text.txt

Wenn die zu konvertierende Datei Wasserzeichen oder nicht ausgerichteten Text enthält, können Sie diese in der Ausgabe verwerfen, indem Sie die -nodiag Flagge.

pdftotext -nodiag lorem-ipsum.pdf random.text

Seiten innerhalb eines bestimmten Bereichs verarbeiten

Verwenden Sie die -f und -l Flag, wenn Sie Seiten konvertieren möchten, die in einen bestimmten Bereich fallen. Zum Beispiel, um die Seiten eins bis fünf in convert zu konvertieren lorem-ipsum.pdf jemandem eine SMS schicken:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

So konvertieren Sie nur die erste Seite der PDF-Datei:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

Konvertieren Sie passwortgeschützte PDF-Dateien in Text

Pdftotext kann sogar passwortgeschützte PDFs in Textdateien umwandeln. Das -upw und -opw Fahnen, die stehen für Benutzer-Passwort und Besitzer-Passwort Achten Sie beim Konvertieren der PDF-Dateien jeweils auf den Authentifizierungsprozess.

pdftotext -upw Passwort lorem-ipsum.pdf output.txt
pdftotext -opw Passwort lorem-ipsum.pdf output.txt

Stellen Sie sicher, dass Sie ersetzen Passwort mit dem Passwort der PDF-Datei.

Sie können auch mehrere Flags kombinieren, um die gewünschte Ausgabe zu erhalten. So konvertieren Sie beispielsweise die Seiten eins bis drei einer passwortgeschützten PDF-Datei in Text:

pdftotext -f 1 -l 3 -upw Passwort lorem-ipsum.pdf output.txt

Verbunden: So konvertieren Sie eine PDF-Datei in Bilder unter Linux

PDF grafisch in eine Textdatei konvertieren

Wenn die Arbeit mit der Befehlszeile nicht Ihre Sache ist, können Sie PDFs mit grafischer Software wie Calibre in Textdateien konvertieren. Es ist eine E-Book-Verwaltungsanwendung, die Sie zum Anzeigen, Organisieren und, PDF-Dateien ändern auf Ihrem System.

Calibre ist in den offiziellen Linux-Distributions-Repositorys verfügbar und kann von jedem mit einem Paketmanager heruntergeladen werden.

So installieren Sie Calibre unter Ubuntu und Debian:

sudo apt install Calibre

Unter Arch-Linux:

sudo pacman -S Kaliber

Auf RHEL-basierten Distributionen wie CentOS und Fedora können Sie Calibre entweder mit DNF oder Yum herunterladen.

sudo dnf install kaliber
sudo yum install Calibre

So verwenden Sie Calibre zum Konvertieren von PDF-Dateien

Starten Sie Calibre nach der Installation auf Ihrem System mit dem Anwendungsmenü. Alternativ können Sie Calibre vom Terminal aus starten, indem Sie Folgendes eingeben:

Kaliber

So generieren Sie Textdateien mit PDF mit Calibre:

  1. Klick auf das Bücher hinzufügen Option aus dem Menü.
  2. Suchen Sie die PDF-Datei, die Sie konvertieren möchten, und wählen Sie sie aus.
  3. Markieren Sie die PDF-Datei im mittleren Bereich und wählen Sie Bücher konvertieren aus dem Menü.
  4. Von dem Ausgabeformat Dropdown, wählen Sie TXT.
  5. Klicken Sie abschließend auf OK weitermachen.

Calibre beginnt nun mit der Konvertierung der angegebenen PDF-Datei in ein Textdokument. Sie können den Status des Prozesses überprüfen, indem Sie auf das Arbeitsplätze Option, die sich unten rechts im Fenster befindet.

Arbeiten mit PDF-Dateien unter Linux

Wenn Sie ein Dokument mit jemandem teilen möchten, ist es am effizientesten, es vor dem Teilen in ein PDF zu konvertieren. Früher mussten Benutzer einen dedizierten PDF-Viewer auf ihrem System installieren, um PDF-Dateien anzuzeigen, aber jetzt verfügt fast jeder Browser über einen integrierten PDF-Viewer.

Sie können mehrere Anwendungen finden, die es einem Benutzer ermöglichen, PDF-Dateien einfach anzuzeigen und zu bearbeiten. Viele Linux-Installationen werden mit LibreOffice ausgeliefert, einer Office-Software-Suite, die als PDF-Editor verwendet werden kann.

Email
Die 5 besten Linux-PDF-Editoren, die Sie ausprobieren sollten

Müssen Sie eine PDF-Datei unter Linux bearbeiten? Diese Linux-PDF-Editoren sind kostenlos zu installieren und einfach zu bedienen.

Weiter lesen

Verwandte Themen
  • Linux
  • PDF
  • PDF-Editor
  • Linux
Über den Autor
Deepesh Sharma (63 veröffentlichte Artikel)

Deepesh ist Junior Editor für Linux bei MUO. Er schreibt seit über 3 Jahren Informationsinhalte im Internet. In seiner Freizeit schreibt er gerne, hört Musik und spielt Gitarre.

Mehr von Deepesh Sharma

Abonnieren Sie unseren Newsletter

Abonnieren Sie unseren Newsletter für technische Tipps, Rezensionen, kostenlose E-Books und exklusive Angebote!

Noch ein Schritt…!

Bitte bestätigen Sie Ihre E-Mail-Adresse in der E-Mail, die wir Ihnen gerade gesendet haben.

.