Wenn Sie Student sind oder bei Ihrer Arbeit mit vielen Bildern und PDFs arbeiten, haben Sie irgendwann das Bedürfnis verspürt, Text aus einem Bild oder einem Dokument zu extrahieren.
Glücklicherweise macht die Textextraktion dies möglich. Und es gibt mehrere Tools, mit denen Sie dies tun können. gImageReader ist eines der vielen Tools. Es ist kostenlos und funktioniert sowohl mit Bilddateien als auch mit PDF-Dokumenten.
Lassen Sie uns eintauchen, um gImageReader im Detail zu testen und zu sehen, wie Sie damit Text aus Bildern und PDFs extrahieren können.
Was ist gImageReader?
gImageReader ist eine App, mit der Sie unter Linux Text aus Bildern und PDFs extrahieren können. Es ist im Wesentlichen eine GUI oder ein Front-End für die Tesseract OCR-Engine, ein Open Source von Hewlett-Packard entwickelte Engine, die als eine der besten verfügbaren OCR-Engines gilt.
Mit gImageReader können Sie mit ein paar einfachen Klicks einfach und ziemlich genau Text aus Bildern oder PDF-Dokumenten extrahieren. Anschließend können Sie den extrahierten Text zur weiteren Verwendung in eine Text- oder PDF-Datei exportieren.
Funktionen von gImageReader
gImageReader enthält die folgenden Funktionen:
- Importieren Sie PDF-Dokumente und Bilder aus verschiedenen Quellen (Festplatte, Scangeräte, Zwischenablage und Screenshot)
- Bilder oder Dokumente stapelweise verarbeiten, d. h. Text aus mehreren Bildern oder Dokumenten gleichzeitig extrahieren
- Erkennen Sie Textausschnitte als einfachen Text oder hOCR-Dokumente
- Eingebaute Rechtschreibprüfung
- Automatische Textbereichserkennung
- Grundlegende Bild-/Dokumentbearbeitung
- Ausgabe als Textdatei speichern
So installieren Sie gImageReader unter Linux
gImageReader ist verfügbar unter die meisten großen Linux-Distributionen. Bevor Sie jedoch mit der Installation fortfahren, müssen Sie die Tesseract OCR-Engine auf Ihrem System installieren.
Öffnen Sie dazu die Software-Manager auf Ihrem System und suchen Sie nach Tesseract. Wenn eine Ergebnisliste zurückgegeben wird, installieren Sie die tesserakt-ocr und tesserakt-ocr-eng Pakete. Sie können auch Befehlszeilen-Paketmanager verwenden, um das Paket zu installieren, wenn Sie mit dem Terminal vertrauter sind.
Sehen Sie sich danach die Installationsanweisungen in den folgenden Abschnitten an, um gImageReader auf Ihrem Computer zu installieren.
Wenn Sie Debian oder Ubuntu verwenden, öffnen Sie das Terminal und führen Sie die folgenden Befehle aus, um gImageReader zu installieren:
sudo add-apt-repository ppa: sandromani/gimagereader
sudo apt-erhalten aktualisieren
sudo apt Installieren gimagereader
Unter Fedora, CentOS oder Red Hat Enterprise Linux (RHEL):
sudo dnf Installieren gimagereader-qt
An Arch-Linux oder Manjaro:
sudo pacman -S gimagereader
openSUSE-Benutzer können gImageReader installieren mit:
sudo zypper Installieren gimagereader
Falls Sie eine andere Linux-Distribution verwenden, können Sie gImageReader aus der Quelle erstellen, indem Sie den Anweisungen unter folgen GitHub von gImageReader.
So verwenden Sie gImageReader unter Linux
gImageReader ist ziemlich einfach zu bedienen und funktioniert mit allen Arten von Bilddateien sowie PDF-Dokumenten. Befolgen Sie die nachstehenden Anweisungen, um unter Linux Text aus Bildern oder PDFs zu extrahieren.
Öffnen Sie das Anwendungsmenü, suchen Sie nach gImageReader, und starten Sie die App. Schlagen Sie die Maximieren Schaltfläche im gImageReader-Fenster, um es in der Vollbildansicht zu öffnen.
Klicken Sie nun auf die Füge Bilder hinzu Schaltfläche im linken Bereich unter der Symbolleiste und verwenden Sie den Dateibrowser, um die Bilder oder PDF-Dateien auszuwählen, aus denen Sie Text extrahieren möchten.
Klicken OK um das/die Bild(er) oder PDF(s) in gImageReader zu importieren. Oder, wenn Sie Text aus dem, was auf dem Bildschirm angezeigt wird, extrahieren möchten, klicken Sie auf das Dropdown-Menü neben dem Füge Bilder hinzu drücken und auswählen Einen Screenshot machen. gImageReader erstellt einen Screenshot des Bildschirminhalts.
Nachdem Sie das Bild zu gImageReader hinzugefügt haben, klicken Sie auf die Ausgabebereich umschalten Schaltfläche (eine mit dem Notizblock-Symbol), um das Ausgabefenster aufzurufen. Hier erscheint der Text, den Sie aus Bildern oder PDFs extrahieren.
Je nachdem, wie Sie vorgehen möchten, haben Sie nun die Möglichkeit, den Text im Bild oder PDF automatisch oder manuell zu identifizieren. Um dies automatisch zu tun, klicken Sie auf das Layout automatisch erkennen Schaltfläche, und es werden alle Textblöcke im ausgewählten Bild oder PDF-Dokument hervorgehoben.
Tippen Sie danach auf Auswahl erkennen > Aktuelle Seite um den Textextraktionsprozess zu starten.
Um den Text alternativ manuell auszuwählen, bewegen Sie den Mauszeiger über den Text, den Sie extrahieren möchten, und ziehen Sie mit dem Fadenkreuz einen Rahmen um den Bereich, aus dem Sie den Text extrahieren möchten. Dann drücken Sie die Auswahl erkennen Schaltfläche, um fortzufahren.
Wenn es sich um ein PDF-Dokument handelt und Sie Text aus verschiedenen Seiten extrahieren möchten, tippen Sie auf Plus (+)-Taste, um die Seiten umzublättern.
Um zurückzugehen, drücken Sie die Minus (-) Taste. Wählen Sie dann den Text aus, den Sie extrahieren möchten, und klicken Sie auf Auswahl erkennen Taste, um es zu extrahieren.
Obwohl selten, kann es vorkommen, dass gImageReader den extrahierten Text in einer anderen Sprache als Englisch zurückgibt. Tippen Sie in diesem Fall einfach auf die Dropdown-Schaltfläche daneben Auswahl erkennen -Taste und wählen Sie eine der englischen Optionen aus.
Um den extrahierten Text zu speichern, klicken Sie abschließend auf Ausgabe speichern Taste. Dies öffnet das Speichern-Fenster. Geben Sie hier der Datei einen Namen und klicken Sie auf OK.
Was können Sie sonst noch mit gImageReader tun?
Wie bereits erwähnt, gibt Ihnen gImageReader auch die Möglichkeit, bestimmte Aspekte der importierten Bilder oder Dokumente zu ändern, wie Helligkeit, Kontrast und Auflösung. Darüber hinaus können Sie bei Bedarf auch Farben invertieren oder die Bilder oder Dokumente drehen.
Die meisten dieser Optionen können sich als nützlich erweisen, wenn der Text in einem Bild oder Dokument für gImageReader nicht lesbar ist und das Tool daher daran hindert, den Text zu erkennen.
Um auf eine dieser Bearbeitungsoptionen zuzugreifen, klicken Sie auf Bildsteuerung Schaltfläche, und es wird eine Minisymbolleiste unter der Hauptsymbolleiste angezeigt. Wählen Sie hier die entsprechenden Schaltflächen aus, um den gewünschten Bearbeitungsvorgang am Bild oder Dokument durchzuführen.
Textextraktion unter Linux leicht gemacht mit gImageReader
Die Textextraktion erfordert oft das richtige Tool: eines, das eine zuverlässige und genaue OCR-Engine verwendet, die ermöglicht es, Text in einem Bild oder Dokument effektiv zu identifizieren, sodass Sie ihn effizient ohne ihn extrahieren können Ärger.
gImageReader erreicht dies dank der Tesseract OCR-Engine, die es im Hintergrund verwendet, gut. In Anbetracht seiner Benutzerfreundlichkeit ist gImageReader zweifellos eines der besten Tools zur Textextraktion, die für Linux verfügbar sind.
Wenn Sie nach einer einfacheren Lösung suchen, können Sie alternativ TextSnatcher ausprobieren, das schnell und ziemlich einfach zu bedienen ist.