Werbung
Wenn Sie gedruckten Text in digitalen Text konvertieren möchten, den Sie kopieren, einfügen, bearbeiten und suchen können, müssen Sie OCR-Scanner (Optical Character Recognition) verwenden.
Wenn Sie ein Dokument scannen oder fotografieren, wird dieses in einem Format wie JPEG oder PDF gespeichert. OCR-Software kann dann die Buchstaben und Zahlen in diesen Dokumenten erkennen und in a umwandeln durchsuchbares PDF 4 Methoden zum kostenlosen Erstellen und Bearbeiten von PDF-DateienVon allen in unserer Computerwelt gebräuchlichen Dateitypen ist PDF wahrscheinlich einer der restriktivsten und gleichzeitig für alle verfügbar (hauptsächlich zum Lesen) ... Weiterlesen oder in eine Datei, die Sie in Programmen wie Microsoft Word bearbeiten können.
Das Problem ist, dass einige OCR-Scanner viel besser funktionieren als andere, wobei die besten die Brieftasche ziemlich stark belasten.
Omnipage18 kostet zum Beispiel 150 US-Dollar, ist aber besonders gut darin, verschiedene Sprachen zu erkennen. Adobe Acrobat Pro DC
kostet 400 US-Dollar, hat aber eine unglaubliche Genauigkeit. ABBYY FineReader kostet 150 US-Dollar, ist aber fantastisch darin, Dokumente wie Zeitschriften und Broschüren in durchsuchbaren Text umzuwandeln. Wir werden das Online-Angebot von ABBYY später in diesem Artikel testen.Wenn Sie jedoch nach kostenlosen Alternativen suchen, die Sie können herunterladen und unter Windows oder OS X verwenden, sollten Sie Probieren Sie diese OCR-Tools aus Die 5 besten OCR-Tools zum Extrahieren von Text aus BildernWie können Sie bei Unmengen von Papier den gesamten gedruckten Text in etwas konvertieren, das ein digitales Programm erkennen und indizieren kann? Halten Sie eine gute OCR-Software in Ihrer Nähe. Weiterlesen . Wenn Sie jedoch lieber eine kostenlose verwenden möchten, online Lesen Sie das OCR-Tool weiter, während wir die ersten mit den folgenden Ergebnissen ausprobiert haben.
Der Test
Scheint, als würden die meisten Leute jetzt ihre benutzen Smartphones, um nach ihnen zu suchen Scannen und verwalten Sie Ihre Belege, sparen Sie Platz, Papier und ZeitPapierbelege gehen leicht verloren und sind schwer zu finden, wenn Sie sie am dringendsten benötigen. Glücklicherweise löst die Digitalisierung diese beiden Probleme. Weiterlesen Ich entschied mich zu verwenden Die scannbare App von Evernote (Kostenlos für iOS und Android). Ich habe die erste Seite von Richard Dawkin gescannt Bergsteigen unwahrscheinlich, um zu sehen, welche Ergebnisse wir mit einer sehr einfachen Formatierung erzielen können. Ich habe auch eine Seite von Tim Ferriss gescannt. Der 4-Stunden-Koch um die Scanner mit etwas komplizierterer Formatierung auszuprobieren. Ich habe jede dieser Dateien als PDF gespeichert.
Diese Dokumente wurden dann durch einige der angeblich besten Online-OCR-Tools geführt, um festzustellen, wie gut sie abschnitten.
Kostenlose Online-OCR [nicht mehr verfügbar]
Glücklicherweise ist keine Registrierung erforderlich, um Free Online OCR zu verwenden. Und ich war doppelt beeindruckt, als ich ihren Anspruch sah, die Formatierung und das Layout meines Dokuments beizubehalten.
Die Site behauptet, PDF, GIF, BMP, JPEG, TIFF und PNG als Eingabe unterstützen zu können. Die Ausgaben können entweder DOC, ein PDF-Textdokument, RTF und TXT sein. Leider konnte ich nicht herausfinden, ob die Dateigröße begrenzt war.
Basisdokument zu PDF
Absolut perfekt konvertiert. Es gibt nicht viel mehr zu sagen! Wir gehen zu einem sehr guter Start.
Basisdokument zu DOC
Die eigentlichen Worte scheinen sich einwandfrei umgewandelt zu haben, abgesehen von dem "Ount" von "Mount Rushmore", das irgendwie AWOL wird. Die Formatierung ist jedoch eine andere Geschichte. Viele Kommas wurden durch Unterstriche ersetzt, und an Stellen im gesamten Dokument wurden zufällige Leerzeichen eingefügt. Wenn Sie später sehen, wie sich die Premium-Software in diesem Test entwickelt hat, ist dies keine schlechte Anstrengung überhaupt.
Komplexes Dokument in PDF
Das Konvertieren des Dokuments dauerte satte 120 Sekunden! Nach Abschluss des Vorgangs wurde der gesamte Text mit einer Genauigkeit von etwa 95% konvertiert, obwohl der Text im separaten Feld oben rechts auf der Seite nicht durchsuchbar war. Einige andere Zeichen im gesamten PDF waren ebenfalls falsch.
Komplexes Dokument zu DOC
Diesmal dauerte die Konvertierung nur 10 Sekunden, und der Text wurde erneut mit einer Genauigkeit von etwa 95% konvertiert. Es gab einige seltsame Abstandsprobleme, und die Software hatte Probleme beim Konvertieren der Schriftart oben rechts im Dokument und verpasste hier und da einige Zeichen.
Urteil
Wenn Sie einfach formatierte Dokumente in PDF konvertieren möchten, ist dies ein fantastisches Tool. In Bezug auf die Konvertierung in DOC waren die Ergebnisse nichts, worüber man nach Hause schreiben konnte.
i2OCR macht einige beeindruckende Ansprüche. Das Tool erkennt über 60 Sprachen, kann mehrspaltige Layouts verarbeiten (durch Entfernen der Formatierung), hat keine Dateigrößenbeschränkungen und kann hochgeladene Dateien konvertieren und von URLs. Sie müssen sich auch nicht registrieren, um dieses Tool verwenden zu können.
Der Dienst extrahiert einfach den Text aus Ihrem Bild und gibt dann unformatierten Text aus. Sie können Fehler in der Nebeneinanderansicht schnell korrigieren, bevor Sie den Text in andere Programme kopieren oder als DOC, PDF oder HTML herunterladen.
Hinweis: Als ich versuchte, meine PDF-Dokumente hochzuladen, wurden diese von i2OCR abgelehnt. Daher musste ich diese in JPEG konvertieren (indem ich einen Screenshot davon machte und dann die Dateien hochlud).
Basisdokument zum einfachen Text
Aufgrund der Funktionsweise dieses Tools geht die gesamte Formatierung verloren, obwohl die Konvertierung von Bild zu Text nahezu perfekt war. Es gab einige kleine Fehler wie den Absatzabstand und einige Kommas wurden durch Punkte ersetzt, aber dies sind kleine Fehler.
Komplexes Dokument zu einfachem Text
Der Großteil des Textes wurde ohne zu viele Fehler konvertiert, abgesehen vom Titel und dem Rezept oben rechts, das für dieses Tool nicht lesbar war. Die Art und Weise, wie die Spalten in einfachen Text umgewandelt wurden, war alles andere als ideal. Wenn Sie diese Konvertierung funktionsfähig machen möchten, wird viel Zeit benötigt, um die Zeilen in zusammenhängende Sätze umzuordnen.
Urteil
Für grundlegende Dokumente funktioniert i2OCR hervorragend. Die Möglichkeit, den Text vor dem Herunterladen zu bearbeiten, ist ebenfalls eine sehr nette Geste. Bei komplexeren Dokumenten ist die Konvertierung zwar immer noch ziemlich genau, aber die Art und Weise, wie der Text ausgegeben wird, erleichtert Ihnen das Leben nicht wesentlich.
Online OCR unterstützt derzeit 46 verschiedene Sprachen und kann PDF, JPG, BMP, TIFF und GIF in das Word-, Excel- oder Nur-Text-Format konvertieren. Die Site behauptet, "konvertierte Dokumente sehen genauso aus wie das Original - Tabellen, Spalten und Grafiken".
Mit der Version, die Sie ohne Registrierung verwenden können, können Sie bis zu 15 Bilder pro Stunde konvertieren (maximal 5 MB). Wenn Sie sich für ein Konto anmelden, können Sie zusätzlich zu diesem Limit weitere Seiten erwerben und gleichzeitig mehrseitige Dokumente und ZIP-Archive konvertieren.
Basisdokument zu DOC
Das Basisdokument wurde bis auf die römische Ziffer einwandfrei konvertiert ich nicht abgeholt werden. Wie die Site versprochen hatte, war die Formatierung genau so, wie sie im Buch stand. Ein großes Lob an dieses Tool.
Komplexes Dokument zu DOC
Nachdem ich von den vorherigen OCR-Tools bei der Konvertierung des komplexen Dokuments enttäuscht war, war ich von Online OCR massiv beeindruckt. Das Layout war nahezu perfekt, wie Sie oben sehen können. Auch hier wurde das Rezept nicht allzu gut aufgenommen, aber alle anderen kleinen Fehler waren vernachlässigbar.
Urteil
Absolut fantastische Ergebnisse von Online OCR. Der einzige Nachteil, den ich sehe, ist, dass es keine Möglichkeit gibt, die konvertierten Dokumente als PDFs herunterzuladen, da die genannten Ausgabeformate nur DOCX, XLSX und TXT umfassen.
Wie bereits erwähnt, ist ABBYY einer der Marktführer für OCR-Software und kostet rund 150 US-Dollar für das vollständige Programm zum Herunterladen. Sie bieten eine 10-seitige kostenlose Testversion für ihr Online-Tool (Registrierung erforderlich). Für ein Abonnement im Wert von 5 US-Dollar können Sie mit dem Online-Tool jeden Monat 200 Seiten konvertieren.
Akzeptierte Dateien können bis zu 100 MB in einem der folgenden Formate enthalten: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP und PNG. ABBYY erkennt auch fast 200 Sprachen. Besonders beeindruckend sind die Ausgaben mit der Wahl zwischen DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 und EPUB.
Sie können während Ihres Tests sogar einige BETA-Funktionen ausprobieren. Die erste ist die Option, Ihr Dokument in eine andere Sprache zu übersetzen. Die andere Möglichkeit besteht darin, Ihr konvertiertes Dokument in Ihr Cloud-Speicherkonto zu exportieren, unabhängig davon, ob es sich um Dropbox, Google Drive, Evernote, Microsoft OneDrive oder Box handelt.
Basisdokument zu DOCX
Die Gesamtergebnisse waren gut, aber nicht erstaunlich, wenn man bedenkt, dass es sich um ein Premiumprodukt handelt. Mehrere Kommas und Punkte wurden vertauscht, mehrere Anführungszeichen wurden durch ein Sternchen ersetzt, ein paar Großbuchstaben fehlten und ein Wort (Literalist) wurde falsch geschrieben.
Komplexes Dokument zu DOCX
Nach der Konvertierung gab es nur sehr wenige Fehler im Text des Dokuments (abgesehen davon, dass die OCR erneut mit der Schriftart dieses Rezepts zu kämpfen hatte!), Aber die Formatierung ließ zu wünschen übrig.
Die drei Spalten nahmen irgendwie zwei Seiten ein, mit der mittleren Spalte nur erscheint auf der zweiten Seite. Wenn du eigentlich wolltest machen Wenn Sie dieses konvertierte Dokument verwenden, werden Sie sich am Ende die Haare ausreißen.
Basisdokument zu PDF
Beim Überprüfen der konvertierten PDF-Datei konnte ich überhaupt keinen Fehler feststellen. Vielleicht haben wir herausgefunden, wo sich ABBYY auszeichnet. Fantastische Ergebnisse.
Komplexes Dokument in PDF
Auch in dieser konvertierten Datei konnte ich keine Fehler finden. ABBYY weiß offensichtlich außergewöhnlich gut, wie man in PDF konvertiert.
Urteil
Wenn Sie gerne ein paar Dollar bezahlen, scheint die Konvertierung in PDF mit diesem Service phänomenal gut zu funktionieren Die Möglichkeit, konvertierte Dateien mit Ihrem Cloud-Speicher zu synchronisieren, ist besonders nützlich, wenn Sie ein großes Volumen von scannen Unterlagen. Wie bei den anderen Optionen hat ABBYY jedoch noch nicht herausgefunden, wie Dokumente zur einfachen Bearbeitung fehlerfrei in DOC konvertiert werden können.
Das Endergebnis
Wenn Sie, wie die meisten Menschen, nur ein paar Zeitschriftenartikel und einige Haushaltsrechnungen scannen möchten, müssen Sie diese Dokumente nicht bearbeiten. Daher ist die direkte Konvertierung in eine PDF-Datei für Sie geeignet, da Sie diese Dokumente weiterhin durchsuchen können. Dafür war Free Online OCR definitiv das beste kostenlose Tool, das wir getestet haben. Wenn Sie jedoch bereit sind, 5 US-Dollar pro Monat für nahezu Perfektion zu zahlen, FineBeader Online von ABBYY war etwas genauer.
Bei der Konvertierung von Dokumenten in DOC konnten wir keine perfekte Lösung finden, aber die mit Abstand besten Ergebnisse wurden erzielt Online-OCR. Die Konvertierung war nicht perfekt, aber die Integrität der Formatierung wurde weitgehend beibehalten, und Fehler waren vernachlässigbar. Wenn wir diese Ergebnisse mit dem Premium-Angebot von ABBYY vergleichen, können Sie nicht anders, als massiv beeindruckt zu sein.
Wir haben nicht aufgenommen OCR-Funktionen von Google Drive in diesem Beitrag; ein bisschen für die Allgegenwart von Google, aber mehr für die Tatsache, dass wir ein paar andere kostenlose Online-OCR-Dienste testen wollten.
Über Sie: Welche anderen Online-OCR-Tools würden Sie unseren Lesern empfehlen? Und was haben Sie versucht, das Sie nie wieder verwenden würden?
Rob Nightingale hat einen Abschluss in Philosophie von der University of York, UK. Er hat über fünf Jahre als Social Media Manager und Berater gearbeitet und Workshops in mehreren Ländern gegeben. In den letzten zwei Jahren war Rob auch Technologie-Autor und MakeUseOfs Social Media Manager und Newsletter-Editor. Normalerweise reist er auf dem…