Werbung

Javier fragt:

Ich schreibe Kurzgeschichten und Geschichten. Ich suche eine kostenlose Optische Zeichenerkennung (OCR) oder Intelligente Zeichenerkennung (ICR) -Programm zum Scannen meiner alten Manuskripte von Bildern oder Fotos, damit ich sie in Microsoft Word-Dateien konvertieren kann.

Gibt es kostenlose und genaue Programme, die dies tun können? Leider habe ich keinen Scanner, aber ich habe Zugriff auf eine Digitalkamera mit einer Auflösung von 20 Megapixeln.

Manuskript

Kannons Antwort:

Wie Sie bereits erwähnt haben, gibt es verschiedene Arten von Zeichenerkennungstechnologien, mit denen handgeschriebene oder getippte Schrift automatisch in digitale Zeichen umgewandelt werden kann. Der Genauigkeitsgrad dieser Art von Software variiert stark zwischen verschiedenen Implementierungen. Einige konvertieren Buchstabe für Buchstabe, andere können ganze Wörter konvertieren. Es gibt drei allgemeine Kategorien dieser Software:

  • Optische Zeichenerkennung (OCR)
  • Intelligente Zeichenerkennung (ICR)
  • Intelligente Worterkennung (IWR)
instagram viewer

Optische Zeichenerkennung

In Wahrheit ist OCR ein Oberbegriff und häufig werden alle in diesem Artikel beschriebenen Methoden als OCR bezeichnet. Wikipedia gibt OCR jedoch eine eigene Klassifizierung, aber moderne Implementierungen neigen dazu, mehrere zusammenzufassen Methoden. Was macht es also? OCR wandelt einzelne typisierte oder handgeschriebene Buchstaben in digitale Zeichen um. Die Software betrachtet also ein Dokument und versucht dann, es in einfachen Text umzuwandeln, indem sie errät, was jedes Zeichen ist.

Die Software ist nicht perfekt. OCR-Software kann einzelne Zeichen mit ähnlichem Erscheinungsbild falsch interpretieren, was zu falsch geschriebenen Wörtern und ungenauen Ausgaben führt. Meistens können Benutzer den von einem OCR-Programm generierten Text in ein Textverarbeitungsprogramm kopieren und Rechtschreibfehler automatisch beheben. Oft erscheinen Fehler als ähnliche Zeichen. Zum Beispiel könnte der Buchstabe "d" als "cl" dargestellt werden.

Aber wenn es um handgeschriebene Texte geht, ist OCR nicht besonders gut. Zumindest ist die Mehrheit der freien Implementierungen tragisch schlecht. Es gibt einige kommerzielle Produkte, die können Ja wirklich Nagel handschriftliche Transkription, aber ihre Preisgestaltung macht sie für die breite Öffentlichkeit völlig unerreichbar. Zum Beispiel gibt es Lexmarks ReadSoft OCR-Software. Diese reine Unternehmenssoftware kostet Tausende von Dollar.

kommentierter Text

Intelligente Zeichenerkennung

ICR ist eine Teilmenge von OCR, die sich auf die Umwandlung von handgeschriebenem Text in einzelne digitale Zeichen spezialisiert hat. Da Ihre Notizen und Manuskripte handgeschrieben sind, ist ein ICR-Programm am nützlichsten. Ich bin mir jedoch nicht sicher, wie genau sie Texte konvertieren können, die in Fremdsprachen wie Spanisch geschrieben wurden. Wie bei OCR können Benutzer die Qualität der ausgegebenen Texte verbessern, indem sie sie in ein Textverarbeitungsprogramm mit aktivierter Rechtschreibkorrektur kopieren und anschließend von Hand Korrektur lesen.

Ein Test des Charakters: 10 Schriftspiele, die beweisen, dass Typografie Spaß machen kann

Intelligente Worterkennung

Die neueste Entwicklung von OCR und ICR ist Intelligente Worterkennung Software. Anstatt einzelne Zeichen zu erkennen, wird versucht, ganze handgeschriebene Wörter zu übersetzen. Wie bei OCR und ICR übersetzt die intelligente Worterkennung häufig Wörter falsch und erfordert, dass der Benutzer alle gemachten Fehler manuell korrigiert.

Was ist die beste kostenlose OCR-Software?

Es stehen viele Optionen zur Verfügung. Tesseract ist wahrscheinlich das beste Open Source (und kostenlose) OCR-Software da draußen. Meines Wissens werden nur einzelne Zeichen und nicht ganze Wörter betrachtet.

Weil Sie Microsoft Word verwenden (das das Beste bietet, am besten anpassbare Rechtschreibprüfung Rechtschreib- und Grammatikprüfung in Microsoft WordSie können die in Microsoft Word integrierten Tools zur Rechtschreib- und Grammatikprüfung an Ihre Anforderungen anpassen. Sie können sogar AutoCorrect verwenden, um die Eingabe zu beschleunigen. Weiterlesen in den Unternehmen) können Sie einfach den gesamten Text in Word kopieren und dann eine Rechtschreibprüfung durchführen, um Rechtschreibfehler zu beseitigen.

Tesseract ist eigentlich eine OCR-Engine, die über die Befehlszeile ausgeführt wird. Sofern Sie nicht bereit sind, sich mit der Schwierigkeit zu befassen, ein Befehlszeilentool zu verwenden, möchten Sie wahrscheinlich etwas Benutzerfreundlicheres installieren. Es gibt ein herunterladbares "Front-End" (oder eine grafische Benutzeroberfläche), mit dem Sie Tesseract als Drag-and-Drop-Tool verwenden können: PDF OCR X.. Installieren Sie zuerst das Softwarepaket und führen Sie es dann aus. Sie sehen dann ein Fenster:

PDF OCR-Schnittstelle

Dann ziehen Sie die Bilddatei einfach per Drag & Drop auf das Fenster. Führen Sie nach dem Laden des Bildes die OCR-Transkriptionssoftware aus. Es kann ungefähr eine Minute dauern.

Leider erwies es sich als völlig unzureichend für den Umgang mit Ihrem Text. So sieht es nach dem Extrahieren von Text aus dem Dokument aus:

OCR-Bildextraktion mit Tesseract

Da Sie anscheinend bereits Microsoft Office verwenden, ist die beste Option wahrscheinlich auch Microsoft. Ich gehe davon aus, dass Sie eine Kopie von Microsoft Office besitzen, die OneNote enthält. Dies ist mit einer ziemlich fortschrittlichen OCR-Technologie ausgestattet.

Auch auf beiden iOS und Androidgibt es auch die völlig kostenlos Microsoft Office-Objektiv, die JPEG (und andere Bildformate) direkt in Text konvertieren kann. Was die mobilen Versionen so wunderbar macht, ist, dass Sie ein Bild aufnehmen, es in das Cloud-Computing-System von Microsoft hochladen und dann die Textextraktion von OneNote auf einem Desktop ausführen können.

Der Prozess ist ziemlich einfach. Machen Sie zuerst ein Foto Ihres Textes. Wenn Sie sich für die OneNote-App entschieden haben, müssen Sie die Datei nur in Ihrem OneDrive-Konto speichern. Andernfalls übertragen Sie das Bild auf Ihren Computer und legen Sie es auf OneNote ab.

Klicken Sie dann mit der rechten Maustaste auf das Bild und wählen Sie KopierenText aus dem Bild aus dem Kontextmenü.

onenote Extraktion von Text

Klicken Sie dann mit der rechten Maustaste auf einen leeren Teil von OneNote (oder in einer Textleseanwendung) und Fügen Sie den Text ein. Der aus Ihrem Dokument ausgegebene Text sieht folgendermaßen aus:

onenote OCR-Textextraktion

Leider reichen die Ergebnisse von OneNote nicht aus irgendwo in der Nähe eines guten Jobs, der völligen Unsinn hervorbringt. Dies kann durch eine Kombination von Faktoren verursacht werden, z. B. durch ein verzerrtes Bild oder Schreiben, das nicht in einer geraden Linie erfolgt, oder einfach, weil die Software nicht gut genug ist.

Derzeit bezieht sich die beste Lösung für OCR auf handschriftlichen Dokumenten auf maschinelles Lernen: Insbesondere Deep-Learning. Deep-Learning ist eine ausgefeilte Methode, um einen Computer für die Ausführung von Aufgaben zu trainieren, bei denen bisher nur Menschen herausragende Leistungen erbrachten, z.Picasa macht Gesichtserkennung Verwendung der Gesichtserkennung in Picasa-Webalben Weiterlesen , glaub es oder nicht). Google hat kürzlich DeepMind gekauft, das sich entwickelt Deep-Learning-Technologie Coole Forschungsprojekte, die die Zukunft verändern könntenWerden Megakonzerne wie Google, Microsoft, IBM und Intel künftigen Generationen die Welt geben, die wir uns jetzt nur vorstellen können? Diese spannenden Forschungsprojekte sagen, dass es ein Versprechen ist, das sie halten werden. Weiterlesen . Diese Schlüsselakquisition hatte einen großen Effekt: Microsoft verliert in OCR gegen Google Microsoft gegen Google - Wer führt das Rennen um künstliche Intelligenz an?Forscher für künstliche Intelligenz machen greifbare Fortschritte, und die Leute beginnen wieder ernsthaft über KI zu sprechen. Die beiden Titanen, die das Rennen um künstliche Intelligenz anführen, sind Google und Microsoft. Weiterlesen . Derzeit bietet Google eine der fortschrittlichsten (und kostenlossten) Methoden an: Google Keep.

Google Keep (die wir erstmals 2013 überprüft haben Einfache Hinweise für unterwegs: Google Keep für Android überprüftEs gibt einige erstaunliche Notizen-Apps, aber hier ist eine, die genauer betrachtet werden sollte: Google Keep, ein Notizen-Keeper, der sowohl eine gut aussehende Android-App als auch eine raffinierte Webapp hat. Weiterlesen ) bietet auch eine mobile Version ihrer App für Android. Wie bei OneNote können Sie das Bild aufnehmen und direkt in die Google-Cloud übertragen. Ziehen Sie das Bild einfach in das Google Keep-Fenster. Klicken Sie dann auf die Menüschaltfläche (drei vertikale Punkte) und wählen Sie Bildtext abrufen aus dem Kontextmenü.

google keep

So sieht es nach dem Extrahieren des Textes aus:

2015-07-18_19h45_34

Google Keep gewinnt

Wie Sie sehen können, dominiert Google Keep die Konkurrenz. Die Ergebnisse können durch Verwendung von a noch weiter verbessert werden Bildbearbeitungswerkzeug 10 kostenlose Fotoeditor-Tools, mit denen Sie Ihre Aufnahmen optimal nutzen könnenWas ist mit all den Schnappschüssen passiert, die Sie in der Vergangenheit gemacht haben? Wenn Sie Pläne und Ideen haben, finden Sie hier einige großartige Windows- und einige plattformübergreifende Tools, mit denen Sie sie verarbeiten können. Weiterlesen um den Kontrast zu erhöhen und das Bild zu begradigen.

Hoffentlich helfen diese Optionen. Wenn Sie weitere OCR-Optionen benötigen, lesen Sie bitte die 5 besten OCR-Tools Die 5 besten OCR-Tools zum Extrahieren von Text aus BildernWie können Sie bei Unmengen von Papier den gesamten gedruckten Text in etwas konvertieren, das ein digitales Programm erkennen und indizieren kann? Halten Sie eine gute OCR-Software in Ihrer Nähe. Weiterlesen , für mehr Informationen.

Kannon ist ein Tech Journalist (BA) mit einem Hintergrund in internationalen Angelegenheiten (MA) mit Schwerpunkt auf wirtschaftlicher Entwicklung und internationalem Handel. Seine Leidenschaften liegen in Geräten aus China, Informationstechnologien (wie RSS) sowie Tipps und Tricks zur Produktivität.