www.wikidata.de-de.nina.az
Texterkennung ist ein Begriff aus der Informationstechnik Es bezeichnet die automatisierte Texterkennung bzw automatische Schrifterkennung innerhalb von Bildern Ursprunglich basierte die automatische Texterkennung auf optischer Zeichenerkennung englisch optical character recognition Abkurzung OCR Diese Technik wird zunehmend durch neuronale Netze die ganze Zeilen statt einzelner Zeichen verarbeiten abgelost Beispiel einer fehlerhaften automatischen Texterkennung Aktuelle OCR Software erkennt diesen Text fehlerfrei Inhaltsverzeichnis 1 Grundsatzliches 2 Verfahren 2 1 Seiten und Gliederungserkennung 2 2 Mustererkennung 2 2 1 Fehlerkorrektur auf Pixelebene 2 2 2 Mustervergleich Mapping 2 2 3 Fehlerkorrektur Zeichenebene Intelligent Character Recognition ICR 2 2 4 Fehlerkorrektur auf Wortebene Intelligent Word Recognition IWR 2 2 5 Manuelle Fehlerkorrektur 2 3 Codierung in das Ausgabeformat 3 Erfolge durch neuronale Netze 4 Anwendungen 5 OCR Software 5 1 Proprietare Software 5 2 Freie Software 6 EinzelnachweiseGrundsatzliches BearbeitenTexterkennung ist deshalb notwendig weil optische Eingabegerate Scanner oder Digitalkameras aber auch Faxempfanger als Ergebnis ausschliesslich Rastergrafiken liefern konnen d h in Zeilen und Spalten angeordnete Punkte unterschiedlicher Farbung Pixel Texterkennung bezeichnet dabei die Aufgabe die so dargestellten Buchstaben als solche zu erkennen d h zu identifizieren und ihnen den Zahlenwert zuzuordnen der ihnen nach ublicher Textcodierung zukommt ASCII Unicode Automatische Texterkennung und OCR werden im deutschen Sprachraum oft als Synonym verwendet In technischer Hinsicht bezieht sich OCR jedoch nur auf den Teilbereich der Mustervergleiche von separierten Bildteilen als Kandidaten zur Erkennung von Einzelzeichen Diesem OCR Prozess geht eine globale Strukturerkennung voraus in der zuerst Textblocke von graphischen Elementen unterschieden die Zeilenstrukturen erkannt und schliesslich Einzelzeichen separiert werden Bei der Entscheidung welches Zeichen vorliegt kann uber weitere Algorithmen ein sprachlicher Kontext berucksichtigt werden Ursprunglich wurden zur automatischen Texterkennung eigens entworfene Schriftarten entwickelt die zum Beispiel fur das Bedrucken von Scheckformularen verwendet wurden Diese Schriftarten waren so gestaltet dass die einzelnen Zeichen von einem OCR Lesegerat schnell und ohne grossen Rechenaufwand unterschieden werden konnten So zeichnet sich die Schriftart OCR A DIN 66008 ISO 1073 1 durch einander besonders unahnliche Zeichen besonders bei den Ziffern aus OCR B ISO 1073 2 ahnelt mehr einer serifenlosen nicht proportionalen Schriftart wahrend OCR H DIN 66225 handgeschriebenen Ziffern und Grossbuchstaben nachempfunden wurde Die gestiegene Leistungsfahigkeit moderner Computer und verbesserte Algorithmen erlauben inzwischen auch die Erkennung von normalen Druckerschriftarten bis hin zu Handschriften etwa bei der Briefverteilung wenn jedoch Lesbarkeit durch Menschen nicht vorrangig ist werden drucktechnisch und erkennungstechnisch einfacher handhabbare Strichcodes genutzt Moderne Texterkennung umfasst inzwischen mehr als reine OCR definiert als Verfahren der automatischen Schrifterkennung 1 das heisst die Ubersetzung einzelner Schriftzeichen Zusatzlich werden Methoden der Kontextanalyse Intelligent Character Recognition ICR hinzugezogen mit denen die eigentlichen OCR Ergebnisse korrigiert werden konnen So kann ein Zeichen das eigentlich als 8 erkannt wurde zu einem B korrigiert werden wenn es innerhalb eines Wortes steht Statt 8aum wird also Baum erkannt aber eine Umwandlung von 8te also eine alphanumerische Kombination sollte nicht vorgenommen werden Im Bereich industrieller Texterkennungssysteme wird daher von OCR ICR Systemen gesprochen Die Grenzen des OCR Begriffes sind jedoch fliessend denn OCR und ICR dienen auch als Marketingbegriffe um technische Weiterentwicklungen besser vermarkten zu konnen Auch Intelligent Word Recognition IWR fallt unter diese Kategorie Dieser Ansatz versucht das Problem bei der Erkennung von Fliesshandschriften zu losen bei der die Einzelzeichen nicht eindeutig separiert und daher nicht uber herkommliche OCR Methoden erkannt werden konnen Ein prinzipiell anderer Ansatz der Texterkennung wird bei der Handschriftenerkennung auf Touchscreens oder Eingabefeldern PDA usw verwendet Hier werden vektorbasierte Muster verarbeitet entweder offline als gesamtes Wort oder online mit zusatzlicher Analyse des Eingabeflusses beispielsweise Apples Inkwell Eine Sonderform der Texterkennung ergibt sich beispielsweise bei der automatischen Verarbeitung des Posteingangs grosser Firmen Eine Aufgabenstellung ist das Sortieren der Belege Dafur braucht nicht immer der Inhalt analysiert zu werden sondern es genugt manchmal schon die groben Merkmale etwa das charakteristische Layout von Formularen Firmenlogos etc zu erkennen Die Klassifikation bestimmter Textarten erfolgt wie bei der OCR uber eine Mustererkennung die sich jedoch global auf das gesamte Blatt oder definierte Stellen anstelle einzelner Buchstaben bezieht Verfahren BearbeitenAusgangspunkt ist eine Bilddatei Rastergrafik die von der Vorlage per Scanner Digitalfotografie oder Videokamera erzeugt wird Die Texterkennung selbst erfolgt dreistufig Seiten und Gliederungserkennung Bearbeiten Die Bilddatei wird in relevante Bereiche Texte Bildunterschriften und irrelevante Bereiche Abbildungen Weissflachen Linien aufgeteilt Mustererkennung Bearbeiten Fehlerkorrektur auf Pixelebene Bearbeiten Die Rohpixel konnen durch ihre Nachbarschaftsbeziehungen zu angrenzenden Pixeln korrigiert werden Einzelne Pixel werden geloscht Fehlende Pixel konnen erganzt werden Dadurch erhoht sich die Trefferquote bei einem reinen Mustervergleich Dies ist stark abhangig vom Kontrast der Vorlage Mustervergleich Mapping Bearbeiten Die Pixelmuster der Textbereiche werden mit Mustern in einer Datenbank verglichen Rohdigitalisate werden erzeugt Fehlerkorrektur Zeichenebene Intelligent Character Recognition ICR Bearbeiten Die Artikel Elektronische Texterkennung und Texterkennung Fehlerkorrektur Zeichenebene Intelligent Character Recognition ICR uberschneiden sich thematisch Informationen die du hier suchst konnen sich also auch im anderen Artikel befinden Gerne kannst du dich an der betreffenden Redundanzdiskussion beteiligen oder direkt dabei helfen die Artikel zusammenzufuhren oder besser voneinander abzugrenzen Anleitung Die Rohdigitalisate werden mit Worterbuchern verglichen sowie nach linguistischen und statistischen Verfahren hinsichtlich ihrer wahrscheinlichen Fehlerfreiheit bewertet In Abhangigkeit von dieser Bewertung wird der Text ausgegeben oder gegebenenfalls einer erneuten Layout oder Mustererkennung mit veranderten Parametern zugefuhrt Fehlerkorrektur auf Wortebene Intelligent Word Recognition IWR Bearbeiten Siehe auch Intelligent Word Recognition Fliesshandschrift bei der die Einzelzeichen nicht voneinander getrennt erkannt werden konnen wird anhand globaler Charakteristiken mit Worterbuchern verglichen Die Treffergenauigkeit verringert sich mit der zunehmenden Grosse des eingebundenen Worterbuches da die Verwechslungsmoglichkeiten zunehmen Einsatzbereiche sind definierte Feldbereiche mit eingeschrankten Angabenmoglichkeiten zum Beispiel handgeschriebene Adressen auf Briefumschlagen Manuelle Fehlerkorrektur Bearbeiten Viele Programme bieten daruber hinaus einen besonderen Modus zur manuellen Korrektur nicht sicher erkannter Zeichen Codierung in das Ausgabeformat Bearbeiten Im einfachsten Fall wird eine Textdatei in einem definierten Format wie UTF 8 erzeugt Je nach Aufgabenstellung kann die Ausgabe auch in eine Datenbank oder als PDF Datei erfolgen Spezialisierte Ausgabeformate wie die XML basierten Formate ALTO und PAGE oder hOCR eine HTML Variante speichern den Text mit Layout Information Die Qualitat der Texterkennung bestimmen unter anderem mehrere Faktoren Qualitat der Layouterkennung Umfang und Qualitat der Muster Datenbank Umfang und Qualitat der Worterbucher Qualitat der Algorithmen zur Fehlerkorrektur Farbigkeit Kontrast Layout und Schriftart des Originaldokumentes Auflosung und Qualitat der Bilddatei Die Zahl der unerkannten Fehler in einem Dokument lasst sich abschatzen siehe Rechtschreibfehler Wahrend Texte Redundanzen enthalten und deshalb eine hohere Fehlerrate zulassen erfordern Zahlenlisten wie beispielsweise Telefonnummern ein mehrmaliges Korrekturlesen Erfolge durch neuronale Netze BearbeitenIn jungster Zeit erzielten kunstliche neuronale Netzwerke bei Handschriftanwendungen oft bessere Ergebnisse als konkurrierende Lernverfahren Zwischen 2009 und 2012 gewannen die rekurrenten bzw tiefen vorwartsgerichteten neuronalen Netzwerke der Forschungsgruppe von Jurgen Schmidhuber am Schweizer KI Labor IDSIA eine Serie von acht internationalen Wettbewerben in den Bereichen Mustererkennung 2 Insbesondere gewannen ihre rekurrenten LSTM Netzwerke 3 4 drei Wettbewerbe zur verbundenen Handschrifterkennung bei der 2009 Intl Conf on Document Analysis and Recognition ICDAR ohne eingebautes a priori Wissen uber die drei verschiedenen zu lernenden Sprachen Die LSTM Netze erlernten gleichzeitige Segmentierung und Erkennung 5 Dies waren auch die ersten internationalen Wettbewerbe die durch Deep Learning 6 7 oder durch rekurrente Netze gewonnen wurden Auch tiefe vorwartsgerichtete Netzwerke wie Kunihiko Fukushimas Konvolutionsnetz der 1980er Jahre 8 sind heute wieder wichtig fur Handschrifterkennung Sie verfugen uber alternierende Konvolutionslagen und Lagen von Neuronen die miteinander im Wettbewerb stehen Yann LeCuns Team von der New York University wendete den 1989 schon gut bekannten backpropagation Algorithmus auf solche Netze an 9 Moderne Varianten verwenden sogenanntes max pooling fur die Wettbewerbslagen 10 Zum Abschluss kront man das tiefe Netz durch mehrere voll vernetzte Neuronenlagen Schnelle GPU Implementierungen dieser Kombination wurden 2010 durch Scherer und Kollegen eingefuhrt 11 Sie gewannen seither zahlreiche Wettbewerbe zur Erkennung von Handschrift und anderen Mustern 12 GPU basierte max pooling Konvolutionsnetze waren auch die ersten Verfahren die die handgeschriebenen Ziffern des MNIST Benchmarks so gut erkennen konnten wie Menschen 13 Auch bei gedrucktem Text gibt es einen Trend die klassische zeichenweise Texterkennung durch zeilenweise Texterkennung mittels neuronaler Netze zu ersetzen Diese Technik wird beispielsweise in den Programmen OCRopus Tesseract ab Version 4 PERO OCR und Loghi eingesetzt Anwendungen BearbeitenWiedergewinnen von Textinformation aus Bilddateien um diese mit Hilfe einer Textverarbeitung weiter zu bearbeiten oder elektronisch durchsuchbar zu machen Erkennung von relevanten Merkmalen zum Beispiel Postleitzahl Vertragsnummer Rechnungsnummer zur mechanischen Poststrasse oder elektronischen Workflow Management System Einsortierung eines Schriftstucks Eine erweiterte Volltextsuche in Datenbanken oder Document Management Systemen um auch PDFs und Bilder durchsuchen zu konnen Erkennung von Merkmalen zur Registrierung und gegebenenfalls Verfolgung von Gegenstanden beispielsweise Kfz Kennzeichen Layouterkennung Es wird ein formatiertes Dokument erstellt das der Vorlage bezuglich Text Bild und Tabellenanordnung moglichst nahekommt Blindenhilfsmittel Fur Blinde wird es durch die Texterkennung moglich eingescannte Texte uber Computer und Braillezeile zu lesen oder sich per Sprachausgabe vorlesen zu lassen OCR Software BearbeitenProprietare Software Bearbeiten BIT Alpha von B I T Bureau Ingenieur Tomasi FineReader von ABBYY FormPro von OCR Systeme KADMOS best OCR ICR Ocelus von Teklia OCRKit fur Mac OS und iOS OmniPage von Kofax fruher ScanSoft Nuance Communications Readiris von Image Recognition Integrated Systems Group I R I S seit 2013 zu Canon NSOCR von Nicomsoft IDA Recognition von PLANET AI Screenworm fur Mac OS von Funchip TranskribusAls Nebenfunktion in proprietarer Software Acrobat Text Capture in Adobe Acrobat von Adobe Inc Corel OCR Trace in CorelDRAW von Corel Microsoft OneNote seit Version 2010 Microsoft 365 Word ab Version 2013 14 ExactScan Pro fur Mac OS PDF XChange Viewer kostenlos auch als portable Version verfugbar Cloudbasiert ABBYY Cloud OCR 15 Google Cloud Vision Beta 16 Microsoft Azure Computer Vision API 17 OCR space Online OCR proprietar aber frei verwendbar 18 TextScan Online OCR 19 Freie Software Bearbeiten eScriptorium eine auf Kraken basierende Web Applikation 20 GT Text OCRopus ocropy und die davon abgeleiteten Programme Kraken und Calamari GOCR Loghi 21 CuneiForm Ocrad Tesseract mit z B gImageReader als grafische Benutzeroberflache 22 OCRFeeder dpScreenOCR OCR4all OCR D PERO OCR 23 Einzelnachweise Bearbeiten Hans F Ebel Claus Bliefert Vortragen in Naturwissenschaft Technik und Medizin 1991 2 bearbeitete Auflage 1994 VCH Weinheim ISBN 3 527 30047 3 S 300 2012 Kurzweil AI Interview mit Jurgen Schmidhuber zu den acht Wettbewerben die sein Deep Learning Team zwischen 2009 und 2012 gewann Graves Alex and Schmidhuber Jurgen Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks in Bengio Yoshua Schuurmans Dale Lafferty John Williams Chris K I and Culotta Aron eds Advances in Neural Information Processing Systems 22 NIPS 22 December 7th 10th 2009 Vancouver BC Neural Information Processing Systems NIPS Foundation 2009 S 545 552 ein gleichnamiges Preprint befindet sich unter 1 A Graves M Liwicki S Fernandez R Bertolami H Bunke J Schmidhuber A Novel Connectionist System for Improved Unconstrained Handwriting Recognition IEEE Transactions on Pattern Analysis and Machine Intelligence Band 31 Nummer 5 2009 Schmidhuber Jurgen Winning Handwriting Recognition Competitions Through Deep Learning http www idsia ch juergen handwriting html Bengio Y 2009 Learning Deep Architectures for AI Now Publishers Archivierte Kopie Memento vom 21 Marz 2014 im Internet Archive Schmidhuber Jurgen My First Deep Learning System of 1991 Deep Learning Timeline 1962 2013 http www idsia ch juergen firstdeeplearner html Fukushima K Neocognitron A self organizing neural network model for a mechanism of pattern recognition unaffected by shift in position In Biological Cybernetics 36 Jahrgang Nr 4 1980 S 93 202 doi 10 1007 BF00344251 Y LeCun B Boser J S Denker D Henderson R E Howard W Hubbard L D Jackel Backpropagation Applied to Handwritten Zip Code Recognition Neural Computation 1 4 541 551 1989 PDF M Riesenhuber T Poggio Hierarchical models of object recognition in cortex Nature Neuroscience 1999 PDF Dominik Scherer Andreas C Muller and Sven Behnke Evaluation of Pooling Operations in Convolutional Architectures for Object Recognition In 20th International Conference on Artificial Neural Networks ICANN S 92 101 2010 doi 10 1007 978 3 642 15825 4 10 PDF J Schmidhuber 2009 2013 Deep Learning since 1991 First Deep Learners to Win Contests in Pattern Recognition Object Detection Image Segmentation Sequence Learning Through Fast amp Deep Recurrent Neural Networks www deeplearning it D C Ciresan U Meier J Schmidhuber Multi column Deep Neural Networks for Image Classification IEEE Conf on Computer Vision and Pattern Recognition CVPR 2012 http www idsia ch juergen cvpr2012 pdf Microsoft Word Supportseite ABBYY Cloud OCR SDK Abgerufen am 4 Dezember 2017 englisch Vision API Analyse von Bildinhalten Google Cloud Platform Abgerufen am 4 Dezember 2017 Computer Vision API Image Processing Microsoft Azure Abgerufen am 4 Dezember 2017 englisch OCR space Free Online OCR Abgerufen am 15 Marz 2019 englisch TextScan OCR Abgerufen am 25 Oktober 2019 englisch Scripta eScriptorium Abgerufen am 30 Juni 2022 englisch Thijs van der Veen Unique software to transcribe historical texts now open source available Digital Infrastructure KNAW Humanities Cluster 21 April 2023 abgerufen am 26 April 2023 englisch gImageReader Wiki ubuntuusers de Abgerufen am 23 Mai 2021 DCGM pero ocr Abgerufen am 30 Juni 2022 englisch Normdaten Sachbegriff GND 4310936 6 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Texterkennung amp oldid 236727188