www.wikidata.de-de.nina.az
CuneiForm engl fur keilschriftlich ist eine Texterkennungssoftware fur gedruckte Erkennungsvorlagen des russischen Unternehmens Cognitive Technologies Prasidentin Olga Anatoljewna Uskowa die mittlerweile als freie Software verfugbar ist CuneiFormBasisdatenEntwickler Cognitive TechnologiesAktuelle Version 1 1 0 19 April 2011 Betriebssystem Windows Linux und FreeBSD Portierungen verfugbar Programmiersprache C 1 C 1 Kategorie TexterkennungLizenz BSD Freie Software deutschsprachig jalaunchpad net Inhaltsverzeichnis 1 Merkmale 2 Geschichte 3 Cuneiform Linux 3 1 Frontends 4 Weblinks 5 EinzelnachweiseMerkmale BearbeitenCuneiForm erkennt gedruckte Vorlagen jedoch keine Handschrift oder ahnliches mit Sprachmodellen fur uber 20 verschiedene Sprachen Gut funktioniert auch die Erkennung komplizierter Tabellenstrukturen Ergebnisse konnen in RTF HTML oder als ASCII Text gespeichert oder direkt an die Textverarbeitung Word oder die Tabellenkalkulation Excel exportiert werden Es erhalt Dokumentstruktur und Schriftarten und ermoglicht Stapelverarbeitung Geschichte BearbeitenCuneiForm war einst marktfuhrend in Russland in Konkurrenz zu FineReader des Unternehmens ABBYY und wurde mit einigen Scannern mitgeliefert 1993 ging Cognitive Technologies einen OEM Vertrag mit der kanadischen Corel Corporation ein der die Einbindung der Erkennungsbibliothek in das Corel Draw Paket erlaubte das ab Version 3 0 diese enthielt 1996 wurde OCR CuneiForm 96 veroffentlicht Es war das erste Texterkennungspaket das mit einer adaptiven Erkennungsmethode arbeitete d h einer Methode die Multifont und Omnifont Erkennung verbindet Es erfolgt eine interne Nachbildung der in der Erkennungsvorlage verwendeten Fonts engl fur Schriftarten aus Zeichen die in erkennbarer Qualitat abgebildet sind Dadurch wird im Anschluss auch die Erkennung von schlechter abgebildeten Zeichen moglich da sich die Software bei der Erkennung dynamisch anpasst Mit dieser Erkennungsmethode wird die Erkennungsgenauigkeit wesentlich gesteigert 1997 wurde die Nutzung neuronaler Netze bei der Erkennung eingefuhrt Seit 1999 kann die Software das Aussehen der Vorlage erhalten indem die Anordnung der Elemente in der Ausgabe nachgebaut wird Im Rahmen eines Programmes das erklartermassen Texterkennungstechnologie fur jedermann verfugbar machen soll hat Cognitive Technologies am 2 April 2008 angekundigt die Software letzten Endes komplett als freie Software verfugbar zu machen Als erster Schritt wurde nach einigen Jahren ohne Entwicklungsfortschritte am 12 Dezember 2007 eine Freeware Version veroffentlicht Weiterhin wurde im Juni 2008 ein kostenloser Texterkennungsdienst im World Wide Web eingerichtet Als Investor und Projektkoordinator will Cognitive Technologies die Entwicklung einer neuen Version der Software fordern Seit Anfang April 2008 ist der Kern der Erkennungsengine unter der vereinfachten BSD Lizenz frei verfugbar um auch eine kommerzielle Verwendung zu ermoglichen 2 Am 30 August 2009 wurde auch die originale Benutzerschnittstelle offengelegt Cuneiform Linux BearbeitenJussi Pakkanen hat eine plattformunabhangig kompilierbare Version der Software erstellt die auf Linux BSD macOS und Windows lauft 3 Diese unabhangigen Entwicklungen sollen schliesslich in den Hauptzweig von Cognitive Technologies integriert werden Es handelt sich um eine reine Kommandozeilen Version die mittels der Einbindung von ImageMagick das Lesen einer Vielzahl von Dateiformaten erlaubt wahrend sonst einzig unkomprimiertes Windows Bitmap BMP unterstutzt wird Ab Version 0 5 kann die Software auch in die Beschreibungssprache hOCR ausgeben Frontends Bearbeiten YAGF 4 ist eine Qt 4 basierte graphische Benutzeroberflache die via XSane Bilder direkt von einem Scanner einlesen und mittels libaspell eine Rechtschreibprufung durchfuhren kann Cuneiform Qt 5 ist ein weiteres Qt basiertes Frontend OCRFeeder stellt eine komplette scannen Bildaufbereitung Seitengestaltung analysieren und erhalten Korrekturlesen Desktop OCR Losung zur Verfugung mit der man neben anderen auch CuneiForm als Backend nutzen kann WatchOCR 6 ist ein kostenloser OCR Server fur PDFs WatchOCR verwendet CuneiForm um aus PDFs mit gescannten Bildern durchsuchbare PDFs zu erstellen Mittels eines Web Interface kann WatchOCR so konfiguriert werden dass es neu gescannte PDFs in einem bestimmten Ordner automatisch in durchsuchbare PDFs umwandelt WatchOCR ist im Deb Format fur Ubuntu und als vorkonfigurierte LiveCD erhaltlich Mittels eines Skripts xsane2cunei kann CuneiForm auch in die Scan Software XSane eingebunden werden Aus der hOCR Ausgabe von CuneiForm konnen mittels des Kommandozeilenprogrammes hocr2pdf 7 Bilder PDF Dateien maschinell durchsuchbar gemacht werden Die Kommandozeilenwerkzeuge pdfsandwich 8 oder pdfocr 9 automatisieren diesen Prozess Auch das Dokumentenmanagementsystem Archivista macht mittels CuneiForm und hocr2pdf PDFs maschinell durchsuchbar Weblinks BearbeitenProjektubersicht zu Cuneiform Linux bei LaunchpadEinzelnachweise Bearbeiten a b www openhub net Cognitive Technologies otkryla kod OCR Cuneiform Memento des Originals vom 6 November 2009 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www cognitive ru siehe das Projekt cuneiform linux auf launchpad net symmetrica net cuneiform linux yagf en html Memento des Originals vom 15 Dezember 2009 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot symmetrica net http en altlinux org Cuneiform Qt Archivierte Kopie Memento des Originals vom 17 Februar 2013 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www watchocr com exactcode de site open source exactimage hocr2pdf http tobias elze de pdfsandwich https github com gkovacs pdfocr Abgerufen von https de wikipedia org w index php title CuneiForm amp oldid 237654612