www.wikidata.de-de.nina.az
eScriptorium ist eine Plattform zur manuellen oder automatisierten Segmentierung und Texterkennung von historischen Handschriften und Drucken eScriptoriumBasisdatenEntwickler PSLErscheinungsjahr 2018Aktuelle Version 0 10 5 2022 Betriebssystem plattformunabhangigProgrammiersprache Python JavaScript HTMLLizenz MIT Lizenz 1 gitlab com scripta escriptoriumDie Software ist Open Source und kann somit frei auch auf eigenen Rechnern installiert werden Sie wird an der Universite PSL in Paris als Teil der Projekte Scripta 2 und RESILIENCE 3 und mit Beitragen weiterer Einrichtungen entwickelt teilweise gefordert mit Mitteln aus dem EU Forderprogramm Horizont 2020 und mit einem Zuschuss der Andrew W Mellon Foundation Eingescannte Seiten von Handschriften und Drucken lassen sich in eScriptorium importieren und als Text in unterschiedlichen Formaten exportieren Dabei werden zunachst die Textbereiche mit Textzeilen in den Bildern manuell oder automatisch erkannt Segmentierung Anschliessend werden die Textzeilen wiederum manuell oder automatisch transkribiert Sowohl die automatische Segmentierung als auch die Texterkennung kann anhand von manuell erstellten oder korrigierten Beispielen engl ground truth trainiert werden Die so erzeugten neuen Modelle lassen sich mit anderen teilen und konnen so einfach nachgenutzt werden Herzstuck von eScriptorium ist die ebenfalls freie OCR Software Kraken von Benjamin Kiessling eine Weiterentwicklung der OCR Software OCRopus die fur Hand und Druckschriften geeignet ist und dabei auch Schriften wie Hebraisch und Arabisch die von rechts nach links geschrieben werden unterstutzt 4 Vergleichbare Programme die ahnliche Funktionen wie eScriptorium anbieten sind OCR4All 5 und Transkribus kostenpflichtig Einzelnachweise Bearbeiten gitlab com Scripta PSL History and practices of writing Abgerufen am 13 Marz 2022 englisch RESILIENCE The Religious Studies Research Infrastructure Abgerufen am 13 Marz 2022 englisch mittagessen kraken OCR engine for all the languages Abgerufen am 13 Marz 2022 englisch OCR4all forTEXT Abgerufen am 20 Juni 2023 Abgerufen von https de wikipedia org w index php title EScriptorium amp oldid 234769752