www.wikidata.de-de.nina.az
Distributed Proofreaders kurz auch DP oder PGDP ist ein web basiertes Projekt um das internationale Project Gutenberg zu unterstutzen und wurde im Jahr 2000 von Charles Franks ins Leben gerufen Es befasst sich mit dem Korrekturlesen der von Project Gutenberg eingescannten Bucher durch Freiwillige Bislang wurden ca 33 500 Texte korrekturgelesen 1 ScreenshotHierbei versucht man durch Unterteilung von eingescannten Buchern in einzelne Seiten die Arbeitsbelastung fur einen einzelnen Korrekturleser moglichst gering zu halten und nach der Brute Force Methode bedeutet hier eine moglichst grosse Anzahl von Bearbeitern liest nur jeweils eine Buchseite von Tausenden bereitgestellten zur Korrektur ein moglichst grosses Pensum zu erreichen Dabei wird nach demselben Prinzip wie beim verteilten Rechnen distributed computing vorgegangen Der entscheidende Unterschied besteht darin dass hier nicht eine sehr grosse Zahl von Computern uber das Internet miteinander verknupft werden sondern dass eine beliebig grosse Zahl von Menschen uber das Internet ihre Mitarbeit zur Verfugung stellen und damit in kurzer Zeit hunderte von Buchern durch ihr Korrekturlesen digitalisieren Die derzeit etwa 1400 aktiven Teilnehmer organisieren sich auf freiwilliger Basis nach Herkunft oder Interessen zu Teams so hat etwa das Team Germany schon fast 500 Mitglieder die auf allen Ebenen von DP mitwirken 2 Inhaltsverzeichnis 1 Ablauf der weltweiten Buchdigitalisierung 1 1 Initialisierungsphase 1 2 Phasen des Korrekturlesens 1 2 1 Runden 1 bis 3 des Korrekturlesens Proofing 1 2 2 Runden 4 und 5 Formatting 1 2 3 Nachbearbeitung Post Processing 1 3 Veroffentlichung 2 Bedeutung von Distributed Proofreaders 3 DP 10K 4 Weblinks 5 EinzelnachweiseAblauf der weltweiten Buchdigitalisierung BearbeitenGrundsatzlich lassen sich im Ablauf drei Phasen unterscheiden Initialisierungsphase Bearbeiten In der Initialisierungsphase wird durch einen erfahrenen und bereits seit langerem mitwirkenden Proofreader ein Buch ausgewahlt Das ausgewahlte Buch muss frei von Urheberrechten sein Beim ursprunglichen Projekt wird das amerikanische Urheberrecht zugrunde gelegt bis 1922 veroffentlichte Texte bei Distributed Proofreaders Europe die in Europa weitgehend einheitliche Regelung dass der Autor des Buches vor mehr als 70 Jahren verstorben sein muss Der Initiator scannt zunachst jede Buchseite ein Die Scans umfassen das ganze Buch also Deckblatt Inhaltsverzeichnis Texte und Bilder Anschliessend werden die Seiten durch eine OCR Software analysiert Der erste aber noch uberaus fehlerbehaftete Rohtext liegt dann vor Danach wird die Datenmenge auf die Homepage der Distributed Proofreader hochgeladen und als weiterer Projektvorschlag im Forum zur Diskussion gestellt Nach positiver Abstimmung wird das Projekt dann zum Korrekturlesen freigeschaltet Es steht dann zum Aufruf uber die Homepage zusammen mit anderen Projekten weltweit zur Verfugung Phasen des Korrekturlesens Bearbeiten Runden 1 bis 3 des Korrekturlesens Proofing Bearbeiten Nach Aufruf des Projekts wird jeweils eine Seite des Buchs angezeigt Dabei wird in der oberen Bildschirmhalfte die gescannte Originalseite als Grafik und in der unteren Bildschirmhalfte der erkannte OCR Text angezeigt Der Proofreader liest nun den Text der Originalseite und vergleicht ihn mit dem OCR Text Rohtext Dabei werden Scanfehler korrigiert und Sonderzeichen erganzt Dieses eigentliche Korrekturlesen proofing findet in zwei oder drei Runden statt wobei jede Seite von zwei verschiedenen Teilnehmern bearbeitet wird Zu den hoheren Runden werden nur erfahrene Korrekturleser zugelassen Runden 4 und 5 Formatting Bearbeiten In der vierten und funften Runde werden Formatierungen hinzugefugt z B kursive Schrift Uberschriften Fussnoten Wahrend die Zugangshurden zur vierten Runde relativ gering sind haben zur funften Runde der zweiten des Formatierens nur erfahrene Teilnehmer Zugang Nachbearbeitung Post Processing Bearbeiten Die bisher unverbundenen Seiten des Rohtext werden automatisch zu einem Textdokument zusammengefasst Jeweils ein erfahrener Korrekturleser der den Status eines Post Processors erreicht hat vervollstandigt das Layout mit den Grafiken d h er passt diese an verbessert diese bzw erganzt noch mogliche Lucken im Text Er uberpruft das Dokument auf vollstandige Ubereinstimmung mit dem Originalwerk Schliesslich kann er ausser dem obligatorischen Textformat noch weitere Formate erzeugen vor allem HTML Veroffentlichung Bearbeiten Das Projekt wird beendet Das digitalisierte Werk wird auf dem Server von Project Gutenberg nicht zu verwechseln mit dem kommerziellen Anbieter Projekt Gutenberg DE veroffentlicht Jeder Internetnutzer kann nun dieses Werk herunterladen und lesen Das Werk steht damit der ganzen Welt zur Verfugung Bedeutung von Distributed Proofreaders BearbeitenIm Laufe der Zeit entwickelte sich Distributed Proofreading DP zur grossten Quelle von E Texten fur das Project Gutenberg so dass Distributed Proofreaders im Jahr 2002 offizieller Teil des Project Gutenberg wurde Bisher Marz 2017 wurden ca 33 500 Texte durch Distributed Proofreaders wiederveroffentlicht 3 im Januar 2011 waren es 19 500 Texte Die Texte entstammen keinen speziellen Sachgebieten es sind z B Literatur Wissenschaft Musiknoten Zeitschriften und populare Sachbucher vertreten um nur einige zu nennen DP 10K BearbeitenAm 9 Marz 2007 wurde von Distributed Proofreaders die Fertigstellung und Veroffentlichung der ersten 10 000 Texte bekannt gegeben Um dies zu feiern und die Vielfalt der in DP bearbeiteten Bucher aufzuzeigen wurde eine Auswahl von 15 Titeln zusammen veroffentlicht Slave Narratives Oklahoma A Folk History of Slavery in the United States From Interviews with Former Slaves by Work Projects Administration englisch Eighth annual report of the Bureau of ethnology 1891 N 08 1886 1887 by Powell John Wesley englisch R Caldecott s First Collection of Pictures and Songsby Caldecott Randolph Illustrator englisch Como atravessei Africa Volume II by Serpa Pinto portugiesisch Triplanetaryby Smith E E Doc englisch Heidiby Spyri Johanna englisch Heimatlosby Spyri Johanna deutsch Punch 1920 10 27by Punch englisch Sylva or A Discourse of Forest Treesby Evelyn John englisch Encyclopedia of Needleworkby Therese de Dillmont englisch The annals of the Cakchiquels Annalen der Cakchiquel by Francisco Ernantez Arana fl 1582 trans by and edit by Daniel G Brinton 1837 1899 englisch mit Central American Indian The Shanty Book Part I Sailor Shanties 1921 by Richard Runciman Terry 1864 1938 englisch Le marchand de Veniseby William Shakespeare trans Francois Guizot franzosisch Agriculture for beginners Rev ed by Burkett Charles William englisch Species Plantarum Part 1 by Carolus Linnaeus Carl von Linne lateinisch Weblinks BearbeitenHomepage des Grunders Charles Franks Bearbeitet Texte in allen Sprachen die das lateinische Alphabet verwenden sofern sie vor 1923 veroffentlicht wurden Grosste und aktivste DP Seite Distributed Proofreaders Canada Bearbeitet Texte die nach 1923 veroffentlicht wurden soweit der Autor vor mindestens 50 Jahren verstorben ist Neueste DP Seite Einzelnachweise Bearbeiten DP Welcome Abgerufen am 10 Marz 2017 englisch Team Germany Abgerufen am 25 Januar 2017 Distributed Proofreaders Abgerufen am 10 Marz 2017 Abgerufen von https de wikipedia org w index php title Distributed Proofreaders amp oldid 228055391