www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Belege fehlen SteEis Diskussion Bewertung Beitrage 22 05 7 Dez 2018 CET Die tokenbasierte Kompression englisch token based compression ist eine Methode um bei der Datenverarbeitung Speicherplatz zu sparen Dabei werden die Seiten eines Dokuments als eine Ansammlung aus im Dokument vorkommenden Symbolen Tokens reprasentiert Positionsinformationen geben an wo die Symbole erscheinen sollen Jedes Symbol ist hierbei eine Abbildung eines Teils des Dokuments etwa ein Buchstabe ein Wort oder eine Grafik Mehrfache Vorkommen desselben Zeichens im Dokument werden reprasentiert indem die Abbildung des Zeichens nur einmal verwendet wird Jede Seite des Dokuments spezifiziert welches Symbol auf ihr vorkommt und legt dessen Position fest Haufig wiederkehrende Schlusselworter werden durch Abkurzungen Tokens ersetzt Die Kompressionsraten bei diesem Verfahren sind recht hoch wenn der zu kodierende Text viele Wiederholungen enthalt Bei Eingaben mit wenigen oder gar keinen Wiederholungen ist die tokenbasierte Kompression ungeeignet Ausgangstext Print Hallo Print Hier Kodiertext 3F Hallo 3F Hier Siehe auch BearbeitenTokenisierung Abgerufen von https de wikipedia org w index php title Tokenbasierte Kompression amp oldid 183496678