www.wikidata.de-de.nina.az
Die Tunstall Kodierung ist eine Form der verlustfreien Datenkompression und Entropiekodierung die 1967 von Brian Parker Tunstall in seiner Doktorarbeit am Georgia Institute of Technology entwickelt wurde 1 Im Gegensatz zu ahnlichen Verfahren wie der Huffman Kodierung ordnet die Tunstall Kodierung einem Quellensymbol mit variabler Lange ein Codesymbol mit einer fixen Anzahl von Bits Stellen zu 2 Verfahren Bearbeiten nbsp Suchbaum im ersten IterationsschrittAls Beispiel soll die Datencodierung der Zeichenfolge hello world dienen Zur Vereinfachung sei weiters angenommen dass der Umfang der Quellsymbole das sogenannte Alphabet nur die 8 Symbole dehlorw umfassen soll In diesem Fall lasst sich die Auftrittswahrscheinlichkeit der einzelnen Zeichen in der zu codierenden Zeichenfolge direkt angeben Beispielsweise kommt das Zeichen l in der 11 Zeichen langen Zeichenfolge dreimal vor was einer Auftrittswahrscheinlichkeit von 3 11 entspricht Fur den ersten Iterationsschritt und den Aufbau des Suchbaums werden die einzelnen Auftrittswahrscheinlichkeiten aller 8 Quellsymbole bestimmt nbsp Suchbaum im zweiten IterationsschrittDurch weitere Iterationsschritte wird die Entropiecodierung verbessert Im zweiten Iterationsschritt wird aus dem Baum das Blatt mit der hochsten Auftrittswahrscheinlichkeit genommen in diesem Fall das Symbol l mit 3 11 und alle Wahrscheinlichkeiten fur das Symbol l gefolgt von einem der 8 weiteren moglichen Symbole gebildet Auch in diesem Fall werden die Auftrittswahrscheinlichkeiten der einzelnen Symbole bzw Symbolfolgen gebildet und absteigend im Baum sortiert wie in der zweiten Abbildung dargestellt So betragt die Auftrittswahrscheinlichkeit der Symbolfolge ll in diesem Beispiel 3 11 2 9 121 displaystyle left 3 over 11 right 2 9 over 121 nbsp Daraus folgen in Summe 15 verschiedene Codeworter welche mit log 2 15 4 displaystyle lceil log 2 15 rceil 4 nbsp Bits codiert werden koennen Die Schreibweise displaystyle lceil cdot rceil nbsp steht fur die sogenannte Gauss Klammer Beispielsweise ist wie in der Abbildung dargestellt dem Symbol h das Codewort w1 0000 zugeordnet Das Verfahren stoppt dann wenn die Anzahl der Codeworter eine anfangs festgelegte Grenze erreicht bzw uberschritten hat Hier ergibt sich also folgende Abbildung Wort Codew1 h 0000w2 e 0001w3 lh 0010w4 le 0011w5 ll 0100w6 lo 0101w7 l 0110w8 lw 0111w9 lr 1000w10 ld 1001w11 o 1010w12 1011w13 w 1100w14 r 1101w15 d 11101111Wurde die Tunstall Kodierung in diesem Beispiel nach dem zweiten Iterationsschritt mit einem Umfang von 15 Codewortern beendet werden wurde die Zeichenfolge hello world Tunstall kodiert folgende binare Codefolge darstellen darunter sind die zugeordneten Quellsymbole angegeben 0000 0001 0100 1010 1011 1100 1010 1101 1001 h e ll o w o r ldLiteratur BearbeitenMartin Bossert Angewandte Informationstheorie PDF 815 kB Skript zur Vorlesung Nicht mehr online verfugbar Universitat Ulm April 2007 archiviert vom Original abgerufen am 5 April 2013 Einzelnachweise Bearbeiten Brian Parker Tunstall Synthesis of noiseless compression codes Georgia Institute of Technology Dezember 1967 gatech edu Variable to fixed Length Source Coding Tunstall Codes PDF 715 kB Massachusetts Institute of Technology Oktober 1994 abgerufen am 5 April 2013 Abgerufen von https de wikipedia org w index php title Tunstall Kodierung amp oldid 231755278