www.wikidata.de-de.nina.az
Prediction by Partial Matching PPM englisch ist eine Familie anpassender statistischer Datenkompressionsalgorithmen die auf Kontextmodellen und Prognosen aufbaut PPM Modelle benutzen einen Satz von Symbolen aus dem vorangegangenen Symbolstrom um das nachste Symbol des Stromes vorherzusagen Voraussagen werden ublicherweise auf Wertungen der Symbole beschrankt Die Zahl vorhergehender Symbole n displaystyle n legt die Ordnung des PPM Modelles fest das als PPM n festgehalten wird Unbegrenzte Varianten ohne Beschrankungen der Lange des Kontextes existieren auch und werden mit PPM bezeichnet Wenn aufgrund aller n Kontextsymbole keine Vorhersage gemacht werden kann so wird eine Prognose aufgrund von n 1 displaystyle n 1 versucht Dieses Vorgehen wird wiederholt bis ein Treffer gefunden wird oder keine Symbole im Kontext verbleiben Zu diesem Zeitpunkt wird eine Vorhersage festgelegt Dieser Prozess ist die Umkehrung dessen gefolgt von dynamischen Markow Vorhersagen die von einem Modell der Ordnung 0 aufbauen Ein grosser Teil der Arbeit an der Optimierung eines PPM Modells betrifft den Umgang mit Eingaben die im Eingabestrom noch nicht auftraten Der offensichtliche Weg damit umzugehen besteht darin ein Unbekannt Symbol zu erzeugen das die Escape Sequenz auslost Doch welche Wahrscheinlichkeit soll einem Symbol zugeordnet werden das noch nie aufgetreten ist Dies wird das Problem der 0 Haufigkeit genannt Eine Vorgehensweise teilt dem Unbekannt Symbol einen festgelegten Pseudowert von 1 zu Eine PPM D genannte Variante erhoht den Pseudowert bei jedem Auftritt des Unbekannt Symbols Anders ausgedruckt schatzt PPM D also die Wahrscheinlichkeit eines neuen Symbols als das Verhaltnis der Anzahl einzigartiger Symbole zur Anzahl aller Symbole insgesamt Umsetzungen von Kompression mittels PPM sind in anderen Details sehr unterschiedlich Die eigentliche Symbolauswahl wird ublicherweise arithmetisch kodiert obwohl auch Huffman Kodierung oder auch eine Art Worterbuchkodierung moglich sind Das zugrunde liegende Modell der meisten PPM Algorithmen kann auch erweitert werden um mehrere Symbole vorherzusagen Es ist auch moglich andere als die Markow Modellerstellung zu verwenden um diese entweder ganz zu ersetzen oder zu erganzen Die Symbolgrosse ist fur gewohnlich statisch typischerweise ein einzelnes Byte was die generische Unterstutzung jeglicher Dateiformate leicht macht Veroffentlichungen uber Forschungen an dieser Algorithmusfamilie finden sich bis zuruck in die Mitte der 1980er Jahre Softwareumsetzungen erfreuten sich bis zu den fruhen 1990er Jahren keiner Beliebtheit da PPM Algorithmen eine beachtliche Menge an Arbeitsspeicher benotigen Neuere Umsetzungen von PPM finden sich unter den leistungsfahigsten verlustfreien Datenkompressionsverfahren fur Text in naturlichen Sprachen Der Versuch PPM Algorithmen zu verbessern fuhrte zu den PAQ Kompressionsalgorithmen Literatur BearbeitenJ Cleary I Witten Data Compression Using Adaptive Coding and Partial String Matching In Communications IEEE Transactions on Band 32 Nr 4 1984 S 396 402 doi 10 1109 TCOM 1984 1096090 A Moffat Implementing the PPM data compression scheme In Communications IEEE Transactions on Band 38 Nr 11 1990 S 1917 1921 doi 10 1109 26 61469 J G Cleary W J Teahan I H Witten Unbounded length contexts for PPM In Proceedings DCC 95 IEEE Computer Society Press 1995 cs waikato ac nz PDF Alternativ J G Cleary W J Teahan Unbounded Length Contexts for PPM In The Computer Journal Band 40 Nr 2 3 1997 S 67 75 doi 10 1093 comjnl 40 2 and 3 67 C Bloom Solving the problems of context modeling ZIP 43 kB W J Teahan Probability estimation for PPM In Proceedings NZCSRSC 95 1995 cotty 16x16 com Original Source from archive org abgerufen am 31 Januar 2023 Thomas Schurmann Peter Grassberger Entropy estimation of symbol sequences In Chaos An Interdisciplinary Journal of Nonlinear Science Band 6 Nr 3 1996 S 414 doi 10 1063 1 166191 arxiv cond mat 0203436v1 Weblinks BearbeitenPaket von PPM Kompressoren mit Benchmarks BICOM a bijective PPM compressor Arithmetic Coding Statistical Modeling Data Compression Part 2 PPMd compressor von Dmitri Shkarin Abgerufen von https de wikipedia org w index php title Prediction by Partial Matching amp oldid 230401140