www.wikidata.de-de.nina.az
Der Canterbury Corpus ist eine Sammlung von Dateien um die Leistung und den Kompressionsgrad verschiedener Kompressionsverfahren der verlustfreien Datenkompression zu messen Er wurde 1997 von der University of Canterbury entwickelt und soll den 1980 entwickelten Calgary Corpus ablosen Inhaltsverzeichnis 1 Zweck 2 Pakete 3 Weblinks 4 EinzelnachweiseZweck BearbeitenDer Canterbury Corpus wurde als Grundlage zur Anwendung von Metriken auf neu entwickelte Datenkompressionsverfahren entwickelt und dient in erster Linie zur Erstellung von Testfallen zum Testen der Algorithmen wahrend des Entwicklungszyklus Obwohl er prinzipiell auch zum Vergleich verschiedener Kompressionsverfahren eingesetzt werden kann distanzieren sich die Autoren hiervon ausdrucklich und verweisen auf ahnliche Sammlungen und Hilfsmittel 1 Daruber hinaus ist der Canterbury Corpus ausschliesslich fur den Test verlustfreier Kompressionsverfahren vorgesehen Pakete BearbeitenDer Canterbury Corpus besteht aus verschiedenen Paketen die je nach Testzweck und Algorithmus teilweise stark spezialisierte Daten enthalten So bietet das Paket The Canterbury Corpus elf Dateien in Text und Binarformaten u a einen Auszug aus einem Werk William Shakespeares und dient in erster Linie dem Vergleich des zu testenden Algorithmus mit bereits bestehenden anderen Kompressionsmethoden Die Pakete Artificial Large und Miscellaneous bieten Dateien mit synthetisch generierten Inhalten besonders grossen Dateien z B dem vollstandigen Inhalt des CIA World Fact Book oder rein numerischen Inhalten Diese Pakete dienen zum Testen eines Kompressionsverfahrens in besonderen Situationen Weblinks BearbeitenWebseite der Canterbury University zu Canterbury CorpusEinzelnachweise Bearbeiten https corpus canterbury ac nz purpose html Abgerufen von https de wikipedia org w index php title Canterbury Corpus amp oldid 226966858