www.wikidata.de-de.nina.az
Die lexikographische Ordnung ist eine Methode um aus einer linearen Ordnung fur einfache Objekte beispielsweise alphabetisch angeordnete Buchstaben eine lineare Ordnung fur zusammengesetzte Objekte beispielsweise aus Buchstaben zusammengesetzte Worter zu erhalten Das namengebende Beispiel ist die Anordnung der Worter in einem Lexikon Sie werden zunachst nach ihren Anfangsbuchstaben sortiert dann die Worter mit gleichen Anfangsbuchstaben nach dem jeweils zweiten Buchstaben usw Ist ein Wort ganz in einem anderen als Anfangsteil enthalten wie beispielsweise Tal in Talent so wird das kurzere Wort zuerst aufgefuhrt Die lexikographische Ordnung uber dem Standard Alphabet wird generell als derart selbstverstandlich angesehen dass man kurz und einfach von der alphabetischen Ordnung spricht Ein Suchbegriff kann ausserordentlich schnell in einer sehr grossen Menge von Suchbegriffen gefunden werden wenn diese nach einer totalen Ordnungsrelation sortiert ist Inhaltsverzeichnis 1 Definition 2 Beispiele 3 Mathematische Verwendung 3 1 Unendliche Folgen 3 2 Weitere Verallgemeinerung 3 3 Anwendung Ketten in der Potenzmenge einer Ordinalzahl 4 Verwendung in der Informatik 4 1 Vergleich langer numerischer Daten 4 2 Verwendung bei Bitketten 4 3 Verwendung bei Zeichenketten 5 Anwendung in der Mikrookonomik 6 Siehe auch 7 Literatur 8 AnmerkungenDefinition BearbeitenGegeben sei ein quasigeordnetes Alphabet S displaystyle Sigma leq nbsp d i eine Menge von Zeichen S displaystyle Sigma nbsp mit der Relation displaystyle leq nbsp 1 Eine Zeichenkette a a 1 a 2 displaystyle a a 1 a 2 ldots nbsp aus Zeichen dieses Alphabets 2 ist lexikographisch kleiner als eine Zeichenkette b b 1 b 2 displaystyle b b 1 b 2 ldots nbsp das heisst a displaystyle a nbsp liegt in der Sortierung vor b displaystyle b nbsp wenn beim komponentenweisen Vergleich Zeichen fur Zeichen Massgabe A das Zeichen a i displaystyle a i nbsp von a displaystyle a nbsp mit dem niedrigsten Index i displaystyle i nbsp in dem sich die beiden Zeichenketten unterscheiden echt kleiner ist als das entsprechende Zeichen b i displaystyle b i nbsp von b displaystyle b nbsp also a i b i b i a i displaystyle a i leq b i wedge b i not leq a i nbsp oder wennMassgabe B a displaystyle a nbsp ein Anfang von b displaystyle b nbsp d h a i b i b i a i displaystyle a i leq b i wedge b i leq a i nbsp fur alle verfugbaren i displaystyle i nbsp aber kurzer ist Meist wird fur die zusammengesetzte Relation dasselbe Vergleichszeichen displaystyle leq nbsp resp lt displaystyle lt nbsp fur die zugehorige Striktordnung wie im Alphabet S displaystyle Sigma nbsp verwendet da letztere Relation eine Einschrankung der ersteren ist und so Widerspruche nicht entstehen konnen Durch die lexikographische Zusammensetzung wird aus einer Quasiordnung im Alphabet eine Quasiordnung auf der Menge der Zeichenketten aus einer totalen Quasiordnung wieder eine totale Quasiordnung aus einer Halbordnung wieder eine Halbordnung und aus einer Totalordnung wieder eine Totalordnung der haufigste Fall Ein Spezialfall dieser Zusammensetzung ist die lexikographische Ordnung von Folgen einer festen endlichen Lange Dann wird die Massgabe B nicht benotigt Beispielsweise ist ein geordnetes Paar a 1 a 2 S 2 displaystyle a 1 a 2 in Sigma 2 nbsp lexikographisch kleiner als ein Paar b 1 b 2 S 2 displaystyle b 1 b 2 in Sigma 2 nbsp wenn entweder a 1 lt b 1 displaystyle a 1 lt b 1 nbsp oder a 1 b 1 displaystyle a 1 b 1 nbsp und a 2 lt b 2 displaystyle a 2 lt b 2 nbsp gilt Beispiele BearbeitenEin Beispiel fur eine derartige Ordnung ist die zeitliche Reihenfolge fur Zahlentripel Jahr Monat Tag Ein Datum X ist fruher als ein anderes Datum Y wenn entweder die Jahreszahl von X kleiner ist als die Jahreszahl von Y oder die Jahreszahlen gleich sind aber X in einem im Jahresverlauf fruheren Monat liegt oder die Jahreszahlen und Monate gleich sind aber der Tag von X kleiner als der Tag von Y ist Ein weiteres Beispiel ist die ubliche Rangfolge innerhalb eines Medaillenspiegels bei der als erstes Kriterium die Anzahl der Goldmedaillen ausschlaggebend ist bei gleicher Goldmedaillenzahl die Anzahl der Silbermedaillen und bei nochmaligem Gleichstand die Anzahl der Bronzemedaillen Land Gold nbsp Silber nbsp Bronze nbsp Land 1 10 5 7Land 2 8 7 4Land 3 8 5 7Land 4 5 3 7Land 5 5 3 2Mathematische Verwendung BearbeitenUnendliche Folgen Bearbeiten Die lexikographische Ordnung lasst sich auf unendliche Folgen fortsetzen 3 Eine Folge s i i N displaystyle s i i in mathbb N nbsp ist lexikographisch kleiner als eine Folge t i i N displaystyle t i i in mathbb N nbsp wenn beide Folgen vor einem Index k displaystyle k nbsp gleich sind aber s k lt t k displaystyle s k lt t k nbsp ist Besteht das Alphabet z B aus den Ziffern S 0 1 2 3 4 5 6 7 8 9 displaystyle Sigma 0 1 2 3 4 5 6 7 8 9 nbsp so kann die Folge als ein Dezimalbruch interpretiert werden der eine reelle Zahl zwischen 0 displaystyle 0 nbsp und 1 displaystyle 1 nbsp darstellt Die lexikographische Ordnung der Folgen entspricht im Wesentlichen der reellen Ordnung im Intervall 0 1 displaystyle 0 1 nbsp Allerdings haben die abzahlbar unendlich vielen abbrechenden Dezimalbruche die also an ihren Enden nur Ziffern 0 displaystyle 0 nbsp oder 9 displaystyle 9 nbsp haben zwei lexikographisch verschiedene Urbilder bspw 0 14 0 140 00 0 139 99 displaystyle 0 14 0 14000 ldots 0 13999 ldots nbsp aber lexikographisch 1 3 9 9 9 lt 1 4 0 0 0 displaystyle 1 3 9 9 9 ldots lt 1 4 0 0 0 ldots nbsp Weitere Verallgemeinerung Bearbeiten Das Prinzip kann weiter ausgedehnt werden auf Folgen in denen der Indexbereich eine beliebige wohlgeordnete Menge W displaystyle W nbsp ist In diesem Fall definiert man f lt g displaystyle f lt g nbsp fur Funktionen f g W X displaystyle f g colon W to X nbsp wobei X displaystyle X nbsp linear geordnet ist falls fur das minimale Element w displaystyle w nbsp des Definitionsbereiches W displaystyle W nbsp fur das sich f displaystyle f nbsp und g displaystyle g nbsp unterscheiden f w lt g w displaystyle f w lt g w nbsp gilt Die so entstandene Ordnung auf den Funktionen ist wieder linear geordnet Anwendung Ketten in der Potenzmenge einer Ordinalzahl Bearbeiten In der Mengenlehre wird oft der Spezialfall betrachtet bei dem die Indexmenge eine Ordinalzahl l displaystyle lambda nbsp ist und die Folgenglieder nur die Werte 0 displaystyle 0 nbsp oder 1 displaystyle 1 nbsp annehmen Diese Grundmenge wird mit 2 l displaystyle 2 lambda nbsp bezeichnet und sie steht in einer bijektiven Beziehung zu der Potenzmenge von l displaystyle lambda nbsp Eine Ordinalzahl wird immer als die Menge ihrer Vorganger Ordinalzahlen gesehen Einer Teilmenge X displaystyle X nbsp von l displaystyle lambda nbsp kann man die Funktion f X 2 l displaystyle f X in 2 lambda nbsp zuordnen fur die f X s 1 displaystyle f X sigma 1 nbsp wenn s X displaystyle sigma in X nbsp und f X s 0 displaystyle f X sigma 0 nbsp wenn s X displaystyle sigma not in X nbsp Umgekehrt kommt man von einer Funktion f 2 l displaystyle f in 2 lambda nbsp mit der Menge s l f s 1 displaystyle sigma in lambda f sigma 1 nbsp wieder zu einer Teilmenge von l displaystyle lambda nbsp Wir betrachten jetzt 2 l displaystyle 2 lambda nbsp mit der lexikographischen Ordnung wie sie oben definiert wurde Diese lineare Ordnung kann fur kombinatorische Fragen uber unendliche Kardinalzahlen verwendet werden Es gilt Fur jede wohlgeordnete Teilmenge S displaystyle S nbsp von 2 l displaystyle 2 lambda nbsp gilt S l displaystyle S leq lambda nbsp Zum Beweis durch Induktion nehmen wir an dass die Aussage fur alle Ordinalzahlen lt l displaystyle lt lambda nbsp bereits gegeben ist Ist m lt l displaystyle mu lt lambda nbsp so betrachten wir die Einschrankungen f m displaystyle f mid mu nbsp der Funktionen f 2 l displaystyle f in 2 lambda nbsp auf die Teilmenge m n lt m displaystyle mu nu lt mu nbsp Die Mengen S m f m f S displaystyle S mu f mid mu f in S nbsp sind dann wohlgeordnete Teilmengen der lexikographisch geordneten Mengen 2 m displaystyle 2 mu nbsp Aus der Induktionsvoraussetzung folgt dass S m m l displaystyle S mu leq mu leq lambda nbsp Jetzt nehmen wir wieder ein f in der wohlgeordneten Menge S 2 l displaystyle S subseteq 2 lambda nbsp und betrachten auch den direkten Nachfolger f S displaystyle f in S nbsp Wir definieren m f displaystyle mu f nbsp als das kleinste m l displaystyle mu in lambda nbsp mit f m f m displaystyle f mu neq f mu nbsp Dann gilt fur m lt m f displaystyle mu lt mu f nbsp stets f m f m displaystyle f mu f mu nbsp sowie f m f 0 displaystyle f mu f 0 nbsp und f m f 1 displaystyle f mu f 1 nbsp Zwei Funktionen f displaystyle f nbsp und g displaystyle g nbsp in 2 l displaystyle 2 lambda nbsp mit m f m m g displaystyle mu f mu mu g nbsp mussen sich schon unterhalb von m displaystyle mu nbsp unterscheiden Nehmen wir an dass f m g m displaystyle f mid mu g mid mu nbsp gilt Dann ist f m 0 displaystyle f mu 0 nbsp g m 0 displaystyle g mu 0 nbsp f m 1 displaystyle f mu 1 nbsp und g m 1 displaystyle g mu 1 nbsp Daraus folgt dass in der lexikographischen Ordnung auch f lt g displaystyle f lt g nbsp und g lt f displaystyle g lt f nbsp gilt und folglich f g displaystyle f leq g nbsp und g f displaystyle g leq f nbsp also f g displaystyle f g nbsp Die Mengen f 2 l m f m displaystyle f in 2 lambda mu f mu nbsp fur ein gegebenes m l displaystyle mu in lambda nbsp werden also jeweils durch die Einschrankung auf m displaystyle mu nbsp injektiv auf eine Teilmengen von S m displaystyle S mu nbsp abgebildet und haben somit auch nur eine Machtigkeit l displaystyle leq lambda nbsp Da aber S m l f S m f m displaystyle S bigcup mu in lambda f in S mu f mu nbsp ist S l l l displaystyle S leq lambda cdot lambda lambda nbsp bewiesen Verwendung in der Informatik BearbeitenDer Arbeitsspeicher eines Computers kennt eine kleinste adressierbare Einheit auch Speicherstelle genannt Ein Beispiel ist das Byte bestehend aus 8 Bits sie kann aber auch aus einer anderen Anzahl von Bits bestehen oder wenn die Maschine im Dezimalsystem rechnet eine Dezimalziffer beherbergen Zweckmassigerweise sind die Inhalte zweier Speicherstellen Bytes auf der untersten Maschinenebene immer miteinander im Sinne einer Totalordnung vergleichbar Zweckmassigerweise sind die Ziffern resp Buchstaben den Bitkombinationen eines Bytes so zugeordnet dass diese Ordnung mit der ublichen Ordnung im Ziffernsystem resp Alphabet ubereinstimmt Aufbauend auf diesem Grundbaustein eines Vergleichs lassen sich durch lexikographische Zusammensetzung zusammengesetzte Datentypen beispielsweise mehrstellige Zeichenketten miteinander vergleichen Korreliert die lexikographische Indizierung mit den Speicheradressen hat also das beim Vergleichen hoherrangige Byte die niedrigere Adresse dann geschieht der Vergleich im Big Endian Stil und im Little Endian Stil wenn das hoherrangige Byte die hohere Adresse hat Da sich der lexikographische Vergleich im gunstigsten Fall schon im ersten hochstrangigen Byte entscheidet ist er schneller wenn dieses erste Byte im unmittelbaren Zugriff liegt Vergleich langer numerischer Daten Bearbeiten Auf vielen neueren Maschinen werden numerische Datentypen fester Lange hardware massig im Little Endian Format gespeichert Fur die Motivation und die Maschinen Typen siehe den Artikel Byte Reihenfolge Fur diese kurzen Aggregate meist in der Lange 2 4 8 oder 16 Bytes gibt es entsprechende Maschineninstruktionen fur die Vergleiche Diese Instruktionen sind nicht zusammengesetzt so dass das lexikographische Prinzip nicht zum Zuge kommt Die Langzahlarithmetik unterstutzt das Rechnen mit ganzen Zahlen beliebiger Lange einer Lange die nur durch den verfugbaren Arbeitsspeicher begrenzt ist Der numerische Vergleich beginnt wie der lexikographische bei beiden Operanden am hochstrangigen Ende Dabei wird der Rang einer Stelle nicht von ihrem Abstand von diesem bestimmt sondern von ihrem Abstand vom niedrigstrangigen Ende der Einerstelle Vor dem Vergleich mussen also die Langen der beiden Operanden durch Auffullen mit fuhrenden Nullen angeglichen werden Danach werden beim numerischen wie beim lexikographischen Vergleich gleiche Range in beiden Operanden miteinander verglichen 4 Eine Auswahl von Langzahlarithmetik Implementierungen findet sich im Abschnitt Langzahlarithmetik Programmiersprachen Das Vergleichen ist in diesen Softwarepaketen verglichen mit den vier Grundrechenarten aber eher ein Abfallprodukt Die Verarbeitungsrichtung ist wie bei der Division von hochrangig zu niedrigrangig bei Addition Subtraktion und Multiplikation jedoch umgekehrt Beide Arten der Speicherung Big und Little Endian konnen bei diesen funf Operationen gut unterstutzt werden sofern auf beide Enden der Kette effizient zugegriffen werden kann Verwendung bei Bitketten Bearbeiten Konzeptionell sind Bitketten nichts anderes als Zeichenketten uber dem zweiziffrigen Alphabet S 0 1 displaystyle Sigma 0 1 nbsp Wird eine Bit Ziffer in mindestens einem Byte gespeichert dann entspricht die Implementierung und der lexikographische Vergleich den ublichen Zeichenketten Bei einer kompakteren Implementierung mit 1 Bit pro Ziffer also bspw 8 Bit Ziffern pro Byte oder 32 pro Wort kann es da alle Worter genau gleich viele Bits enthalten und eine Kette eine beliebige nicht negative Lange haben kann passieren dass im letzten niedrigstrangigen Wort unspezifizierte Bits anfallen sog Fullbits Wie bei den Zeichenketten startet der lexikographische Vergleich von Bitketten am Kettenanfang bei der hochstrangigen Komponente das ist Big Endian Stil und ist unabhangig von der Endianness der Maschine Auf Big Endian Maschinen hat das hochstrangige Wort den niedrigsten Index und der Vergleich geht in die hoheren Adressen wie bei den Zeichenketten Auf Little Endian Maschinen mussen jedoch wenn pro Wort die von der Maschine angebotenen Vergleichsinstruktionen verwendet werden sollen die Komponenten genau umgekehrt angeordnet sein und das hochstrangige Wort den hochsten Index haben der lexikographische Vergleich muss dort beginnen und sich zu den Bits niedrigeren Ranges und niedrigerer Adresse fortsetzen 5 Verwendung bei Zeichenketten Bearbeiten Beim Datentyp Zeichenkette ist die hochstrangige Komponente auf jedem Maschinentyp die erste mit der niedrigsten Adresse Zeichenketten sind also auch auf Little Endian Maschinen im Big Endian Stil gespeichert Recht gute Unterstutzung fur den lexikographischen Vergleich von Zeichenketten gibt es in C C mit strcmp 6 lexikographischer Vergleich unter Berucksichtigung unterschiedlicher Langen im Sinn der Massgabe B aber Einschrankung auf einen Zeichensatz Alphabet ohne das Abschlusszeichen null memcmp 7 lexikographischer Vergleich mit gleichen Byte Langen der beiden Zeichenketten voller Zeichensatz 8 wcscmp 9 lexikographischer Vergleich von 16 Bit wide strings 10 mit dem Basistyp wchar t unter Berucksichtigung unterschiedlicher Langen im Sinn der Massgabe B aber Einschrankung auf einen 2 Byte Zeichensatz Alphabet ohne das Abschlusszeichen wide null Anwendung in der Mikrookonomik Bearbeiten Siehe auch PraferenzrelationSei durch x i x i 1 x i 2 x i m displaystyle mathbf x i left x i 1 x i 2 ldots x i m right nbsp mit i a displaystyle i a nbsp das Guterbundel die Alternative x a displaystyle mathbf x a nbsp gegeben und mit i b displaystyle i b nbsp die Alternative x b displaystyle mathbf x b nbsp x b 2 displaystyle x b 2 nbsp ist entsprechend beispielsweise die Menge von Gut 2 im Guterbundel x b displaystyle mathbf x b nbsp Man bezeichnet eine Praferenz Indifferenz Relation R als lexikographisch wenn x a R x b displaystyle mathbf x a R mathbf x b nbsp dann und nur dann wenn entweder x a 1 gt x b 1 displaystyle x a 1 gt x b 1 nbsp oder x a 1 x b 1 displaystyle x a 1 x b 1 nbsp und zugleich x a 2 x b 2 displaystyle x a 2 geq x b 2 nbsp 11 Mit anderen Worten wird bei einer lexikographischen Praferenz Indifferenz Relation ein Guterbundel nur dann schwach gegenuber einem zweiten vorgezogen das heisst als mindestens so gut wie dieses angesehen wenn es mehr Einheiten vom ersten Gut enthalt oder hilfsweise falls beide Guterbundel gleich viele Einheiten von diesem Gut umfassen wenn es mehr Einheiten vom zweiten Gut beinhaltet Eigenschaften der lexikographischen Praferenzenordnung 12 Eine lexikographische Praferenzenordnung ist vollstandig asymmetrisch und folglich auch antisymmetrisch negativ transitiv und transitiv Zur Definition der Eigenschaften wird auf den Artikel Praferenzrelation verwiesen Eine lexikographische Praferenzenordnung kann nicht durch eine Nutzenfunktion reprasentiert werden Debreu 1959 13 Siehe auch BearbeitenUnicode Collation AlgorithmLiteratur BearbeitenAndreu Mas Colell Michael Whinston und Jerry Green Microeconomic Theory Oxford University Press Oxford 1995 ISBN 0 195 07340 1 James C Moore General equilibrium and welfare economics An introduction Springer Berlin u a 2007 ISBN 978 3 540 31407 3 auch online doi 10 1007 978 3 540 32223 8 Anmerkungen Bearbeiten In der Regel wird meist eine Totalordnung vorliegen Eine Quasiordnung ist lediglich die Minimalanforderung hier D h mengentheoretisch ist a S displaystyle a in Sigma nbsp ein Wort der Kleeneschen Hulle des Alphabets S displaystyle Sigma nbsp ebenso wie b displaystyle b nbsp Die abzahlbar unendlichen Folgen von Zeichen aus dem Alphabet S displaystyle Sigma nbsp werden mit S w displaystyle Sigma omega nbsp bezeichnet siehe w displaystyle omega nbsp ℵ 0 displaystyle aleph 0 nbsp Unter der Voraussetzung dass fuhrende Nullen unterdruckt sind entspricht die vorzeichenlose numerische Ordnung der quasi lexikographischen im Englischen quasi lexicographic radix length plus lexicographic oder shortlex order Die Umwandlung einer Bitkette in eine binare Langzahl mit dem niedrigstrangigen Bit an der Einerstelle bedingt auf Seite der Daten einen Rechts Shift um die Anzahl der Fullbits Ansonsten ist nur die Beschreibung zu andern Wie bei den binaren Langzahlen konnen bei Bitketten Verschiebungen und logischen Verknupfungen definiert werden dazu noch die Kettenoperationen wie Verketten Umkehren und Bildung von Teilketten strcmp en cppreference com abgerufen am 31 Marz 2017 Vorlage Cite web temporar memcmp en cppreference com abgerufen am 31 Marz 2017 Vorlage Cite web temporar Auf vielen binar orientierten Big Endian Maschinen kann eine Zeichenkette auch als vorzeichenlose unsigned Binarzahl aufgefasst werden Der zugehorige numerische Vergleich ordnet die Inhalte aber in etwas anderer Weise als der lexikographische der Zeichenketten s Vergleich langer numerischer Daten wcscmp en cppreference com abgerufen am 31 Marz 2017 Vorlage Cite web temporar The C99 standard draft TC3 Abgerufen am 31 Marz 2017 Vorlage Cite web temporar Vgl Mas Colell Whinston Green 1995 S 46 Vgl Moore 2007 S 14 Gerard Debreu Theory of value An axiomatic analysis of economic equilibrium John Wiley amp Sons New York 1959 Abgerufen von https de wikipedia org w index php title Lexikographische Ordnung amp oldid 232978979