www.wikidata.de-de.nina.az
In der Informatik ist ein gewichteter binarer Suchbaum eine Auspragung der abstrakten Datenstruktur binarer Suchbaum bei der jedem Knoten neben Schlussel und anderen Daten ein Gewicht Zugriffswahrscheinlichkeit zukommt Der Vollstandigkeit halber kommt ein solches auch seinen Nachbarintervallen zu Ein binarer Suchbaum mit 2 Knoten und Gewichtsangaben rot Zu optimieren ist die gewichtete Pfadlange des Baums Das Gewicht ist an den Schlussel gebunden somit ergibt das Zulassen von mehreren Objekten Duplikaten mit gleichem Schlussel keinen Sinn Sind Gewichte uberhaupt nicht bekannt oder sind sie untereinander praktisch gleich dann sind hohen balancierte Baume eine gute Wahl Ein Beispiel ist der AVL Baum der als optimiert auf die gewichtete Pfadlange bei Einheitsgewichten angesehen werden kann Inhaltsverzeichnis 1 Beispiele 1 1 Geometrische Verteilung 1 2 Naturliche Vokabulare 1 3 Dynamische Gewichte 2 Zugriffsverteilung und gewichtete Pfadlange 3 Literatur 4 EinzelnachweiseBeispiele BearbeitenIst der Baum statisch spielen also Einfuge oder Entfernoperationen keine Rolle so bietet sich der Bellman Algorithmus an der einen optimalen gewichteten binaren Suchbaum konstruiert Seine Effizienz ist auch dann gegeben wenn die Gewichte nur ungefahr bekannt sind Geometrische Verteilung Bearbeiten Bei der geometrischen Gewichtsverteilung p i 1 q q i displaystyle p i 1 q q i nbsp fur i 0 1 displaystyle i 0 1 nbsp mit 0 lt q lt 1 displaystyle 0 lt q lt 1 nbsp gilt i 0 p i 1 displaystyle textstyle sum i geqq 0 p i 1 nbsp Ein Binarbaum sei wie folgt rekursiv aufgebaut Derjenige Schlussel wird zu einem der beiden Sohne und zur Wurzel des nachsten Teilbaums gemacht der das grosste verbleibende Gewicht hat Da es danach keinen Schlussel auf seiner Seite mehr gibt bleibt der andere Sohn leer Ein solcher Binarbaum hat die konstante gewichtete Pfadlange i 0 i 1 p i 1 1 q displaystyle textstyle sum i geqq 0 i 1 p i 1 1 q nbsp obwohl er einer linearen Liste entspricht Passt nun die Anordnung der Schlussel genau zu diesem Binarbaum so dass er ein binarer Suchbaum ist so ist er bei q gt 1 2 displaystyle q gt tfrac 1 2 nbsp optimal denn ein Herabstufen der Wurzel eines Teilbaums verschlechtert den Mittelwert Es gibt dann also sehr seltene Suchanfragen die beim optimalen gewichteten binaren Suchbaum in nur linearer Zeit beantwortet werden Naturliche Vokabulare Bearbeiten Im Englischen ist die Wahrscheinlichkeit fur das Vorkommen des i displaystyle i nbsp t haufigsten Wortes ungefahr a i i 1 12 i 1 i 1 12 displaystyle alpha i approx i 1 12 sum i geqq 1 i 1 12 nbsp Die gewichtete Pfadlange eines optimalen binaren Suchbaums fur alle englischen Worter ergibt sich zu ungefahr 10 2 displaystyle 10 2 nbsp Dynamische Gewichte Bearbeiten Sind Einfuge oder Entfernoperationen wichtig so sind im Prinzip auch die Gewichte zu pflegen Im Grenzfall sogar beim Aufsuchen da sich hierbei zumindest die Zugriffsstatistik andert Mehlhorn beschreibt Nahezu optimale binare Suchbaume Bei den Splay Baumen werden trotz vollig anderer Vorgehensweise ebenfalls die am haufigsten angesprochenen Knoten in die Nahe der Wurzel gespult Zugriffsverteilung und gewichtete Pfadlange Bearbeiten nbsp Abb 4 Optimaler binarer Suchbaum mit Gewichten rot Sei X x 1 lt x 2 lt lt x n displaystyle X left x 1 lt x 2 lt lt x n right nbsp eine Schlusselmenge aus einem total quasi geordneten Reservoir R displaystyle R nbsp von Schlusseln seien ferner p i displaystyle p i nbsp bzw q j displaystyle q j nbsp Haufigkeiten mit denen auf das Element x R displaystyle x in R nbsp oder Aquivalenzklasse resp Intervall zugegriffen wird wobei x x i displaystyle x in overline x i nbsp fur 1 i n displaystyle 1 leqq i leqq n nbsp resp x j lt x lt x j 1 displaystyle x j lt x lt x j 1 nbsp fur 0 j n displaystyle 0 leqq j leqq n nbsp Dabei seien x 0 displaystyle x 0 infty nbsp und x n 1 displaystyle x n 1 infty nbsp zusatzliche nicht zu R displaystyle R nbsp gehorende Elemente mit der ublichen Bedeutung Das 2 n 1 displaystyle 2n 1 nbsp Tupel z p 1 p 2 p n q 0 q 1 q 2 q n displaystyle mathfrak z left begin smallmatrix amp p 1 amp amp p 2 amp amp cdots amp amp p n amp q 0 amp amp q 1 amp amp q 2 amp amp cdots amp amp q n end smallmatrix right nbsp heisst Zugriffsverteilung 1 fur die Menge X displaystyle X nbsp wenn alle p i q j 0 displaystyle p i q j geqq 0 nbsp sind z displaystyle mathfrak z nbsp wird zur Zugriffswahrscheinlichkeitsverteilung wenn p i q j 1 displaystyle textstyle sum p i sum q j 1 nbsp ist Sei nun T displaystyle T nbsp ein Suchbaum fur die Menge X displaystyle X nbsp mit einer Zugriffsverteilung z displaystyle mathfrak z nbsp ferner sei a i T displaystyle a i T nbsp die Tiefe des inneren Knotens x i displaystyle x i nbsp und b j T displaystyle b j T nbsp die Tiefe des Blattes x j x j 1 displaystyle x j x j 1 nbsp s Abb 4 jeweils Binarer Suchbaum Terminologie der Abb 1B Wir betrachten die Suche nach einem Element x R displaystyle x in R nbsp Wenn x x i displaystyle x x i nbsp dann vergleichen wir x displaystyle x nbsp mit a i T 1 displaystyle a i T 1 nbsp Elementen im Baum Wenn x j lt x lt x j 1 displaystyle x j lt x lt x j 1 nbsp dann vergleichen wir x displaystyle x nbsp mit b j T displaystyle b j T nbsp Elementen im Baum Also ist S z T i 1 n p i a i T 1 j 0 n q j b j T displaystyle S mathfrak z T sum i 1 n p i a i T 1 sum j 0 n q j b j T nbsp die mit der Zugriffsverteilung z displaystyle mathfrak z nbsp gewichtete Pfadlangensumme des Baumes T displaystyle T nbsp ist z displaystyle mathfrak z nbsp eine Wahrscheinlichkeitsverteilung dann ist S z T displaystyle S mathfrak z T nbsp die gewichtete Pfadlange die gewichtete Suchtiefe oder die mittlere Anzahl der benotigten Vergleiche Die Abb 4 zeigt einen Suchbaum T displaystyle T nbsp der mit einem Wert von S z T 2 displaystyle S mathfrak z T 2 nbsp optimal fur die Zugriffsverteilung z 1 24 1 3 3 0 4 0 0 3 10 displaystyle mathfrak z tfrac 1 24 left begin smallmatrix amp 1 amp amp 3 amp amp 3 amp amp 0 amp 4 amp amp 0 amp amp 0 amp amp 3 amp amp 10 end smallmatrix right nbsp ist Literatur BearbeitenKurt Mehlhorn Datenstrukturen und effiziente Algorithmen Teubner Stuttgart 1988 ISBN 3 519 12255 3 Einzelnachweise Bearbeiten nach Mehlhorn a a O S 147Normdaten Sachbegriff GND 4157275 0 lobid OGND Anmerkung Ansetzungsform GND Gewichteter Binarbaum Abgerufen von https de wikipedia org w index php title Gewichteter binarer Suchbaum amp oldid 197047046