www.wikidata.de-de.nina.az
Das Sammelbilderproblem Sammlerproblem Sammelalbenproblem oder Problem der vollstandigen Serie befasst sich mit der Frage wie viele Bilder einer Serie die man einzeln nicht gezielt sondern nur als zufallige Auswahl kaufen kann zu erwerben sind um ein Sammelalbum zu vervollstandigen Es kann als mathematisches Problem formuliert und seine Losung versucht werden Sport SammelbilderBeim klassischen Sammelbilderproblem geht man davon aus dass alle Bilder zufallig gemischt und verdeckt gekauft werden und alle Motive gleich haufig vorkommen Die letztere Voraussetzung ist aber beispielsweise bei Sammelkartenspielen nicht erfullt da hier das Vorkommen einzelner Karten stark variiert Es konnte zudem nachgewiesen werden dass bei vielen Sammelbilderserien die Bilder nicht zufallig gemischt werden Eine weitere wichtige Rolle spielt die Moglichkeit des Nachkaufens und Tauschens von Karten Das klassische Sammelbilderproblem ist in dieser allgemeinen Problemstellung bisher noch nicht gelost worden Mit Hilfsmitteln der Wahrscheinlichkeitstheorie sowie Monte Carlo Simulationen konnen Sammelstrategien optimiert werden um das Sammelalbum moglichst kostengunstig zu fullen Fur eine optimierte Sammelstrategie konnte eine Losung unter veranderten praxisrelevanten Annahmen gefunden werden Das Sammelbilderproblem ist aufgrund der Beliebtheit der Fussball Sammelalben eines der wenigen mathematischen Probleme uber die regelmassig in den Massenmedien berichtet und diskutiert wird Inhaltsverzeichnis 1 Geschichte 2 Das klassische Sammelbilderproblem 2 1 Annahmen 2 2 Wahrscheinlichkeitsverteilung der Fullung eines 4er Albums 2 2 1 Zahlenbeispiel 2 2 2 Verallgemeinerung fur m von N Bildern 2 3 Packchen 2 4 Wartezeit bis zum nachsten neuen Bild 2 5 Wahrscheinlichkeitsverteilung fur die Anzahl der Kaufe 2 5 1 Erwartungswert 2 5 2 Varianz 2 6 Anzahl der verschiedenen Bilder 2 6 1 Erwartungswert 2 6 2 Varianz 2 7 Nachkaufen 2 8 Tauschen 2 9 Kritik der klassischen Annahmen 2 10 Optimierte Sammelstrategie 3 Das allgemeine Sammelbilderproblem 4 Beispiele 4 1 Wurfel 4 2 Pokemon 4 3 Fussballsammelbilder 5 EinzelnachweiseGeschichte Bearbeiten nbsp Historisches Eishockey SammelbildDie Tradition von Sammelbildern reicht bis in das 19 Jahrhundert zuruck wo sie als Produktzugaben z B bei Schokolade oder Zigaretten aufkamen Eine Variante bestand darin dass Coupons gesammelt werden mussten und der Sammler nach Einsendung einer vollstandigen Serie eine Pramie erhielt 1 In den 1930er Jahren erschienen Bilder von Film oder Sportstars auf der Deckelinnenseite von Eiscremepackungen 2 Aber es gab auch schon fruh andere Sammelobjekte z B Buttons oder Figuren in Cornflakespackungen 3 Erst in den 1960er Jahren haben sich vermehrt Sammelalben etabliert bei denen die Bilder verdeckt in Tuten oder Packchen verkauft werden d h ohne dass der Sammler weiss welche Bilder er erhalt Mit der Einfuhrung von Fussballsammelalben vorangetrieben durch die Firma Panini wurde das Sammeln zu einem Massenphanomen insbesondere zu Welt oder Europameisterschaften Mittlerweile sind Sammelalben zu Standard Merchandising Artikeln z B fur Kinofilme geworden Die grundlegenden kombinatorischen Betrachtungen gehen bereits auf Markow zuruck 4 Die konkrete mathematische Behandlung begann 1930 mit George Polya der das Problem aus Sicht des Herstellers darstellt Jede Packung unserer Ware enthalt zwei verschiedene Blumenbilder die volle Kollektion umfasst 72 verschiedene Blumenbilder Wer eine volle Kollektion sammelt und einsendet erhalt kostenlos eine Pramie Der Verkaufer der solche Reklame macht muss sich vernunftigerweise die Frage vorlegen Wie gross ist die Durchschnittszahl der verkauften Packungen pro Pramie 1 Diese Arbeit pragte daher den Namen als Coupon Collector s Problem Teilweise wurde es auch als Dixie Cup Problem 5 bezeichnet nach den Eiscremebechern die nach der Herstellerfirma als Dixie Cup bezeichnet wurden Beginnend mit William Fellers Standardwerk zur Wahrscheinlichkeitstheorie 6 haben sich zahlreiche Mathematiker mit dem Sammelbilderproblem beschaftigt Dadurch hat sich das Sammelbilderproblem als klassische mathematische Aufgabe etabliert Manchmal wird die Aufgabe auch als Sammelbilderparadoxon bezeichnet weil uberraschend viele Bilder benotigt werden um das Album ohne Tauschen oder Nachkaufen zu vervollstandigen Fur Polyas Blumenbilderkollektion muss man im Durchschnitt 174 Packchen also 348 Blumenbilder sammeln bei nur 72 unterschiedlichen Bildern fur das Sammelalbum zur Fussball Europameisterschaft 2016 benotigt man sogar 4828 Bilder bei 680 unterschiedlichen Bildern offenbar wachst das Verhaltnis der im Mittel benotigten Bilder zur Anzahl der unterschiedlichen Bilder starker als linear Das klassische Sammelbilderproblem BearbeitenDas klassische Sammelbilderproblem stellt die Frage wie viele Sammelbilder ein Einzelsammler im Mittel kaufen muss um eine vollstandige Serie von n displaystyle n nbsp Sammelbildern zu erhalten wenn er auf Tauschen und Nachkaufen verzichtet und jedes Bild einzeln kauft 7 Schon Polya hatte die klassische Aufgabe definiert und wie folgt begrundet Die Kaufer tauschen ihre Bilder aus oder werfen sie fort der Verkaufer kann ein Bild vorenthalten usw Wie man sieht kann die Nichterfullung der Voraussetzungen sowohl die eine als auch die andere Partei begunstigen und eben deshalb scheint mir die Berechnung der Durchschnittszahl unter den besagten Voraussetzungen zumindest als erste Orientierung einen gewissen Wert zu haben 1 Annahmen Bearbeiten Im klassischen Sammelbilderproblem werden die folgenden Annahmen getroffen 7 8 A1 Die Bilder werden bei der Herstellung gut gemischt d h rein zufallig auf die Packchen verteilt A2 Alle Bilder kommen gleich haufig vor A3 In einem Packchen kommt kein Bild doppelt vor Der Ergebnisraum kann als Menge der moglichen Sammelbilderfolgen definiert werden W w w 1 w 2 w i 1 2 n displaystyle Omega omega omega 1 omega 2 ldots omega i in 1 2 ldots n nbsp nbsp Urnenmodell des Sammelbilderproblems mit sechs BildernMathematisch entspricht das Sammelbilderproblem einem Urnenmodell mit Zurucklegen und zwar bedeuten die gezogenen Zahlen die Nummern der Sammelbilder Gesucht wird die Anzahl der Ziehungen die notig ist bis jede Zahl mindestens einmal gezogen wurde Dies bedeutet dass die einzelnen gezogenen Nummern der Sammelbilder eine diskrete Gleichverteilung besitzen Wahrscheinlichkeitsverteilung der Fullung eines 4er Albums Bearbeiten Gesucht ist die Wahrscheinlichkeit W 4 k displaystyle W 4 k nbsp mit dem k displaystyle k nbsp ten Kauf ein 4er Album zu fullen Die Bilder kommen beim Kauf gleich haufig vor Die Wahrscheinlichkeit ein bestimmtes Bild zu kaufen ist also p p 1 p 2 p 3 p 4 1 4 displaystyle p p 1 p 2 p 3 p 4 frac 1 4 nbsp Wir betrachten die Situation vor dem k displaystyle k nbsp ten Kauf die das Album fullt W 4 k 1 displaystyle W 4 k 1 nbsp ist die Wahrscheinlichkeit einer Multinomialverteilung dass beim k 1 displaystyle k 1 nbsp ten Kauf genau ein Bild fehlt also jedes der 3 anderen Bilder schon mindestens einmal in der Sammlung vorhanden ist W 4 k 1 n 1 n 2 n 3 k 1 k 1 n 1 n 2 n 3 1 4 k 1 n 1 n 2 n 4 k 1 k 1 n 1 n 2 n 4 1 4 k 1 n 1 n 3 n 4 k 1 k 1 n 1 n 3 n 4 1 4 k 1 n 2 n 3 n 4 k 1 k 1 n 2 n 3 n 4 1 4 k 1 displaystyle begin aligned W 4 k 1 amp sum n 1 n 2 n 3 k 1 frac k 1 n 1 cdot n 2 cdot n 3 cdot left frac 1 4 right k 1 amp sum n 1 n 2 n 4 k 1 frac k 1 n 1 cdot n 2 cdot n 4 cdot left frac 1 4 right k 1 amp sum n 1 n 3 n 4 k 1 frac k 1 n 1 cdot n 3 cdot n 4 left frac 1 4 right k 1 amp sum n 2 n 3 n 4 k 1 frac k 1 n 2 cdot n 3 cdot n 4 cdot left frac 1 4 right k 1 end aligned nbsp Die Summationsindizes n 1 displaystyle n 1 nbsp n 2 displaystyle n 2 nbsp n 3 displaystyle n 3 nbsp n 4 displaystyle n 4 nbsp geben jeweils die Anzahl der Exemplare der einzelnen Bilder an n 1 displaystyle n 1 nbsp ist die Anzahl der Exemplare des 1 Bilds n 2 displaystyle n 2 nbsp ist die Anzahl der Exemplare des 2 Bilds usw Die Summationsindexe sind naturliche Zahlen grosser oder gleich 1 Zur Berechnung der ersten Einzelwahrscheinlichkeit wird uber alle k 2 N 2 k 2 N 2 k N displaystyle tbinom k 2 N 2 tfrac k 2 N 2 cdot k N nbsp Darstellungen n 1 n 2 n 3 displaystyle n 1 n 2 n 3 nbsp summiert sodass die Summe dieser N 1 3 displaystyle N 1 3 nbsp positiven ganzen Zahlen gleich k 1 displaystyle k 1 nbsp ist Entsprechendes gilt fur die anderen Einzelwahrscheinlichkeiten Weil die 4 Einzelwahrscheinlichkeiten fur W 4 k 1 displaystyle W 4 k 1 nbsp gleich sind kann man den obigen Ausdruck vereinfachen W 4 k 1 k 1 4 k 2 i 1 i 2 i 3 k 1 1 i 1 i 2 i 3 displaystyle W 4 k 1 frac k 1 4 k 2 sum i 1 i 2 i 3 k 1 frac 1 i 1 cdot i 2 cdot i 3 nbsp Es fehlt genau ein Bild d h mit dem k displaystyle k nbsp ten Kauf wird unabhangig vom fehlenden Bild das Album mit der Wahrscheinlichkeit 1 4 displaystyle tfrac 1 4 nbsp gefullt Daraus ergibt sich die gesuchte Wahrscheinlichkeit W 4 k 1 4 W 4 k 1 k 1 4 k 1 i 1 i 2 i 3 k 1 1 i 1 i 2 i 3 displaystyle W 4 k frac 1 4 cdot W 4 k 1 frac k 1 4 k 1 sum i 1 i 2 i 3 k 1 frac 1 i 1 cdot i 2 cdot i 3 nbsp Dieses Resultat kann leicht auf ein Album mit N displaystyle N nbsp Bildern verallgemeinert werden Fur p p 1 p N 1 N displaystyle p p 1 ldots p N frac 1 N nbsp gilt dann W N k k 1 N k 1 i 1 i N 1 k 1 1 j 1 N 1 i j displaystyle W N k frac k 1 N k 1 sum i 1 i N 1 k 1 frac 1 prod j 1 N 1 i j nbsp Diese Verteilung ist eine Verallgemeinerung der negativen Binomialverteilung 9 mit welcher man das Sammelbilderproblem fur den Fall N 2 displaystyle N 2 nbsp beschreiben kann Wenn k lt N displaystyle k lt N nbsp ist kann ein Album mit N displaystyle N nbsp Bildern mit dem k displaystyle k nbsp ten Kauf offensichtlich nicht vervollstandigt werden Dann ist W k 0 displaystyle W k 0 nbsp weil dann die durch das Summenzeichen definierte Summe leer also gleich 0 ist Um die Wahrscheinlichkeit dass das Album nicht mit dem k displaystyle k nbsp ten Kauf sondern nach k displaystyle k nbsp Kaufen also spatestens mit dem k displaystyle k nbsp ten Kauf vollstandig ist zu bestimmen muss die Summe i 1 k W i displaystyle sum limits i 1 k W i nbsp gebildet werden Wegen W k 0 displaystyle W k 0 nbsp fur k lt N displaystyle k lt N nbsp ist i 1 k W i i N k W i displaystyle sum limits i 1 k W i sum limits i N k W i nbsp Fur k lt N displaystyle k lt N nbsp ist auch die summierte Wahrscheinlichkeit offensichtlich gleich 0 Die summierte Wahrscheinlichkeit kann auch einfacher mit der Formel P N k i 1 N 1 N i N i i N k displaystyle P N k sum limits i 1 N 1 N i cdot binom N i cdot left frac i N right k nbsp berechnet werden Die Einzelwahrscheinlichkeit mit dem k displaystyle k nbsp ten Kauf das Album mit N displaystyle N nbsp Bildern zu vervollstandigen ist also gleich 10 11 P N k P N k 1 i 1 N 1 N i N i i N k 1 i N 1 displaystyle P N k P N k 1 sum limits i 1 N 1 N i cdot binom N i cdot left frac i N right k 1 cdot left frac i N 1 right nbsp Zahlenbeispiel Bearbeiten Die Wahrscheinlichkeit dass das 4er Album nach 12 Kaufen vollstandig ist betragt P 4 12 i 1 4 1 4 i 4 i i 4 12 0 875 displaystyle P 4 12 sum limits i 1 4 1 4 i cdot binom 4 i cdot left frac i 4 right 12 approx 0 875 nbsp Die Einzelwahrscheinlichkeit das 4er Album mit dem 12 Kauf zu vervollstandigen ergibt sich als Differenz aus dieser und der Wahrscheinlichkeit dass das Album schon nach dem 11 Kauf vollstandig ist P 4 12 P 4 11 i 1 4 1 4 i 4 i i 4 11 i 4 1 0 040 8 displaystyle P 4 12 P 4 11 sum limits i 1 4 1 4 i cdot binom 4 i cdot left frac i 4 right 11 cdot left frac i 4 1 right approx 0 0408 nbsp Verallgemeinerung fur m von N Bildern Bearbeiten Diese Formel lasst sich verallgemeinern Die Wahrscheinlichkeit dass nach k displaystyle k nbsp Kaufen also spatestens mit dem k displaystyle k nbsp ten Kauf m displaystyle m nbsp der N displaystyle N nbsp Bilder mindestens einmal vorkommen ist P N k m N m i 1 m 1 m i m i i N k displaystyle P N k m binom N m cdot sum limits i 1 m 1 m i cdot binom m i cdot left frac i N right k nbsp Fur den Spezialfall m N displaystyle m N nbsp ergibt sich die oben erwahnte summierte Wahrscheinlichkeit P N k displaystyle P N k nbsp Die Wahrscheinlichkeit dass schon nach k 1 displaystyle k 1 nbsp Kaufen m displaystyle m nbsp der N displaystyle N nbsp Bilder mindestens einmal vorkommen ist nach Definition P N k 1 m displaystyle P N k 1 m nbsp und die Wahrscheinlichkeit dass beim nachsten Kauf kein neues Bild hinzukommt ist m N P N k 1 m displaystyle frac m N cdot P N k 1 m nbsp Die Differenz ist also die Einzelwahrscheinlichkeit mit dem k displaystyle k nbsp ten Kauf zum ersten Mal m displaystyle m nbsp verschiedene Bilder zu erhalten P N k m m N P N k 1 m N m i 1 m 1 m i m i i N k 1 i m N displaystyle P N k m frac m N cdot P N k 1 m binom N m cdot sum limits i 1 m 1 m i cdot binom m i cdot left frac i N right k 1 cdot frac i m N nbsp Packchen Bearbeiten Sammelbilder werden in der Regel nicht einzeln sondern in Packchen mit s displaystyle s nbsp Bildern haufig auch Tuten oder Booster genannt verkauft Dabei wird vom Hersteller garantiert dass innerhalb eines Packchens kein Bild mehrfach vorkommt Es wurde bewiesen dass Annahme A3 fur die Sammelbilder der Firma Panini aufgrund des speziellen Verpackungsprozesses mit der Verpackungsmaschine Fifimatic erfullt ist 8 Die allgemeine Losung ist komplizierter 12 7 aber der Vergleich der Ergebnisse ergibt dass der Effekt der Packchen eher gering ist wenn die Packchengrosse s displaystyle s nbsp im Verhaltnis zur Gesamtzahl n displaystyle n nbsp der Sammelbilder klein ist Dies bedeutet fur die meisten praktischen Anwendungen dass die Packchengrosse vernachlassigt werden kann denn die Wahrscheinlichkeit P M displaystyle P M nbsp fur das Ereignis M displaystyle M nbsp dass es in einem Packchen mindestens ein mehrfach vorkommendes Sammelbild gibt betragt wie beim Geburtstagsparadoxon P M 1 n n s n s 1 i n s 1 n i n s 1 i n s 1 n i n 1 n n n 1 n n 2 n n s 1 n displaystyle P M 1 frac n n s cdot n s 1 frac prod i n s 1 n i n s 1 prod i n s 1 n frac i n 1 left frac n n cdot frac n 1 n cdot frac n 2 n cdot ldots cdot frac n s 1 n right nbsp Die Wahrscheinlichkeit P M displaystyle P overline M nbsp fur das Gegenereignis M displaystyle overline M nbsp siehe Ereignis Wahrscheinlichkeitstheorie Komplement und Differenz dass jedes Bild der Sammelbilderserie hochstens einmal im Packchen vorkommt betragt P M n n s n s displaystyle P overline M frac n n s cdot n s nbsp Wartezeit bis zum nachsten neuen Bild Bearbeiten Die Zufallsvariable X i w displaystyle X i omega nbsp ordnet jedem Ergebnis w W displaystyle omega in Omega nbsp die Anzahl der Kaufe zu die gemacht werden mussen um nach der i 1 displaystyle i 1 nbsp ten verschiedenen Karte wieder eine neue von den bisher gekauften verschiedene i displaystyle i nbsp te Karte zu bekommen Dies entspricht der Wartezeit bis zum nachsten neuen Bild 13 nbsp Histogramm einer Simulation 100 000 Realisierungen am Beispiel von 150 Karten Man erkennt die grosse Streuung Im schlechtesten Fall mussten 2522 Karten gekauft werden Da beim ersten Kauf sicher ein neues Bild kommt ist die Wahrscheinlichkeit P X 1 1 1 displaystyle P X 1 1 1 nbsp Beim Kauf des zweiten Bildes ist sie P X 2 1 n 1 n displaystyle P X 2 1 tfrac n 1 n nbsp Diese Zufallsvariable ist geometrisch verteilt Allgemein ergibt sich P X i k i 1 n k 1 n i 1 n displaystyle P X i k left frac i 1 n right k 1 cdot left frac n i 1 n right nbsp Als Erwartungswert fur X i displaystyle X i nbsp ergibt sich E X i n n i 1 displaystyle operatorname E X i frac n n i 1 nbsp Dies bedeutet insbesondere dass man um das letzte fehlende Bild der Sammlung zu erhalten im Mittel n displaystyle n nbsp Bilder kaufen muss Das sind aber genauso viele Bilder wie man uberhaupt sammeln muss und erklart warum das Sammeln ohne Tauschen und Nachkaufen so teuer ist Wahrscheinlichkeitsverteilung fur die Anzahl der Kaufe Bearbeiten Die Zufallsvariable X i 1 n X i displaystyle X sum limits i 1 n X i nbsp gibt an wie viele Kaufe gemacht werden mussen um alle n displaystyle n nbsp Karten zu besitzen Dies ist die Summe der Wartezeiten Anzahl der Kaufe fur die 1 2 3 n displaystyle n nbsp te Karte die von den bisher gekauften Karten verschieden ist Die stochastisch unabhangigen Zufallsvariablen X i displaystyle X i nbsp sind jeweils geometrisch verteilt Ihre Summe X displaystyle X nbsp besitzt eine diskrete Phasenverteilung Die Wahrscheinlichkeitsverteilung kann durch Auswertung der zugehorigen Markow Kette 14 oder rekursiv 15 berechnet werden Im allgemeineren Fall gibt die Zufallsvariable X n m i 1 m X i displaystyle X n m sum limits i 1 m X i nbsp an wie viele Kaufe gemacht werden mussen um genau m displaystyle m nbsp der n displaystyle n nbsp Karten zu besitzen Erwartungswert Bearbeiten nbsp Mittlere Anzahl S benotigter Bilder Erwartungswert fur eine vollstandige Serie aus n Bildern mit Standardabweichung grau Weil die einzelnen Erwartungswerte E X i displaystyle operatorname E X i nbsp existieren existiert auch der Erwartungswert E X displaystyle operatorname E X nbsp fur die neue Zufallsvariable E X E i 1 n X i i 1 n E X i displaystyle operatorname E X operatorname E left sum limits i 1 n X i right sum limits i 1 n operatorname E X i nbsp Das folgt aus der Linearitat des Erwartungswerts Dann gilt E X n n n n 1 n n 2 n 1 n H n mit H n k 1 n 1 k displaystyle operatorname E X frac n n frac n n 1 frac n n 2 ldots frac n 1 n cdot H n quad text mit quad H n sum k 1 n frac 1 k nbsp H n displaystyle H n nbsp ist die n displaystyle n nbsp te Partialsumme der harmonischen Reihe H n displaystyle H n nbsp ist also der Faktor der angibt wie viel Mal mehr Bilder man kaufen muss im Vergleich zur Grosse n displaystyle n nbsp des Sammelalbums Fur grosse n displaystyle n nbsp gilt die Naherung durch den naturlichen Logarithmus H n ln n g displaystyle H n approx ln n gamma nbsp mit der Euler Mascheroni Konstante g 0 577 displaystyle gamma approx 0 577 nbsp also E X n ln n 0 577 displaystyle operatorname E X approx n cdot ln n 0 577 nbsp Der Erwartungswert fur die Wartezeit im allgemeineren Fall dass genau m displaystyle m nbsp der n displaystyle n nbsp Karten vorkommen ist E X n m E i 1 m X i i 1 m E X i n n n n 1 n n 2 n n m 1 n H n H n m n ln n ln n m displaystyle operatorname E X n m operatorname E left sum limits i 1 m X i right sum limits i 1 m operatorname E X i frac n n frac n n 1 frac n n 2 ldots frac n n m 1 n cdot H n H n m approx n cdot ln n ln n m nbsp Varianz Bearbeiten Da die Wartezeiten auf die jeweils nachsten neuen Bilder geometrisch verteilt und unabhangig sind ergibt sich mit q i P X i 1 n i 1 n displaystyle q i P X i 1 frac n i 1 n nbsp fur die Varianz Var X displaystyle operatorname Var X nbsp der Anzahl der zu sammelnden Bilder die endliche Summe Var X 1 q 1 q 1 2 1 q 2 q 2 2 1 q n q n 2 i 1 n 1 q i 2 1 q i i 1 n 1 q i 2 i 1 n 1 q i i 1 n n n i 1 2 i 1 n n n i 1 n 2 n 2 n 2 n 1 2 n 2 1 2 n n n n 1 n 1 n 2 1 1 2 1 2 2 1 n 2 n 1 1 1 2 1 n lt n 2 p 2 6 n ln n n g O 1 displaystyle begin aligned operatorname Var X amp frac 1 q 1 q 1 2 frac 1 q 2 q 2 2 ldots frac 1 q n q n 2 sum i 1 n left frac 1 q i 2 frac 1 q i right sum i 1 n frac 1 q i 2 sum i 1 n frac 1 q i sum i 1 n left frac n n i 1 right 2 sum i 1 n frac n n i 1 amp left frac n 2 n 2 frac n 2 n 1 2 ldots frac n 2 1 2 right left frac n n frac n n 1 ldots frac n 1 right amp n 2 cdot left frac 1 1 2 frac 1 2 2 ldots frac 1 n 2 right n cdot left frac 1 1 frac 1 2 ldots frac 1 n right amp lt n 2 cdot frac pi 2 6 n cdot ln n n cdot gamma mathcal O 1 end aligned nbsp Die letzte Ungleichung folgt aus der Konvergenz unendlichen Reihe n 1 1 n 2 1 1 2 1 2 2 1 3 2 p 2 6 displaystyle sum n 1 infty frac 1 n 2 frac 1 1 2 frac 1 2 2 frac 1 3 2 ldots frac pi 2 6 nbsp des sogenannten Basler Problems und der asymptotischen Entwicklung der harmonischen Reihe Im abgebildeten Koordinatensystem wachst die Standardabweichung mit n displaystyle n nbsp stark an Anzahl der verschiedenen Bilder Bearbeiten Die Wahrscheinlichkeit dass der Kaufer nach k displaystyle k nbsp Kaufen ein bestimmtes der n displaystyle n nbsp Bilder besitzt sei P k displaystyle P k nbsp Am einfachsten ist es zuerst die Wahrscheinlichkeit zu berechnen dass das Bild nach k displaystyle k nbsp Kaufen noch nicht vorhanden ist d h dass alle k displaystyle k nbsp Karten eines der anderen n 1 displaystyle n 1 nbsp Bilder zeigen Diese Wahrscheinlichkeit ist n 1 n k displaystyle left tfrac n 1 n right k nbsp Gesucht ist die Wahrscheinlichkeit fur das Gegenereignis also P k 1 n 1 n k displaystyle P k 1 left tfrac n 1 n right k nbsp Erwartungswert Bearbeiten Ist die Zufallsvariable Y k displaystyle Y k nbsp definiert als die Anzahl der verschiedenen Bilder die nach k displaystyle k nbsp Kaufen vorkommen dann ist diese Zufallsvariable binomialverteilt mit der Erfolgswahrscheinlichkeit P k displaystyle P k nbsp Fur den Erwartungswert gilt dann E Y k n P k n 1 n 1 n k displaystyle operatorname E Y k n cdot P k n cdot left 1 left tfrac n 1 n right k right nbsp Varianz Bearbeiten Fur die Varianz der Anzahl der verschiedenen Bilder nach k displaystyle k nbsp Kaufen gilt Var Y k n P k 1 P k n n 1 n k 1 n 1 n k displaystyle operatorname Var Y k n cdot P k cdot 1 P k n cdot left tfrac n 1 n right k cdot left 1 left tfrac n 1 n right k right nbsp Nachkaufen Bearbeiten Die meisten Hersteller bieten an eine bestimmte Anzahl K displaystyle K nbsp von Bildern haufig 50 nachzukaufen in der Regel zu einem erhohten Preis Ausserdem kann man gezielt bestimmte Sammelbilder kaufen z B in speziellen Sammlerborsen oder Online Shops Die wichtige Frage ist wann sich Nachkaufen lohnt Fehlen noch x displaystyle x nbsp Bilder und ein bestimmtes Bild wird zum Preis von k displaystyle k nbsp angeboten so lohnt sich der Kauf wenn im Mittel die Kosten geringer sind als die Kosten fur das nachste Bild beim normalen Sammeln Sei b displaystyle b nbsp der normale Preis eines einzelnen Bildes so lohnt sich der Kauf 16 wenn b n x gt k displaystyle b cdot frac n x gt k nbsp Wenn die Moglichkeit besteht K displaystyle K nbsp Bilder nachzukaufen so lohnt es sich am meisten diese komplett am Ende nachzukaufen Man musste sonst im Mittel 17 n 1 n 2 n 3 n K n H K displaystyle frac n 1 frac n 2 frac n 3 ldots frac n K n cdot H K nbsp Bilder kaufen statt K displaystyle K nbsp Bilder nachzukaufen und dieser Spareffekt kann sehr gross sein 18 Die erwartete Anzahl der zu kaufenden Bilder reduziert sich auf S n H n H K K n ln n ln K K n ln n K K displaystyle S n cdot H n H K K approx n cdot ln n ln K K n cdot ln left frac n K right K nbsp Dies bedeutet dass der Faktor drastisch reduziert und in erster Naherung nur noch vom Verhaltnis der Albumgrosse zur Anzahl der Nachkaufbilder abhangt und nicht direkt von der Albumgrosse 16 Dies ermoglicht eine vereinfachte Berechnung der mittleren Kosten des Sammelalbums Tauschen Bearbeiten Eine weitere wichtige Erweiterung ist das Tauschen von doppelt im Besitz befindlichen Karten Dies geschieht traditionell im Freundeskreis zunehmend aber auch in organisierten Tauschborsen z B uber das Internet In der mathematischen Modellierung wird in der Regel das faire Tauschen betrachtet d h es wird jeweils ein Bild gegen ein anderes getauscht Auch wird angenommen dass die m displaystyle m nbsp Tauschpartner kooperieren und solange gemeinsam sammeln und fair tauschen bis jeder Sammler sein Album gefullt hat Dies entspricht dem Fall dass ein Sammler m displaystyle m nbsp Sammelalben vervollstandigt Fur diesen Fall wurde bisher keine geschlossene Losung gefunden am Beispiel des WM Albums wurde per Simulation gezeigt 19 dass der Effekt erheblich ist Asymptotisch gilt fur den Mittelwert bei einer festen Anzahl m displaystyle m nbsp von Tauschpartnern 5 S m n ln n m 1 n ln ln n O n displaystyle S m n cdot ln n m 1 cdot n cdot ln ln n mathcal O n nbsp fur n displaystyle n to infty nbsp Dies zeigt den Effekt des Tauschens Wahrend der erste Sammler im Mittel n ln n displaystyle n cdot ln n nbsp Karten kaufen muss 20 braucht jeder weitere Sammler im Mittel nur n ln ln n displaystyle n cdot ln ln n nbsp zusatzlich zu kaufen Mit dieser Formel kann man grob abschatzen wie viel Geld man durch das Tauschen sparen kann Z B wurden sich die Kosten fur zwei Tauschpartner durch faires Tauschen auf etwa 60 der Kosten eines Einzelsammlers reduzieren In einem Jugend forscht Projekt wurde fur das Szenario faires Tauschen mit Nachkaufen der Faktor f S m m n displaystyle f tfrac S m m cdot n nbsp durch umfangreiche Simulationen untersucht wobei S m displaystyle S m nbsp die mittlere Anzahl insgesamt zu kaufender Bilder aller Tauschpartner ist Der Faktor f displaystyle f nbsp gibt mithin an wie viel Mal mehr Bilder jeder Sammler am Ende im Mittel gekauft hat als das vollstandige Album Bilder enthalt Wahrend ohne Tauschen und Nachkaufen der Faktor fur einen Einzelsammler gut durch den naturlichen Logarithmus der Anzahl der Sammelbilder angenahert werden kann bzw dem doppelten Logarithmus fur eine grosse Anzahl von Tauschpartnern konnte plausibel experimentell belegt werden dass bei fairem Tauschen mit Nachkaufen bei festem Nachkaufprozentsatz f 1 displaystyle f to 1 nbsp strebt wenn die Anzahl der tauschenden Sammler m displaystyle m to infty nbsp strebt 16 Kritik der klassischen Annahmen Bearbeiten Die Annahmen des klassischen Sammelbilderproblems werden haufig als unrealistisch kritisiert und insbesondere im Internet kursieren Geruchte dass die Hersteller entweder Bilder kunstlich verknappen oder die Bilder nicht ordentlich mischen d h zu viele Doppelte vorkommen oder manche Bilder zu selten Ein Journalist von Spiegel online untersuchte die Annahme A2 fur das Sammelalbum zur Fussball Weltmeisterschaft 2014 zusammen mit der Website stickermanager com Durch die Betrachtung des aufbereiteten Datenbestandes von 8 33 Millionen Eintragen kam der Statistiker Christian Hesse zu dem Ergebnis Die gravierenden Unterschiede lassen sich mit dem Wirken des Zufalls allein nicht erklaren Dabei wurde angenommen dass die Onlineumfrage reprasentativ ist Allerdings galt dies nur fur die deutsche Edition z B bei der Schweizer Edition die separat produziert wird und optisch unterscheidbar ist traten die 2 36 Millionen registrierten Sticker gleichmassig haufig auf 21 In einer Untersuchung des Herstellungsprozesses konnte nachgewiesen werden dass bei der Verpackung der Sammelbilder von Topps und Panini systematische Abweichungen bzw Muster entstehen die sich signifikant vom zufalligen Mischen unterscheiden Fur den Verpackungsprozess der Panini Sammelbilder konnte nachgewiesen werden dass statt n m displaystyle tbinom n m nbsp moglicher verschiedener Packchen unter Annahme A1 bei Packchengrosse m displaystyle m nbsp nur maximal 4 n 4 m m displaystyle 4 cdot left frac n 4 cdot m right m nbsp verschiedene Packchen vorkommen konnen Dies wirkt sich allerdings nicht nachteilig fur den Sammler aus 8 Dies bedeutet dass die Annahmen des klassischen Sammelbilderproblems insbesondere A1 in der Praxis nicht erfullt sind Optimierte Sammelstrategie Bearbeiten Fur die Kombination von Tauschen und Nachkaufen unter den klassischen Annahmen gibt es bisher keine analytischen Ergebnisse Per Simulation wurde nachgewiesen 19 dass das Potenzial solcher optimierter Strategien erheblich ist Es wird allerdings davon ausgegangen dass in einem Display das sind Verpackungen fur den Handel mit 50 oder 100 Packchen keine Doppelten vorkommen Dies ist allerdings nur in Einzelfallen korrekt Stattdessen wurde nachgewiesen dass in einem Display weniger Doppelte vorkommen als bei zufalliger Mischung erwartet wurden 8 Ausserdem sind Displays gunstiger als der Kauf einzelner Packchen Die Empfehlung aufgrund der Simulationsergebnisse ist die folgende optimierte Sammelstrategie Kauf eines Displays Kauf weiterer Packchen und Tausch moglichst vieler Bilder bis nur noch die moglichen Nachkaufbilder fehlen Nachkauf am Schluss der maximal erlaubten Zahl von Bildern beim HerstellerDie optimierte Strategie und die damit verbundenen Kosten wurden in einem offentlichen Experiment des Gottinger Tageblatts fur das Sammelalbum zur Fussball Europameisterschaft 2016 mit guter Genauigkeit bestatigt 22 Sind in einem Display D displaystyle D nbsp Bilder und kommen darunter d displaystyle d nbsp unterschiedliche Bilder vor so gilt 23 S n H n d H K D K displaystyle S n cdot H n d H K D K nbsp Allerdings ist die klassische Annahme der Sammelgemeinschaften 5 heute nicht mehr realistisch da uberwiegend spontan in Tauschborsen oder uber das Internet getauscht wird 22 Nimmt man an dass der Sammler T displaystyle T nbsp fehlende Bilder nach dem Kauf des Displays vor dem Nachkaufen tauschen kann so ergibt sich 23 mit dem Anteil t T n d K displaystyle t frac T n d K nbsp der Tauschbilder S n H n d H K 1 t D K n ln n d K 1 t D K displaystyle S n cdot H n d H K cdot 1 t D K approx n cdot ln left frac n d K right 1 t D K nbsp Auch die Varianz V der Anzahl der zu sammelnden Bilder kann unter diesen Annahmen bestimmt werden 23 V n n d K 1 ln n d K 1 t displaystyle frac V n approx left left frac n d K 1 right ln left frac n d K right right cdot left 1 t right nbsp Damit konnen die Kosten des Sammelbilderalbums fur die optimierte Sammelstrategie unter realistischen Annahmen abgeschatzt werden und das Sammelbilderproblem ist unter diesen Annahmen gelost Das allgemeine Sammelbilderproblem BearbeitenIm allgemeinen Sammelbilderproblem kann die Wahrscheinlichkeit fur jedes Bild unterschiedlich sein und zwar p i displaystyle p i nbsp Dies ist der allgemeinste Fall einer diskreten Wahrscheinlichkeitsverteilung Die Losung ist nicht mehr mit elementarer Wahrscheinlichkeitsrechnung herleitbar sondern nur mit erzeugenden Funktionen Fur den Mittelwert ergibt sich 17 S 0 1 i 1 n 1 e p i t d t displaystyle S int 0 infty left 1 prod i 1 n 1 e p i t right dt nbsp Hiermit kann man fur einen Sammler ohne Nachkaufen die mittlere Anzahl benotigter Karten fur Trading Card Games berechnen Beispiele BearbeitenWurfel Bearbeiten nbsp SpielwurfelFur padagogische Zwecke wird haufig das Sammelbilderproblem mit Hilfe eines normalen Spielwurfels eingefuhrt und veranschaulicht 24 In der Praxis konnte dies z B n 6 displaystyle n 6 nbsp Sammelfiguren entsprechen die einem Produkt beigemischt sind Man muss durchschnittlich 14 7 mal werfen um jede Augenzahl mindestens einmal zu bekommen 25 denn es gilt S 6 H 6 6 1 1 2 1 3 1 4 1 5 1 6 147 10 14 7 displaystyle S 6 cdot H 6 6 cdot left 1 frac 1 2 frac 1 3 frac 1 4 frac 1 5 frac 1 6 right frac 147 10 14 7 nbsp Nimmt man die Packchengrosse p 2 displaystyle p 2 nbsp an dies entspricht Wurfeln mit zwei Wurfeln unter Ausschluss eines Paschs so erhalt man S 1 1 3 2 5 3 3 5 79 6 13 167 displaystyle S left 1 1 frac 3 2 frac 5 3 3 5 right frac 79 6 approx 13 167 nbsp Augenzahlen d h man muss im Durchschnitt 1 2 79 6 6 583 displaystyle tfrac 1 2 cdot tfrac 79 6 approx 6 583 nbsp mal wurfeln da mit einem Wurf zwei Wurfel mit verschiedenen Augenzahlen geworfen werden Es gilt P D 1 6 displaystyle P D tfrac 1 6 nbsp d h man kann erwarten durch das Packchen im Mittel mindestens ein Bild zu sparen Eine einfache Erweiterung besteht darin mit zwei unterscheidbaren Wurfeln zu spielen und damit ein Sammelalbum mit n 36 displaystyle n 36 nbsp Sammelbildern zu simulieren Fur den Einsatz im Schulunterricht wurde ein entsprechendes Sammelspiel entwickelt mit dem verschiedene Sammelstrategien ausprobiert werden konnen 26 Dies entspricht dem von Rewe herausgegebenen offiziellen DFB Sammelalbum zur Fussball Europameisterschaft 2016 wobei die Sammelbilder hier eine Produktzugabe fur je 10 Einkaufswert darstellen und nicht nachgekauft werden konnen Hier benotigt man als Einzelsammler zum Vervollstandigen schon fast 150 Sammelbilder Das Tauschen bekommt eine besondere Bedeutung denn beim fairen Tauschen musste jeder weitere Sammler dann nur etwa 67 Bilder sammeln und das ware gleichzeitig auch der Grenzwert bei sehr vielen Tauschpartnern 5 Pokemon Bearbeiten nbsp Pokemon SammelkartenAngenommen es gabe 150 verschiedene Motive auf den Pokemon Karten die man kaufen muss und die Karten seien einzeln verpackt Wenn es sich um ein klassisches Sammelalbum handelte dann musste ein Einzelsammler ohne Nachkaufen im Mittel ungefahr 839 Karten kaufen Allerdings ist Pokemon in Wirklichkeit ein Trading Card Game d h es gibt mehr als 5 unterschiedliche Kartentypen mit unterschiedlichen Seltenheiten von normal bis extrem selten Den grossen Unterschied kann man schon bei zwei Kartentypen erkennen bei denen z B 30 von 150 Karten halb so haufig auftreten wie im klassischen Sammelbilderspiel Dann musste der Einzelsammler schon im Mittel etwa 1213 Karten kaufen Gibt es 10 sehr seltene Karten die zehnmal seltener auftreten dann brauchte er sogar etwa 4372 Karten Dies bedeutet dass Nachkaufen und Tauschen noch eine grossere Bedeutung besitzen als bei den klassischen Sammelbildern Fussballsammelbilder Bearbeiten Das Paninialbum zur Fussball Europameisterschaft 2016 mit 680 Bildern kostet mindestens 95 20 bei einem regularen Preis von 14 Cent pro Bild Dies ware gleichzeitig auch der erwartete Preis fur das letzte fehlende Bild wenn man es normal sammeln wurde Fur den Faktor gilt H 680 7 1 displaystyle H 680 approx 7 1 nbsp Dies ergibt fur einen Einzelsammler ohne Tauschen und Nachkaufen eine mittlere Anzahl zu kaufender Bilder von etwa 4828 d h 965 5 Packchen und entspricht etwa 676 Aber auch die Standardabweichung ist gross 869 Bilder d h in etwa 95 4 aller Falle musste ein Einzelsammler zwischen 3090 und 6566 Bilder sammeln Dies verdeutlicht dass unbedingt getauscht und nachgekauft werden sollte um die Kosten zu verringern Der Einfluss der Packchen ist gering bei Funfer Packchen betragt P D displaystyle P D nbsp nur ungefahr 0 016 d h bei etwa jedem 60 Packchen musste man ein doppeltes Bild erwarten wenn die Karten zufallig gemischt wurden Dieser Einfluss wird haufig uberschatzt oder falsch eingeschatzt 27 Bei exakter Rechnung muss man im Mittel etwa 963 2 Packchen kaufen 28 d h die Ersparnis betragt im Mittel nur 12 Bilder und kann daher auch in Anbetracht der grossen Standardabweichung praktisch vernachlassigt werden Kann man 50 Bilder nachkaufen spart man etwa 3060 Bilder d h dann braucht man naherungsweise im Mittel nur 1768 Karten zu kaufen sowie 50 Nachkaufkarten Dies kostet dann etwa 257 bei 20 Cent pro Nachkaufbild ohne Berucksichtigung des Packchen Effekts Auch die Standardabweichung sinkt auf etwa 82 Bilder d h in etwa 95 4 aller Falle musste ein Einzelsammler zwischen 1604 und 1936 Bilder sammeln Bei einer unendlich grossen Sammelgemeinschaft ware der Faktor fur jeden Sammler etwa 1 88 d h jeder musste im Mittel etwa 1275 Bilder kaufen was einem Preis von etwa 179 entspricht Fur das Album zur Fussball Weltmeisterschaft 2014 wurde abgeschatzt 19 dass man mit einer optimierten Sammelstrategie das Sammelalbum fur etwa 125 fullen kann Berucksichtigt man die Preiserhohung und die zusatzlichen Sammelbilder des EM Albums so ergibt sich mit dieser Strategie ein Preis von etwa 150 29 In einem offentlichen Sammelexperiment wurde dies mit 155 Kosten bestatigt 22 Im Grenzfall des konsequenten Nachkaufens mit einer unendlich grossen Sammelgemeinschaft wurden sich 98 20 pro Sammler ergeben Das Paninialbum zur Fussball Weltmeisterschaft 2018 unterscheidet sich mit 682 Bildern praktisch nicht vom Album zur Europameisterschaft 30 Der wesentliche Unterschied ist der hohere Preis mit 18 Cent pro Bild d h das Album kostet regular mindestens 122 76 Alle anderen klassischen Ergebnisse konnen durch einfache Umrechnung abgeleitet werden Unter realistischen Annahmen z B d 450 displaystyle d 450 nbsp t 0 5 displaystyle t 0 5 nbsp und einem Preis von 75 pro Display ergeben sich fur die optimierte Strategie mittlere Kosten von etwa 184 23 Die Streuung ist relativ klein 99 der Sammler konnten unter diesen Annahmen das Album fur Kosten zwischen 176 und 193 fullen Verzichtet der Sammler auf das Tauschen muss er dagegen im Mittel 276 bezahlen Tauscht er alle Doppelten so braucht er im Mittel nur 111 Ahnliche Ergebnisse wurden per Simulation bestatigt 31 Einzelnachweise Bearbeiten a b c George Polya Eine Wahrscheinlichkeitsaufgabe in der Kundenwerbung ZAMM Zeitschrift fur Angewandte Mathematik und Mechanik Band 10 Heft 1 1930 S 96 97 NewsTimes Commemorative Dixie cups can be collectibles Abgerufen am 28 April 2016 Kellogs Memorabilia and Collectibles Abgerufen am 28 April 2016 Andrei Andrejewitsch Markow Wahrscheinlichkeitsrechnung Teubner Berlin 1912 S 101 108 a b c d Donald J Newman Lawrence Shepp The double dixie cup problem American Mathematical Monthly 67 1960 S 58 61 William Feller An introduction to probability theory and its applications Band 1 Wiley New York 1950 ISBN 0 471 25708 7 S 225 a b c Norbert Henze Stochastik fur Einsteiger 10 Auflage Springer Spektrum Wiesbaden 2013 ISBN 978 3 658 03076 6 S 192ff a b c d Niklas Braband Sonja Braband und Malte Braband Das Geheimnis der Fifimatic Junge Wissenschaft Nr 114 2017 S 26 32 Negative Binomial Distribution Marseken Susan F Surhone Lambert M Timpledon Miriam T Betascript Publishing Steffi Kroll Kombinatorik Norbert Henze Stochastik fur Einsteiger 10 Auflage Springer Spektrum Wiesbaden 2013 ISBN 978 3 658 03076 6 S 187 196 Wolfgang Stadje The Collector s Problem with Group Drawings Advances in Applied Probability Vol 22 No 4 Dec 1990 pp 866 882 Elke Warmuth Walter Warmuth Elementare Wahrscheinlichkeitsrechnung Vom Umgang mit dem Zufall Vieweg Teubner 1998 ISBN 978 3 519 00225 3 S 128 129 Sammelbilderproblem systematisch losen mithilfe der Schulmathematik PDF 358 kB Andreas Binzenhofer Tobias Hossfeld Warum Panini Fussballalben auch Informatikern Spass machen In Hans Georg Weigand Hrsg Fussball eine Wissenschaft fur sich Konigshausen amp Neumann Wurzburg 2006 S 181 191 a b c Niklas Braband und Sonja Braband Nicht mehr uber Sammelbilder argern Junge Wissenschaft Ausgabe Nr 110 2016 S 16 24 a b Philippe Flajolet Daniele Gardy Loys Thimonier Birthday paradox coupon collectors caching algorithms and self organizing search GZIP 77 kB In Discrete Applied Mathematics Vol 39 1992 S 207 229 Holger Dambeck EM Sticker Mathe Tricks machen Panini Sammeln gunstiger Spiegel Online 31 Mai 2012 a b c Sylvain Sardy und Yvan Velenik Paninimania sticker rarity and cost effective strategy Swiss Statistical Society Bulletin nr 66 2010 S 2 6 Doron Zeilberger How Many Singles Doubles Triples Etc Should The Coupon Collector Expect Panini WM Sticker Millionen Stichprobe zeigt massive Ungleichverteilung Spiegel online 19 Juni 2014 abgerufen am 19 Juni 2014 a b c Andreas Fuhrmann Fuhrmanns EM Stickerblog Abgerufen am 27 August 2016 a b c d Niklas Braband Sonja Braband Malte Braband A Useful Solution of the Coupon Collector s Problem 26 Februar 2017 arxiv 1702 08874 math Elke Warmuth Stefan Lange Mathematik Anders Machen Eine Initiative zur Lehrerfortbildung Abgerufen am 30 April 2016 Holger Dambeck WM Album So teuer kommt der Sammelbildwahn Spiegel Online 30 Juni 2011 Frank Forster Alle zwei Jahre wieder Fussballbilder In Hans Humenberger und Martin Bracke Hrsg Neue Materialien fur einen realitatsbezogenen Mathematikunterricht 3 ISTRON Schriftenreihe Realitatsbezuge im Mathematikunterricht Springer Heidelberg 2016 S 58 67 Wales Online A maths genius worked out exactly how much it will cost to fill your Panini Euro 2016 album Abgerufen am 4 Mai 2016 Cross Validated Expectation of collecting stickers in groups Abgerufen am 4 Mai 2016 Das Einmaleins der Panini Sticker In dw com Deutsche Welle 12 Mai 2016 abgerufen am 14 Mai 2016 Presse Factsheet Panini Verlags GmbH 19 Marz 2018 abgerufen am 27 Marz 2018 deutsch Laurie Belcher Football Crazy Probability Mad How much does it really cost to complete the World Cup 2018 Sticker album In Goodscienceblog 12 Marz 2018 abgerufen am 30 Marz 2018 nbsp Dieser Artikel wurde am 14 Juni 2016 in dieser Version in die Liste der lesenswerten Artikel aufgenommen Abgerufen von https de wikipedia org w index php title Sammelbilderproblem amp oldid 239415058