www.wikidata.de-de.nina.az
Das German tank problem englisch fur Problem der deutschen Panzer oder Taxiproblem 1 besteht in der Wahrscheinlichkeitstheorie darin das Maximum einer diskreten Gleichverteilung durch eine Stichprobenziehung ohne Zurucklegen abzuschatzen Wahrend des Zweiten Weltkrieges wurde die Produktion deutscher Panzer wie z B des Panther Panzers von den Alliierten Nachrichtendiensten mit statistischen Methoden genau geschatztDas Problem ist nach seiner Anwendung durch die alliierten Streitkrafte im Zweiten Weltkrieg zur Schatzung der monatlichen Produktionsrate der deutschen Panzer benannt wobei die deutschen Herstellungspraktiken ausgenutzt wurden Dabei wurden fortlaufend aufsteigende Seriennummern fur verschiedene Panzerbauteile Fahrgestell Getriebe Motor Rader vergeben die anschliessend in geringem Umfang in die Hande der alliierten Streitkrafte fielen Ubertragen kann das Problem auch auf andere zufallig beobachtete Seriennummern wie Taxi Nummern oder verkaufte Produkte angewendet werden 1 2 3 Als mathematisches Problem werden die Seriennummern als ununterbrochene Folge von ganzen Zahlen beginnend mit der Seriennummer 1 modelliert die deutsche Herstellungspraxis und die Kennzeichnungskonventionen im Kriegsumfeld waren komplexer und werden hier nicht behandelt Das Problem kann entweder mit Hilfe von frequentistischer Inferenz oder Bayesscher Inferenz angegangen werden wobei unterschiedliche Ergebnisse erzielt werden Die Schatzung des Maximums der Grundgesamtheit auf der Grundlage einer einzigen Stichprobe ergibt unterschiedliche Ergebnisse wohingegen die Schatzung auf der Grundlage mehrerer Stichproben eine praktische Schatzfrage ist deren Antwort einfach vor allem in der frequentistischen Variante aber nicht offensichtlich vor allem in der Bayesschen Variante ist Inhaltsverzeichnis 1 Annahmen 2 Berechnung 3 Beispiel 4 Historisches Problem 4 1 Spezifische Daten 5 Ahnliche Analysen 6 Gegenmassnahmen 7 Siehe auch 8 Weblinks 9 Literatur 10 EinzelnachweiseAnnahmen BearbeitenEs wird angenommen dass der Gegner eine Reihe von Panzern hergestellt hat die mit fortlaufenden Ganzzahlen gekennzeichnet sind beginnend mit der Seriennummer 1 Unabhangig vom Herstellungsdatum des Panzers der Betriebsgeschichte oder der Seriennummer die er tragt sind die ermittelten Seriennummern bis zum Zeitpunkt der Analyse gleichmassig verteilt Berechnung Bearbeiten nbsp Funktionsgraphen der geschatzten Populationsgrosse N fur die Anzahl der Stichproben k und die grosste Stichprobenseriennummer m unter Verwendung von frequentistischer gestrichelte Linien und Bayesscher Analyse durchgezogene Linie zeigt den Erwartungswert und die Schattierungen zeigen den moglichen Bereich innerhalb einer Standardabweichung Die Formel fur die Schatzung der Gesamtzahl der Panzer N displaystyle N nbsp basierend auf der Anzahl der Stichproben k displaystyle k nbsp und der grossten beobachteten Seriennummer m displaystyle m nbsp im Rahmen des frequentistischen Ansatzes lautet N m m k 1 displaystyle N approx m frac m k 1 nbsp wahrend die bayessche Analyse primar eine Wahrscheinlichkeitsverteilung fur die Anzahl der Panzer liefert P N n 0 wenn n lt m k 1 k m 1 k 1 n k wenn n m displaystyle P N n begin cases 0 amp text wenn n lt m frac k 1 k frac binom m 1 k 1 binom n k amp text wenn n geq m end cases nbsp aus der der Erwartungswert m displaystyle mu nbsp und die Standardabweichung s displaystyle sigma nbsp fur die Anzahl der Panzer gemass folgender Formel ermittelt werden kann m m m 1 k 2 1 falls k 3 s k 1 m 1 m k 1 k 3 k 2 2 falls k 4 displaystyle begin aligned mu amp m frac m 1 k 2 1 amp amp text falls k geq 3 sigma amp sqrt frac k 1 m 1 m k 1 k 3 k 2 2 amp amp text falls k geq 4 end aligned nbsp Beispiel BearbeitenAngenommen k 4 displaystyle k 4 nbsp Panzer mit den Seriennummern 19 40 42 und 60 werden erbeutet Die maximal beobachtete Seriennummer ist m 60 displaystyle m 60 nbsp Die unbekannte Gesamtzahl der Panzer wird mit N displaystyle N nbsp bezeichnet Die frequentistische Formel liefert in dem Fall N m m k 1 74 displaystyle N approx m frac m k 1 74 nbsp wahrend mit der bayesschen Analyse eine Verteilung ermittelt werden kann die folgenden Schatzwert liefert N m s 88 5 50 22 displaystyle N approx mu pm sigma 88 5 pm 50 22 nbsp Diese Verteilung besitzt eine positive Schiefe was damit zusammenhangt dass es mindestens 60 Panzer gibt Historisches Problem Bearbeiten nbsp Verladung neuer Panther Panzerkampfwagen zum Transport an die Front 1943 Im Verlauf des Krieges unternahmen die Westalliierten intensive Anstrengungen um das Ausmass der deutschen Fertigung zu bestimmen und naherten sich dem auf zweierlei Weise konventionelle Informationsgewinnung und statistische Schatzung In vielen Fallen ubertraf die statistische Analyse die herkommliche Nachrichtentechnik erheblich In einigen Fallen wurde konventionelle Nachrichtentechnik in Verbindung mit statistischen Methoden eingesetzt wie es bei der Schatzung der Produktion von Panther Panzern kurz vor dem D Day der Fall war Die alliierte Kommandostruktur hatte vermutet dass die in Italien gesehenen Panzerkampfwagen V Panther mit ihren schnellen langgestreckten 7 5 cm KwK 42 L70 Kanonen ungewohnlich schwere Panzer darstellten und nur in geringer Zahl in Nordfrankreich zu sehen waren ahnlich wie der Tiger I in Tunesien gesehen wurde Die US Armee war zuversichtlich dass der Sherman Panzer auch weiterhin eine gute Leistung bringen wurde wie auch gegen den Panzerkampfwagen III und Panzerkampfwagen IV in Nordafrika und Sizilien 4 Kurz vor dem D Day gab es Geruchte dass eine grosse Anzahl von Panther V Panzern im Einsatz war Um diese Information zu verifizieren versuchten die Alliierten die Anzahl der produzierten Panzer abzuschatzen Dazu benutzten sie die Seriennummern von eroberten oder zerstorten Panzern Als Hauptnummern wurden Getriebezahlen verwendet da diese in zwei ununterbrochene Zahlenreihen fielen Es wurden auch Fahrgestell und Motornummern verwendet die allerdings komplizierter zu handhaben waren Verschiedene andere Komponenten wurden verwendet um die Analyse zu uberprufen Ahnliche Analysen wurden an Radern durchgefuhrt bei denen beobachtet wurde dass sie fortlaufend nummeriert waren d h 1 2 3 N Die untere Schranke war unbekannt aber um die Diskussion zu vereinfachen wird dieses Detail in der Regel weggelassen wobei die untere Schranke als 1 angenommen wird 5 6 Die Analyse der Panzerrader ergab eine Schatzung der Anzahl der verwendeten Gussformen Eine Diskussion mit britischen Laufradherstellern schatzte dann die Anzahl der Rader die aus diesen vielen Formen hergestellt werden konnten was die Anzahl der Panzer ergab die jeden Monat produziert wurden Die Analyse der Rader von zwei Panzern 32 Laufrader 64 Laufrader insgesamt ergab eine Schatzung von 270 Panzern die im Februar 1944 produziert wurden wesentlich mehr als bisher vermutet 7 Deutsche Aufzeichnungen nach dem Krieg zeigten dass die Produktion fur den Monat Februar 1944 bei 276 lag 8 Der statistische Ansatz erwies sich als weitaus genauer als herkommliche nachrichtendienstliche Methoden und der Ausdruck German tank problem wurde als Bezeichnung fur diese Art der statistischen Analyse akzeptiert Diese Seriennummernanalyse wurde nicht nur zur Abschatzung der Produktion eingesetzt Sie diente auch dazu die deutsche Produktionsstruktur allgemeiner zu verstehen einschliesslich der Anzahl der Fabriken der relativen Bedeutung der Fabriken der Lange der Lieferkette basierend auf der Verzogerung zwischen Produktion und Nutzung der Veranderungen in der Produktion und der Verwendung von Ressourcen wie Gummi Spezifische Daten Bearbeiten Nach herkommlichen Schatzungen des britischen Geheimdienstes und des US Geheimdienstes OSS produzierten Industriebetriebe im Grossdeutschen Reich zwischen Juni 1940 und September 1942 monatlich rund 1400 Panzer Man wendete die hier behandelte Formel auf die Seriennummern der erbeuteten Panzer an und kam so auf 246 Panzer pro Monat Nach Kriegsende zeigten Produktionszahlen aus dem Reichsministerium fur Bewaffnung und Munition dass tatsachlich durchschnittlich 245 Panzer produziert worden waren 5 Die Schatzungen fur einige Monate werden wie folgt angegeben 9 Monat Statistische Schatzung Geheimdienst Schatzung Deutsche AufzeichnungenJuni 1940 169 1000 122Juni 1941 244 1550 271August 1942 327 1550 342Ahnliche Analysen Bearbeiten nbsp Die Produktion von V2 Raketen wurde mit statistischen Methoden genau geschatztAhnliche Seriennummernanalysen wurden wahrend des Zweiten Weltkriegs auch fur andere militarische Ausrustungsgegenstande verwendet am erfolgreichsten fur die V2 Rakete 10 Der deutsche Geheimdienst analysierte wahrend des Zweiten Weltkriegs Deutsch Sowjetischer Krieg Fabrikmarkierungen auf sowjetischen Militarausrustungen Auch wahrend des Koreakrieges wurden Markierungen auf sowjetischen Militarausrustungen analysiert 11 In den 1980er Jahren erhielten einige Amerikaner Zugang zur Produktionslinie der israelischen Merkava Panzer Die Produktionszahlen waren geheim aber die Panzer hatten Seriennummern die eine Abschatzung der Produktion ermoglichten 12 Die Formel wurde in nicht militarischen Zusammenhangen verwendet z B um die Zahl der gebauten Commodore 64 Computer zu schatzen wobei das Ergebnis 12 5 Millionen mit den unteren Schatzungen ubereinstimmt 2 Auch die Produktionszahlen von iPhones und anderen Mobiltelefonen wurden anhand der IMEI Nummer mit dieser Methode abgeschatzt 3 Gegenmassnahmen BearbeitenUm die Analyse von Seriennummern zu verhindern konnen Seriennummern vermieden werden bzw brauchbare Zusatzinformationen reduziert werden Alternativ konnen einer Kryptoanalyse widerstehende Seriennummern verwendet werden am effektivsten durch die zufallige Ziehung von Nummern ohne Zurucklegen aus einer Liste die viel grosser ist als die Anzahl der produzierten Gegenstande oder durch die Erzeugung von Zufallszahlen und deren Vergleich mit der Liste der bereits zugewiesenen Nummern Kollisionen sind wahrscheinlich es sei denn die Anzahl der moglichen Ziffern ist mehr als doppelt so hoch wie die Anzahl der Ziffern in der Anzahl der produzierten Objekte wobei die Seriennummer in jeder beliebigen Basis sein kann siehe Geburtstagsparadoxon Hierfur kann ein kryptographisch sicherer Pseudozufallszahlengenerator verwendet werden Alle diese Methoden erfordern eine Lookup Tabelle oder das Brechen der Chiffre um von der Seriennummer die Produktionsreihenfolge zu ermitteln was die Verwendung der Seriennummern erschwert Ein Bereich von Seriennummern kann beispielsweise nicht abgerufen werden sondern muss einzeln nachgeschlagen oder eine Liste muss erstellt werden Ein typisches Nummerierungsschema welches auf Zufallszahlen basiert ist etwa der Universally Unique Identifier Alternativ konnen fortlaufende Seriennummern mit einer einfachen Substitutionschiffre verschlusselt werden was eine einfache Dekodierung ermoglicht aber auch leicht durch einen Known Plaintext Angriff gebrochen werden kann Auch wenn der Klartext von einem beliebigen Punkt aus gestartet wird hat er ein Muster d h die Zahlen sind aufeinanderfolgend Ein Beispiel ist Ken Folletts Roman Das zweite Gedachtnis in dem die Verschlusselung der Seriennummern der Jupiter C Rakete beschrieben wird H U N T S V I L E X1 2 3 4 5 6 7 8 9 0Das Codewort hier ist Huntsville ohne wiederholte Buchstaben um einen Schlussel mit 10 Buchstaben zu erhalten Die Rakete Nummer 13 war also HN und die Rakete Nummer 24 war UT Eine starke Verschlusselung von Seriennummern ohne diese zu vergrossern kann mit Format erhaltender Verschlusselung erreicht werden Anstatt eine wirklich zufallige Permutation auf der Menge aller moglichen Seriennummern in einer grossen Tabelle zu speichern leiten solche Algorithmen eine pseudozufallige Permutation von einem geheimen Schlussel ab Sicherheit kann dann definiert werden als die pseudozufallige Permutation die von einer wirklich zufalligen Permutation fur einen Angreifer der den Schlussel nicht kennt nicht zu unterscheiden ist Siehe auch BearbeitenRuckfangmethode eine andere Methode um die Anzahl anhand einer Stichprobe zu schatzen Doomsday ArgumentWeblinks BearbeitenHolger Dambeck Rechentrick der Alliierten Wie Seriennummern die Nazi Industrie verrieten In Spiegel Online 22 November 2010 Literatur BearbeitenLeo A Goodman Some Practical Techniques in Serial Number Analysis In Journal of the American Statistical Association Band 49 Nr 265 1954 S 97 112 doi 10 2307 2281038 JSTOR 2280189 Michael Hohle Leonhard Held Bayesian Estimation of the Size of a Population Universitat Munchen Institut fur Statistik Sonderforschungsbereich 386 2006 uni muenchen de PDF Roger W Johnson Estimating the Size of a Population In Teaching Statistics Band 16 Nr 2 1994 S 50 52 doi 10 1111 j 1467 9639 1994 tb00688 x Henry Brodie Richard Ruggles An Empirical Approach to Economic Intelligence in World War II In Journal of the American Statistical Association Band 42 Nr 237 1947 S 72 doi 10 1080 01621459 1947 10501915 Arthur G Volz A Soviet Estimate of German Tank Production In The Journal of Slavic Military Studies Band 21 Nr 3 Juli 2008 S 588 590 doi 10 1080 13518040802313902 informaworld com Einzelnachweise Bearbeiten a b Taxiproblem PDF Nicht mehr online verfugbar Universitat Heidelberg archiviert vom Original am 12 Juli 2017 abgerufen am 26 November 2019 a b How many Commodore 64 computers were really sold In pagetable com 1 Februar 2011 archiviert vom Original am 6 Marz 2016 abgerufen am 6 Juli 2014 englisch a b Holger Dambeck Rechentrick der Alliierten Wie Seriennummern die Nazi Industrie verrieten In spiegel de 22 November 2010 abgerufen am 6 Februar 2018 Armored Ground Forces policy statement Chief of staff November 1943 a b Gavyn Davies does the maths How a statistical formula won the war In The Guardian 20 Juli 2006 abgerufen am 6 Juli 2014 britisches Englisch Robert Matthews Data sleuths go to war sidebar in feature Hidden truths In New Scientist 23 Mai 1998 englisch newscientist com Memento des Originals vom 1 Mai 2015 im Internet Archive Bob Carruthers Panther V in Combat Coda Books Ltd 2012 ISBN 978 1 908538 15 4 S 94 britisches Englisch google com Ruggles Brodie S 82 83 Ruggles Brodie S 89 Ruggles Brodie S 90 92 Volz Johnson Abgerufen von https de wikipedia org w index php title German tank problem amp oldid 235637153