www.wikidata.de-de.nina.az
AlphaGo ist ein Computerprogramm das das Brettspiel Go spielt und von DeepMind entwickelt wurde Es ist auch unter den Pseudonymen Master P und Magister P bekannt 1 AlphaGo kombiniert Techniken des maschinellen Lernens und der Traversierung Logo des Computerprogramms AlphaGoIm Januar 2016 wurde bekannt dass AlphaGo bereits im Oktober 2015 den mehrfachen Europameister Fan Hui 2 Dan besiegt hatte Damit ist es das erste Programm das unter Turnierbedingungen ohne Vorgabe Handicap auf einem 19 19 Brett einen professionellen Go Spieler schlagen konnte 2 Im Marz 2016 schlug AlphaGo den Sudkoreaner Lee Sedol der als einer der weltbesten Profispieler angesehen wird AlphaGo gegen Lee Sedol 3 Inhaltsverzeichnis 1 Hintergrund 2 Architektur 3 Beruhmte Partien 3 1 AlphaGo gegen Fan Hui 3 2 AlphaGo gegen Lee Sedol 3 3 AlphaGo gegen Ke Jie 4 AlphaGo Zero 5 AlphaZero 6 Weblinks 6 1 Presseberichte 6 2 Programme 7 EinzelnachweiseHintergrund BearbeitenNachdem das IBM Programm Deep Blue im Mai 1997 den damaligen Schachweltmeister Garri Kasparow in einem Wettkampf unter Turnierbedingungen mit 3 5 2 5 Punkten geschlagen hatte galt Go als nachste grosse Herausforderung fur die Entwickler von Systemen kunstlicher Intelligenz Wegen der grosseren Komplexitat von Go gegenuber Schach die sich aus dem grosseren Brett 19 19 und der ungleich grosseren Anzahl moglicher Zuge ergibt ist Go mit traditionellen Brute Force Algorithmen Alpha Beta Suche d h durch Durchprobieren aller moglichen Zuge praktisch nicht bezwingbar Ein weiteres Problem bestand darin dass es im Gegensatz zu Schach fur Go keine zweckmassigen heuristischen Methoden gab um eine gegebene Spielstellung zu bewerten Existierende Go Programme hatten Ende der 1990er Jahre eine Spielstarke die kaum uber die von ambitionierten menschlichen Anfangern hinausging Mit der Anwendung von sogenannten Monte Carlo Algorithmen einer Baumsuche gelang ab 2006 ein Durchbruch der dazu fuhrte dass Programme wie Crazy Stone oder Zen die Starke von sehr guten Amateuren erreichten Auf einem kleinen Brett 9 9 oder mit vier Steinen Vorgabe auf dem Standardbrett konnten auch Erfolge gegen Profispieler erzielt werden 4 Monte Carlo Programme benutzen statistische Methoden um Zugkandidaten zu finden Der Zug wird bewertet indem von der Spielbrettposition ausgehend mit Zufallszugen bis zum Ende gespielt wird AlphaGo markiert einen erheblichen Entwicklungssprung gegenuber fruheren Programmen In 500 Spielen gegen andere Programme darunter Crazy Stone und Zen gewann AlphaGo alle bis auf eines Im Oktober 2015 kam es zu einem Vergleichskampf mit dem amtierenden Europameister und professionellen Go Spieler Fan Hui der den 2 Profi Dan innehat AlphaGo entschied die Partien mit 5 0 fur sich 5 Architektur BearbeitenAlphaGo verwendet zusatzlich zu Monte Carlo Methoden Lernmethoden fur tiefe neuronale Netzwerke Dabei werden zwei Kategorien von neuronalen Netzen und eine Baumsuche eingesetzt Das policy network Regelnetzwerk wird zur Bestimmung von Zugkandidaten mit grossen Mengen von Partien sowohl durch uberwachtes Lernen engl supervised learning konditioniert als auch durch bestarkendes Lernen engl reinforcement learning trainiert Das value network Bewertungsnetzwerk dient der Bewertung von Positionen und wird durch bestarkendes Lernen eingestellt Die Monte Carlo Baumsuche rechnet die Varianten durch Alle drei Komponenten werden in dieser Baumsuche kombiniert 6 Der Ansatz unterscheidet sich schon insofern von aktuellen Programmen als er zumindest grundsatzlich auch auf andere Anwendungsgebiete ubertragbar ist Zunachst lernt das Programm durch Analyse einer Datenbank von 30 Millionen Zugen den Zug eines Menschen vorherzusagen Das gelingt zu 56 Bei der Bewertung des Zuges ist es im Gegensatz zu Monte Carlo Programmen nicht notwendig die Partie bis zum Ende durchzuspielen Mit diesem Ansatz allein gelingt es AlphaGo schon traditionelle Programme zu besiegen In der Praxis werden allerdings fur die starkste Version von AlphaGo zusatzlich auch noch Bewertungen nach dem Monte Carlo Verfahren vorgenommen Bei den Partien gegen Fan Hui lief die verteilte Variante von AlphaGo auf einem Rechnerverbund mit insgesamt 1202 CPUs und 178 GPUs und nutzte 40 Such Threads search threads 6 Bei den spateren Matches gegen Lee Sedol wurden 1920 CPUs und 280 GPUs verwendet 7 Um die wahrend der Lernphase benotigte massive Rechenleistung bereitzustellen wurden die Google Cloud Platform und Tensor Processing Units ASICs fur die Software Sammlung TensorFlow eingesetzt 8 9 Beruhmte Partien BearbeitenAlphaGo gegen Fan Hui Bearbeiten AlphaGo schwarz vs Fan Hui weiss Das 4 Spiel vom 8 Oktober 2015 AlphaGo gewann durch Aufgabe von Weiss 6 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp Die ersten 99 Zuge Zug 96 auf Zug 10 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp Zuge 100 165 AlphaGo gegen Lee Sedol span