Computer schlägt Go-Profi

Zu komplex für einen Computer?

Und genau hier liegt die Crux: “Wegen des höheren Verzweigungsfaktors und der höheren Zahl der Spielzüge bei Go verglichen mit Schach, war immer klar, dass das Programmieren eines Go-Computers um eine Größenordnung schwerer ist”, erklärt Jon Diamond von der British Go Association. “Das Ziel einiger Forscher, eine künstliche Intelligenz zu entwickeln, die die menschlichen Topspieler im Go schlägt, galt daher als größte Herausforderung im Bereich der Spiele überhaupt.” Tatsächlich gibt es inzwischen zwar einige Go-Programme, diese kommen aber über die Spielstärke eines guten Amateurs nicht hinaus, wie David Silver und seine Kollegen vom Google DeepMind-Forschungszentrum in London berichten. Um dies zu ändern, haben sie ein neuartiges neuronales Netzwerk entwickelt, das gleich mehrere Lern- und Berechnungsstrategien in sich vereint.

Das neue Programm AlphaGo nutzt sogenannte “Wert-Netzwerke”, um die Vorteile einzelner Positionen der Steine auf dem Brett zu ermitteln. Gleichzeitig ermitteln Taktik-Netzwerke, wie sich die Spielzüge auf künftige Positionen auswirken und den weiteren Spielverlauf beeinflussen. “Wir nutzen diese neuronalen Netzwerke, um die effektive Tiefe und Breite des Suchbaums für den nächsten Spielzug zu verringern”, erklären Silver und seine Kollegen. Als letztes kommt eine klassische Suche zum Einsatz, der sogenannte Monte Carlo Tree Search, der unter den verbleibenden Möglichkeiten den günstigsten aussucht. Eine weitere Besonderheit von AlphaGo: Das Programm verbessert sich selbst immer weiter. Anfangs mit einem Satz von klassischen Spielzügen menschlicher Profis gefüttert, spielt die Software unzählige Male gegen sich selbst und lernt dadurch immer mehr dazu.

Sieg gegen europäischen Top-Champion

Wie gut AlphaGo schließlich tatsächlich war, testeten die Forscher erst durch Spiele gegen bisher existierende Go-Computer, dann durch ein Turnier gegen einen menschlichen Profi-Spieler. Im Kampf gegen seine digitalen Konkurrenten setzte sich AlphaGo klar durch: “Er gewann 494 von 495 Spielen”, berichten Silver und seine Kollegen. “Die Ergebnisse deuten darauf hin, dass AlphaGo mehrere Dangrade stärker ist als jedes vorherige Go-Programm.” Noch beeindruckender aber war sein Abschneiden gegen seinen menschlichen Gegner, den mehrfachen europäischen Go-Champion Fan Hui. “Ich fand es tatsächlich schwer zu entscheiden, welche Seite der Computer spielte, wenn ich es nicht vorher wusste”, beschreibt Go-Experte Jon Diamond seinen Eindruck. Das Ergebnis des formellen Turniers aus fünf Spielen: AlphaGo besiegte Fan Hui mit 5:0.