Strategiespiele wie Schach, Go oder die japanische Schachvariante Shogi gelten als besondere Herausforderung für den menschlichen Geist – und als gutes Testmodell für künstliche Intelligenzen. Denn bei diesen Spielen muss man komplexe Spielzüge und Strategien memorieren und kombinieren, um sich gegen den Mitspieler durchzusetzen. Dank neuronaler Netze und lernfähiger Algorithmen ist es in den letzten Jahren KI-Systemen wie AlphaGO gelungen, selbst hochrangige Profis in diesen Strategiespielen zu schlagen. Die Programme erreichen dabei meist in kurzer Zeit ein hohes Spielniveau, indem sie auf Basis der grundlegenden Spielregeln immer und immer wieder gegen sich selbst spielen. Allerdings haben Schach, Go und Co eine Gemeinsamkeit: In diesen Spielen sieht jeder Spieler die Spielpositionen des Gegenübers – es sind Spiele mit sogenannter “perfekter Information”.
Gegen fünf Mitspieler gleichzeitig
Anders ist dies dagegen bei Kartenspielen wie dem Poker: Hier kennt man das Blatt seines Gegenübers entweder gar nicht oder nur teilweise. Das macht es deutlich schwerer, eine Strategie zu entwickeln – ähnlich wie bei einer Gleichung mit mehreren Unbekannten. Hinzu kommt, dass beim Poker auch das “Bluffen” eine wichtige Rolle spielt: Es geht darum, nicht zu verraten, ob man ein gutes oder schlechtes Blatt hat, um die Mitspieler zu höheren Geldeinsätzen zu bewegen. Für künstliche Intelligenzen galt dies lange als nahezu unlösbare Herausforderung. Doch inzwischen haben KI-Systeme auch diese Leistung erbracht: Vor einigen Jahren gewann erstmals ein Computer im Poker. 2017 legte dann ein System namens DeepStack in der Spielvariante “Heads-Up No-Limit Texas Hold’em” nach. Dabei hat jeder Spieler zwei Karten, die nur er kennt, der Rest des Blattes wird in drei Folgerunden sukzessive offen ausgeteilt.
Einen Schritt weiter geht nun “Pluribus”, ein von Noam Brown und Tuomas Sandholm von der Carnegie Mellon University in Pittsburgh entwickeltes KI-System. Denn dieses lernfähige Maschinenhirn pokert nicht nur mit einem Mitspieler wie seine Vorgänger, sondern kann sich auch in Pokerrunden gegen fünf Mitspieler durchsetzen. “Bisher waren KI-Meilensteine im strategischen Denken immer auf Zwei-Parteien-Wettbewerbe begrenzt”, sagt Brown. “Ein Spiel mit sechs Mitspieler zu absolvieren erfordert fundamentale Veränderungen darin, wie die KI ihre Spielstrategie entwickelt.” Denn in Zwei-Personen-Spielen gilt meist das sogenannte Nash-Äquilibrium, wie die Forscher erklären: Die langfristigen Erfolgschancen sind am größten, wenn der Spieler bei seinen Strategien bleibt und keiner die Spielweise grundlegend verändert. Bei Spielen mit mehr als einem Gegner jedoch gilt dies nicht mehr.





