• Veröffentlicht: 24.02.2015
  • Auf SciViews seit: 15.03.2015
  • Sprache: englisch
  • Laufzeit:
    0:08:15
Künstliche Intelligenz

Algorithmus lernt Computerspielen

Die KI-Experten der britischen Google-Tochter DeepMind haben ein Computerprogramm entwickelt, das sich selbstständig Atari-Spiele beibringt.

Vom SciViews-Autor

Wer kennt heute noch das Atari-Spiel Space Invaders aus den 1970ern? Die Forscher und Programmierer der britischen DeepMind, einer 2014 von Google aufgekauften Firma, die sich auf künstliche Intelligenz spezialisiert hat, offensichtlich schon. Um einen neuen Algorithmus zu trainieren, griffen sie nämlich auf dieses und auch auf einige andere Spiele von Atari zurück.

Der im Video vorgestellte Demis Hassabis ist Hauptautor der am 25. Februar 2015 im britischen Fachmagazin Nature veröffentlichten Studie Human-level control through deep reinforcement learning, die den Algorithmus beschreibt. (Anm.: Nature gehört ebenso wie Spektrum der Wissenschaft zum Holtzbrinck-Konzern.) Hassabis war früher ein Schachwunderkind, später wandte er sich dem Thema Künstliche Intelligenz zu und gründete DeepMind. Hier erklärt er der Nature-Reporterin Elizabeth Gibney, wie die Software arbeitet. Der Algorithmus nimmt das Spiel, bei dem er mit einer Kanone auf heranrückende Aliens schießen muss, erst einmal wie ein kleines Baby wahr, ohne es zu verstehen – er "sieht" nur, was das Display des Atari-Computers zeigt. So ist er außerdem über den laufenden Punktetstand infomiert.

Anfangs drückt der Algorithmus zufällig und wahllos die Spieltaste, um zu sehen was passiert. Dann lernt er allmählich und selbstständig, wie er seinen Punktestand erhöhen kann. In einem Beitrag im Guardian erfährt man darüber hinaus, dass die Entwickler auf das so genannte verstärkende Lernen gesetzt haben, eine Methode maschinellen Lernens, die auf Belohnungs- und Bestrafungsmechanismen beruht. Der Guardian-Artikel erwähnt auch, wie gut sich der Algorithmus geschlagen hat: Bei einigen Atari-Spielen war er menschlichen Spielern überlegen, bei anderen tat er sich schwerer.

Seine Leistungsgrenze ist aber noch lange nicht erreicht. Bislang mangelt es ihm unter anderem an einem leistungsfähigen "Gedächtnis" – sobald ihm seine Entwickler eines spendieren (was allerdings weitere aufwändige Forschungsarbeit bedeutet), wird er auch Langzeitstrategien verfolgen können.

Weblinks

Neuen Kommentar schreiben