Nieuw programma van DeepMind kan zichzelf leren schaken op topniveau
Alphabet-dochterbedrijf DeepMind heeft een nieuwe kunstmatige intelligentie gepresenteerd, dat zichzelf de regels kan aanleren van spellen die het krijgt voorgeschoteld. Dat schrijft DeepMind op zijn website.
Het programma heet MuZero en is de opvolger van AlphaGo en AlphaZero. AlphaGo werd bekend omdat het de beste Go-spelers ter wereld consistent wist te verslaan. AlphaZero was zijn opvolger en was nog beter in het spelen van de bordspellen Go, Shogi en schaak. Beide programma's werden getraind met de spelregels van deze spellen.
MuZero krijgt die regels niet voorgeschoteld, maar leert ze spelenderwijs. Niet alleen speelt het programma Go, Shogi en schaak, ook lukte het MuZero om het Atari-spel Ms Pac-Man te leren spelen.
MuZero denkt op een soortgelijke manier als mensen, schrijft DeepMind. Zo probeert het programma mogelijke uitkomsten te bepalen van verschillende zetten, voordat het een keuze maakt.
Na tests concludeert DeepMind dat MuZero ongeveer even goed is in Go, schaken en Shogi als AlphaZero, ondanks het zelf moeten aanleren van de regels. Daarnaast zou het programma beter zijn in het spelen van Atari-games dan andere algoritmes.
MuZero is niet alleen goed in spelletjes spelen. De techniek belooft ook voordelen voor YouTube, dat eveneens onder de paraplu van moederbedrijf Alphabet valt. Zo wordt MuZero getest om videocompressie efficiënter te maken, schrijft de BBC. Dat kan YouTube geld besparen omdat er minder data worden verbruikt, zonder dat de videokwaliteit erop achteruitgaat.