AlphaZero

Is dit de nieuwe beste schaker in de wereld?

Groot nieuws in de wereld van computerschaak en artificiŽle intelligentie!
Onderzoekers van Google Deepmind hebben deze week een paper vrijgegeven waarin ze uit de doeken doen hoe ze het beste schaakprogramma tot nu toe hebben verslagen. Ze ontwierpen een neuraal netwerk genaamd AlphaZero. Dit is op zich niets meer dan een heleboel 'neuronen' die met elkaar in verbinding staan en invoer verwerken, zeer vergelijkbaar met hoe biologische hersenen werken. Eťn neuron op zichzelf doet niet veel, maar de vele verbindingen maken het geheel heel adaptief en laten veel subtiliteit toe in het verwerkingsproces.

De onderzoekers leerden dit neuraal netwerk enkel de regels van het schaken en lieten het daarna vele spelletjes tegen zichzelf spelen. In het begin deed AlphaZero gewoon willekeurige zetten, maar door een methode die bekend staat als reinforcement learning kon dit programma leren van zijn fouten en zo na elk spelletje zijn speelstijl aanpassen. Na 4 uur trainen lieten de onderzoekers AlphaZero 100 keer spelen tegen Stockfish, de nummer ťťn in schaakalgoritmes. (Stockfish is in essentie een samenwerking tussen brute rekenkracht en zeer nauwgezette evaluatie-afwegingen samengesteld door een aantal grootmeesters.) Deze wedstrijd werd overtuigend gewonnen door AlphaZero met 28 overwinningen en 72 remises.

Opvallend was dat AlphaZero helemaal anders speelt dan de conventionele schaakprogramma's: de grote spelers noemen zijn stijl menselijk en je kan goed zien dat het neuraal netwerk op heel lange termijn kan denken. AlphaZero heeft dus een soort intuÔtie over het spel en doet, in vergelijking met Stockfish, bitter weinig berekeningen per seconde.

Maar net zoals bij mensen is het niet zo gemakkelijk om AlphaZero te 'vragen' wat zijn strategie is of hoe hij stellingen evalueert. Die zit namelijk verscholen in subtiele gewichtjes tussen de vele neuronen, het resultaat van een leerproces.

Dit betekent niet alleen een revolutie in de schaakwereld, maar zou ook een katalysator kunnen zijn voor de opkomst van artificiŽle intelligentie in vele domeinen van ons leven. Het is namelijk zo dat men dit netwerk heel erg algemeen heeft ontworpen. Na het schaken leerde men ditzelfde programma de regels van Shogi en Go, en wederom werd het na een paar uur trainen beter dan iedere vorige kampioen in zijn domein. Dit toont dat het op den duur mogelijk moet zijn neurale netwerken te maken die zo algemeen zijn dat ze een vorm van menselijke perceptie kunnen krijgen in gebieden als beeldherkenning, automatisering, bedrijfsleiding,... En dit alles staat misschien wel veel dichterbij dan we denken! Het enige wat wij als maatschappij nog kunnen doen is een ethisch standpunt vormen over de inmenging van dergelijke programma's in onze samenleving. Maar gelukkig hoeft de schaakwereld zich daar niet al te veel zorgen over te maken!

(Voor de geÔnteresseerden: AlphaZero houdt helemaal niet van Siciliaanse of Franse verdediging, en geeft de voorkeur aan de Engelse opening!)
- Steven

top