E quando AlphaGo sarà stufo di giocare?

/ 06.11.2017
di Ovidio Biffi

Per ora ha solo giocato, vincendo sempre, anche contro se stesso. A raggiungere questo traguardo è stato AlphaGo, un giocatore virtuale, ovvero un’intelligenza artificiale, che usa software e algoritmi sofisticati per giocare a Go, un gioco cinese antichissimo (lo consigliava già Confucio ai potenti del tempo per allenare le loro menti) considerato strategicamente più sottile degli scacchi e anche più complesso dato che sul tavoliere di Go (18 caselle per lato), secondo gli esperti, esistono più configurazioni delle pedine (181 per ognuno dei due giocatori) che atomi nell’Universo. L’amico Giampaolo Dossena, grande esperto di giochi, definiva il Go «il più raffinato meccanismo mentale mai elaborato sulla terra» e a chi lo voleva imparare consigliava: «Non vi abbandoni mai la consapevolezza di star facendo una breve gita turistica in un paese che non conoscerete a fondo nemmeno risiedendovi per tanti anni».

Le prime notizie su AlphaGo risalgono alla primavera 2016. Veniva presentato, sulla rivista «Focus», come un algoritmo sviluppato da DeepMind, laboratorio di ricerca sull’intelligenza artificiale finanziato e diretto da Google (sì, proprio il motore di ricerca dominante nei dispositivi elettronici), una sorta di genio virtuale creato per imparare, partita dopo partita, a sfidare i campioni del complesso gioco cinese. AlphaGo aveva assorbito milioni di dati e riusciva a trasformarli in mosse talmente sofisticate da battere Lee Sedol, uno dei più forti giocatori al mondo. Sembrava il massimo. Ma anche i laboratori dell’intelligenza artificiale non dormono sugli allori e nemmeno venti mesi dopo, ecco un nuovo software di DeepMind, AlphaGo Zero, che supera ogni aspettativa: ha battuto tutti, anche il suo precedessore AlphaGo. Si dirà: ma rimane un genio virtuale, bravissimo solo a giocare. Anzi: a giocare solo a Go. Tutto vero. Infatti se chiedessimo ad AlphaGo Zero di giocare a briscola o a poker, non solo non ne sarebbe capace, ma non riuscirebbe nemmeno a imparare: l’algoritmo che lo guida in pratica gioca solo contro se stesso, non riesce a indovinare le carte in mano a un altro giocatore. Limiti sempre insuperabili nonostante i ricercatori avessero ideato un «cervello artificiale» diverso. Mentre AlphaGo lavorava con due reti neurali separate, una per cercare le migliori mosse e l’altra per scegliere quale avrebbe garantito la vittoria, per AlphaGo Zero le funzioni sono state riunite in una singola rete neurale profonda, un tipo di intelligenza artificiale ispirata al cervello umano, in grado di valutare e di agire. Partendo da questo mutamento il settimanale scientifico «Nature» ha così spiegato la differenziazione nella programmazione dell’intelligenza artificiale dei due AlphaGo: il primo era stato preparato «imbottendolo» con dati desunti da oltre 100mila partite che la sua intelligenza riusciva poi a consultare in pochi secondi; AlphaGo Zero ha invece ricevuto solo le regole fondamentali, le stesse di cui ognuno di noi avrebbe bisogno per imparare a giocare a Go. Poi ha iniziato a giocare contro se stesso, incamerando dati nuovi e perfezionando l’algoritmo con regole nuove. Dopo 3 giorni di ininterrotta attività le sue conoscenze erano a livello di un bravo giocatore e dopo tre settimane gli consentivano di superare tutti i più forti giocatori del mondo, incluso il «fratello maggiore» AlphaGo. Dopo 40 giorni (un mese fa), stando a esperti informatici del Mit che seguono il progetto, AlphaGo Zero aveva giocato oltre 30 milioni di partite ed era in grado di applicare mosse che nessuno ancora conosceva.

Questi dati confermano come l’elemento più strabiliante del progetto scientifico della DeepMind non sia la supremazia assoluta nel gioco del Go, ma il fatto che l’intelligenza artificiale partita da zero sia evoluta – valutando, scegliendo e migliorando le proprie conoscenze in pochissimo tempo – senza interventi dell’uomo. In pratica ha imparato da sola ed è diventata un genio in appena 40 giorni. Questa sveltezza oltre ad avvalorare l’esperimento, indica anche la via verso nuovi sviluppi nell’intelligenza artificiale che, secondo gli esperti, potrebbero favorire principalmente la robotica; altre applicazioni potrebbero invece riguardare la chimica e l’industria farmaceutica, settori in cui la riduzione dei tempi nelle ricerche, oggi lunghissime e costose, è di vitale importanza. Nessuno degli specialisti delle università coinvolte e dei laboratori finanziati da Google (AlphaGo Zero ha nel suo cervello 25 milioni di franchi di materiale hardware!) ha fatto cenno a futuri programmi in altri settori «più sensibili». Il che è abbastanza sorprendente tenendo conto che il Go, anche se non è un gioco che simula la guerra, è pur sempre una riproduzione ludica della difesa e del controllo di territori, esattamente come in una guerriglia. Quindi c’è da chiedersi: quando AlphaGo deciderà (magari da solo!) di non giocare più, inizierà a lavorare a Wall Street o troverà porte aperte al Pentagono o Langley?