L’AI che ha imparato a bluffare a poker (ed è fortissima)

[Getty]

E’ stato un esperimento, i risultati sono stati pubblicati sulla rivista Science, e pare sia andato molto bene: un sistema di intelligenza artificiale ha battuto a poker una serie di campioni di “Texas hold’em”. L’esperimento è durato 12 giorni e si è articolato su circa 10 mila mani di gioco, al termine delle quali il sistema ha vinto una media di 5 dollari per mano e circa mille dollari all’ora. Si tratta di vincite superiori alla media di quel tipo di poker.

L’AI capace di tanto si chiama Pluribus, ed è stato sviluppato da Facebook e dai ricercatori della Carnegie Mellon University (Stati Uniti). Questi ultimi hanno insegnato al sistema il poker dapprima facendolo giocare contro una serie di sue copie: con questo metodo, piuttosto diffuso, si insegna alle intelligenze artificiali a svolgere un compito e a imparare dai propri errori. Pluribus ha impiegato poco tempo per sviluppare le proprie capacità.

I ricercatori hanno quindi regolato il comportamento dell’AI facendo sì che potesse prevedere non oltre tre mani successive a quella in corso. L’alternativa era settarla in modo che potesse predire l’intero esito della partita. E’ stato questa una delle chiavi che ha reso possibili progressi superiori a quelli che ci si attendeva: Pluribus è stato “programmato” come un vero giocatore di poker, gioco in cui le strategie a breve termine di quelle pensate sul lungo.

Soprattutto, Pluribus ha imparato a bluffare pur non avendo chance di osservare le espressioni o la postura degli altri giocatori, e che invece contano tantissimo nei bluff. Il sistema è riuscito comunque ad analizzare e prevedere le strategie degli sfidanti e a leggere i loro bluff, anche perché - come ha spiegato uno dei ricercatori - “non vede un bluff come qualcosa di ingannevole. Vede semplicemente la decisione che porterà a massimizzare la vincita in una particolare situazione”.

L’esperimento rende quindi l’AI più capace nel poker di un giocatore professionista? Non si può dirlo con certezza, malgrado in tutti i giorni di partite non sono emersi punti deboli nel sistema, e gli sfidanti non hanno avuto appigli da sfruttare a proprio vantaggio.