Le AI di Facebook stanno cercando di imparare Hanabi, un gioco coperativo

Le AI di Facebook stanno cercando di imparare Hanabi, un gioco coperativo
di

Le AI sono fenomenali e ce ne sono di tutti i tipi, ma generalmente lavorando "individualmente", almeno fino ad oggi. Facebook sta testando il gioco di carte Hanabi per le sue IA, una sfida considerevole che prevede la cooperazione e il gioco di squadra.

Jonathan Vanian ha spiegato brevemente in cosa consiste il gioco e le sue difficoltà: "... :alle squadre, da due a cinque giocatori, vengono date carte casuali di colori e numeri diversi che rappresentano i punti. L'obiettivo delle squadre è quello di mettere le carte su un tavolo, raggruppate per colore, nel corretto ordine numerico. Il problema, tuttavia, è che i giocatori non possono vedere le proprie carte mentre i loro compagni di squadra si. Un giocatore può dare suggerimenti ad un altro, come fare un'osservazione su un certo colore, cosa che da un indizio per fare qualcosa, come giocare o scartare una carta. Il problema è che il giocatore deve dedurre cosa significhi l'indizio del compagno di squadra".

Tom Lererer, ricercatore di Facebook, ha detto: "Quello che stiamo cercando sono agenti artificiali in grado di ragionare meglio sulle interazioni cooperative con gli esseri umani, e chatbot che possono ragionare sul perché la persona con cui stanno chattando ha detto quello che ha detto...". Vogliono dei bot in grado di comprendere il metatesto, che spesso e volentieri è difficile da cogliere anche per gli stessi esseri umani. Niente male.

Vanian ha identificato una tecnica di ricerca usata in precedenza da DeepMind (un'impresa britannica di intelligenza artificiale controllata da Alphabet, di cui vi abbiamo già parlato), che permette a più bot che giocano ad Hanabi di valutare molteplici opzioni di gioco condividendo informazioni. Questo, in combinazione con l'apprendimento di rinforzo, ha permesso ai bot di Facebook di imparare a giocare all'Hanabi.

Ovviamente, perchè la ricerca sia riproducibile (requisito assolutamente indispensabile per ogni ricerca scientifica), gli autori hanno rilasciato un ambiente open source Hanabi RL chiamato Hanabi Learning Environment scritto in Python e C++.

Nel loro studio gli autori specificano che "Si tratta di un problema di apprendimento multi-agente, a differenza, ad esempio, dell'Arcade Learning Environment. [Hanabi] È un gioco imperfetto a livello di informazioni, in cui i giocatori hanno una conoscenza asimmetrica dello stato dell'ambiente, che rende il gioco più simile al poker che agli scacchi, al backgammon o al Go". Dove si spingeranno le AI? Lontano. Ma siamo ancora distanti da un "asilo per cuccioli di robot cusiosi", come è stato recentemente proposto.

Quanto è interessante?
4