Il mondo dell’intelligenza artificiale continua a sorprenderci mostrando funzioni ingegnose: dopo Resemble AI, il sistema in grado di tradurre le frasi dette da una persona in tante lingue leggendole con la voce dell’essere umano stesso, ora l’Allen Institute di Seattle ha creato un’IA che riassume rapporti lunghissimi in poche parole.

Chiamato Semantic Scholar, si tratta di uno strumento dedicato alla ricerca scientifica basato sull’intelligenza artificiale con una funzione di riepilogo integrata e in grado di esaminare un numero enorme di documenti per ridurli addirittura a una singola frase, condensando paper particolarmente lunghi e dettagliati per ridurre il tempo di lettura o revisione.

Attualmente, ci sono 10 milioni di articoli di informatica nel database di Semantic Scholar e oltre 7 milioni di utenti al mese vi accedono per le loro attività. Il sistema offre un grande vantaggio ai ricercatori che fino a oggi hanno dovuto fare affidamento sulle scansioni o sugli abstract, un compito particolarmente impegnativo se si adoperano dispositivi mobili. Dopo i primi test condotti sul sistema IA, la reazione degli utenti e di chi sovrintende al database è stata positiva.

A rendere ancora più peculiare questo sistema è il suo approccio astrattivo piuttosto che estrattivo: anziché concentrarsi sul selezionare parti rappresentative del testo e riportarle alla lettera, Semantic Scholar utilizza algoritmi di generazione del linguaggio naturale per creare riassunti con parole originali. In questo modo l’IA può riassumere articoli lunghi in media 5000 parole in circa 21 parole.

Secondo lo scienziato dell’informazione Jevin West, strumenti come questi in futuro diventeranno uno standard nell’ambito della ricerca scientifica. Non è mancato anche un commento sulle tempistiche dello sviluppo di IA simili: “In realtà, data la necessità, sono stupito che ci sia voluto così tanto per vederlo in pratica. […] Non è ancora perfetto, ma è sicuramente un passo nella giusta direzione”.

Il team dell'Allen Institute ha reso disponibile il codice gratuitamente, allestendo un sito dimostrativo aperto a tutti. Attualmente vengono accettati solo documenti scritti in inglese, ma gli sviluppatori stanno già lavorando assiduamente per includere documenti in altre lingue il prima possibile.

Rimanendo nel mondo dell'IA, la redazione di The Guardian ha usato il generatore di linguaggi GPT-3 per scrivere e pubblicare un articolo da zero.