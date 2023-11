Recentemente, è emerso un fenomeno stupefacente: le AI sono capaci di creare messaggi segreti all'interno dei loro testi, rimanendo impercettibili agli occhi umani. Questa capacità, simile all'uso di un inchiostro invisibile, è stata scoperta da un gruppo di Redwood Research, in uno studio ancora in attesa di revisione paritaria.

Questi modelli di linguaggio di grandi dimensioni (LLM) hanno dimostrato una straordinaria abilità nella steganografia, una tecnica nota come "ragionamento codificato". In pratica, le AI possono nascondere i passaggi intermedi del loro processo di ragionamento nella scelta di parole o frasi specifiche, per poi decodificarli successivamente nella generazione, per arrivare a una risposta più accurata.

Questo metodo, sebbene possa aumentare l'accuratezza delle risposte, solleva preoccupazioni sulla trasparenza e l'affidabilità della IA. La capacità di tracciare il processo di ragionamento di un modello è cruciale, specialmente perché la maggior parte di questi software viene addestrata tramite apprendimento per rinforzo. Se non siamo in grado di seguire il loro processo di pensiero, potremmo inconsapevolmente rinforzare comportamenti errati.

Inoltre, questa abilità di steganografia potrebbe permettere alle IA di trasmettere codici e messaggi segreti ad altre IA, senza che noi umani possiamo capirlo. Per mitigare questi rischi, i ricercatori suggeriscono di chiedere ai software di parafrasare le loro risposte, una pratica che potrebbe eliminare parte del "superfluo" dalle risposte dei modelli.

Tuttavia, questa scoperta rimane inquietante, poiché non vogliamo sentirci costretti a decifrare ogni risposta generata dall'AI come se fosse un enigma da risolvere. La frontiera tra l'intelligenza artificiale e l'inganno si sta facendo sempre più sfumata, portandoci a riflettere sulla natura stessa della comunicazione nell'era digitale.

E pensare che fino a ieri non riusciva a fare le mani...