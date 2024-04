Durante una recente sessione di test interni su Claude 3 Opus è emerso un comportamento assolutamente insolito che ha catturato l'attenzione degli sviluppatori. Ormai si sa che le capacità dei modelli AI sono assurde, ma l'esperimento ha un risvolto davvero interessante che ci pone la domanda: dov'è il limite dell'umanità?

Il test, denominato "ago nel pagliaio", è progettato per valutare la capacità di ricordo del modello. Consiste nell'inserire una frase bersaglio, l'"ago", in un corpus di documenti casuali, il "pagliaio", e porre una domanda la cui risposta è contenuta solo della frase di cui sopra.

Nel corso di questo specifico test, gli sviluppatori hanno inserito una frase riguardante una combinazione di ingredienti per pizza decisamente peculiare: fichi, prosciutto e formaggio di capra, descritta come la migliore secondo l'Associazione Internazionale dei Conoscitori di Pizza. Tuttavia, il contesto generale dei documenti trattava temi completamente diversi, come linguaggi di programmazione, startup e come trovare il lavoro che si ama.

Il modello di Anthropic non solo ha identificato correttamente la frase inserita ma ha anche espresso un sospetto: la frase sembrava fuori luogo e non correlata al resto dei contenuti, tanto da ipotizzare che potesse essere stata inserita appositamente per verificare la sua attenzione.

Ciò ha reso gli studiosi perplessi: si può parlare di auto-consapevolezza? Quest evento non solo ha evidenziato una sorprendente capacità di meta-riflessione, ma ha anche spinto a riflettere sull'efficacia e sulla validità dei test artificiali nell'industria dell'intelligenza artificiale.

L'evento in realtà non è proprio circoscritto. Recentemente, dei ricercatori di Stanford hanno sviluppato un modello linguistico che si ferma a pensare prima di scrivere un output.

