Con un post pubblicato sul proprio blog ufficiale, OpenAI ha annunciato che ha iniziato ad implementare nuove funzionalità vocali e legate alle immagini in ChatGPT, allo scopo di offrire un’interfaccia più intuitiva e nuove funzioni.

Nello specifico, gli utenti avranno la possibilità di parlare o mostrare a ChatGPT immagini per permettergli di capire meglio di cosa stanno parlando. Ad esempio, è possibile scattare una foto di un punto d’interesse mentre si è in viaggio ed inviarla all’IA per ottenere informazioni. Ma non è tutto perchè nel post si fa anche riferimento al fatto che scattando una foto del frigorifero e la dispensa ChatGPT potrebbe aiutarci con la cena.

Gli utenti avranno la possibilità di utilizzare la voce per avviare una conversazione con il chatbot: la nuova feature è basata su un nuovo modello di sintesi vocale, in grado di generare audio simile a quello umano partendo dal testo ed in pochi secondi. OpenAI parla di una collaborazione con “doppiatori professionisti” che hanno contribuito a creare ciascuna delle voci presenti nel chatbot, ma viene utilizzato anche Whisper per trascrivere le parole in testo. Sul post publicato sul blog di OpenAI comunque sono presenti alcuni esempi.

Interessante anche la possibilità di mostrare a ChatGPT una o più immagini per ottenere aiuto ed informazioni di vario tipo. Sarà possibile anche concentrarsi si una parte specifica della foto, oppure utilizzare lo strumento di disegno nell’app mobile.

La società di Sam Altman spiega che nelle prossime due settimane queste funzioni saranno disponibili per gli utenti Plus ed Enterprise: la funzionalità Voice sarà a disposizione su iOS ed Android attivandola nelle impostazioni, mentre quella per l’utilizzo delle immagini sarà su tutte le piattaforme.

Qualche giorno fa, su queste pagine abbiamo spiegato come allegare file a ChatGPT.