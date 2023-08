Ormai tutti sanno che le Intelligenze Artificiali vanno "addestrate" tramite l'inserimento nei loro database di una mole enorme di informazioni. In molti, però, sono contrari a questo tipo di training, chi per motivi di privacy e chi per questioni legate al diritto d'autore. Ora, anche il New York Times si aggiunge ai critici dell'IA.

Come spiegano i colleghi di Adweek e The Verge, l'ultima versione dei Termini di Servizio del New York Times, aggiornata il 3 agosto scorso, proibisce l'utilizzo degli articoli per il training dell'IA. Nello specifico, i nuovi termini di servizio riportano che "è proibito utilizzare tutti i contenuti del New York Times - inclusi testi, fotografie, immagini, clip audio e video, materiali "look and feel", metadati e compilation - per lo sviluppo di qualsiasi programma software, incluso (ma non limitato a) il training dei sistemi di machine learning e di intelligenza artificiale (IA)".

Così facendo, il New York Times spera di mettersi al sicuro dal data scraping legato all'IA, per il quale sono già finite nel mirino aziende come OpenAI e contro cui si è schierato anche il CEO di Twitter-X Elon Musk. Per questo, il giornale specifica che nessun sistema automatizzato per lo scraping dei dati potrà essere utilizzato sulle sue pagine senza un'autorizzazione scritta da parte dell'editore. Chiunque verrà "pizzicato" ad effettuare lo scraping dei dati del NYT sarà sottoposto a delle sanzioni non meglio specificate.

Sfortunatamente, pare che il New York Times non abbia preso provvedimenti concreti contro lo scraping dei suoi dati da parte di software automatici. In altre parole, l'aggiornamento dei termini di servizio del sito web del NYT non ha comportato un'analoga revisione della sua architettura, che così resta aperta a tutti gli scraper, ovviamente a loro rischio (legale) e pericolo.