OpenAI e Google sotto accusa per aver addestrato l'intelligenza artificiale su milioni di ore di video di YouTube

Un nuovo rapporto feroce suggerisce che Google e altre società di intelligenza artificiale hanno addestrato modelli di intelligenza artificiale sui video di YouTube, mettendo in dubbio se le società abbiano violato i diritti d'autore dei creatori di contenuti. Il rapporto approfondisce le profondità a cui sono arrivate aziende come OpenAI e Meta per raschiare il barile dei creatori di YouTube per addestrare modelli di intelligenza artificiale.

Quest'ultima rivelazione arriva subito dopo l'amministratore delegato di YouTube, Neal Mohan, che accusa OpenAI di utilizzare video di YouTube per addestrare il generatore di testo in video di OpenAI, Sora. Tutto ciò non fa altro che gettare benzina sul fuoco per coloro che sostengono che le società di intelligenza artificiale, come OpenAI, hanno violato le leggi sul copyright con i suoi atti eccessivi per addestrare la propria intelligenza artificiale. Le ultime accuse includono OpenAI che sta sviluppando il suo modello di trascrizione audio Whisper per trascrivere oltre 1 milione di ore di video di YouTube al fine di addestrare il suo modello AI GPT-4.

loghi di youtube openai

Il portavoce di OpenAI Lindsay Held ha osservato in una recente intervista che la società di intelligenza artificiale raccoglie set di dati “unici” per i suoi modelli per “aiutarli nella comprensione del mondo” e per mantenere il suo vantaggio competitivo in tutto il mondo. Held ha continuato aggiungendo che OpenAI utilizza anche “numerose fonti tra cui dati disponibili al pubblico e partnership per dati non pubblici”.

Le fonti hanno indicato che Google era a conoscenza del fatto che OpenAI e altri utilizzassero video di YouTube per addestrare i suoi modelli di intelligenza artificiale, ma hanno chiuso un occhio sulla situazione perché Google stava facendo la stessa cosa. Google ha detto Il New York Times che lo fa solo con i video dei creatori che accettano di farlo. Non è chiaro, tuttavia, se altre società di intelligenza artificiale aderiscano allo stesso standard di condotta. Secondo le regole di Google, è vietato lo “scraping o il download non autorizzato di contenuti YouTube” e Google non era “a conoscenza” del fatto che OpenAI infrangesse questa regola d'oro.

Advertisement

Mentre la battaglia per il dominio dell’intelligenza artificiale continua a infiammarsi, non c’è dubbio che le aziende di intelligenza artificiale cercheranno qualsiasi metodo o mezzo per ottenere un vantaggio, o almeno rimanere competitive. Il rapporto affermava inoltre che Google aveva un team incaricato di modificare la propria politica sulla privacy nel giugno 2023 per avere una copertura più ampia quando si tratta di utilizzare contenuti disponibili al pubblico, come Google Documenti e Fogli Google.

Le nuove accuse sollevano solo ulteriori domande quando si tratta di arrivare lontano per cui le aziende possono arrivare addestrare modelli di intelligenza artificiale. Fino a che punto il governo consentirà ad aziende come OpenAI, Meta e Google di spingersi prima di stabilire finalmente confini chiari per il diritto del pubblico alla privacy e ai diritti d'autore sulle loro opere creative?

Advertisement

Advertisement