Cosa non torna nelle spiegazioni sulla “selezione delle voci” per ChatGPT?
In seguito alle polemiche e alla lettera scritta da Scarlett Johansson, l'azienda di Sam Altman ha provato a spiegare i criteri di "selezione" per il suo assistente vocale
21/05/2024 di Enzo Boldi
Non vengono fatti nomi e cognomi. Si parla di un numero molto alto (400) di candidature che, alla fine, sono state scremate per arrivare a cinque. Si tratta di attori e doppiatori cinematografici che hanno partecipato a una vera e propria selezione. Fino ad arrivare al prodotto finale annunciato nei giorni scorsi: le 5 voci del nuovo modello GPT-4o lanciato da OpenAI. Questa, in sintesi, la spiegazione fornita da Sam Altman all’indomani delle polemiche attorno a una di queste voci (quella rinominata “Sky” e attualmente sospesa dopo le polemiche) che somiglierebbe a quella dell’attrice americana Scarlett Johansson.
LEGGI ANCHE > Annunci il tuo assistente vocale con il riferimento a “Her”, ma poi neghi che la voce sia di Scarlett Johansson
Una narrazione che, per dinamica, stride con il racconto fatto dalla stessa stella di Hollywood nelle scorse ore. Quest’ultima, infatti, ha spiegato di esser stata contattata da Sam Altman nel settembre scorso, nel tentativo di trovare un accordo per “prestare” la sua voce a uno degli assistenti vocali di ChatGPT. L’attrice, dopo alcune riflessioni, ha rifiutato la proposta, ma quella voce di “Sky” sembra essere molto simile (anche nelle sfumature) alla sua.
Voci GPT-4o, la spiegazione di OpenAI
Ora che proprio questa voce è stata rimossa, OpenAI ha provato a spiegare a tutti le dinamiche della selezione di quelle voci catalogate e utilizzate come assistenti vocali dell’innovativo modello GPT-4o. Viene raccontato di come questo progetto fosse nato all’inizio del 2023, partendo dalla collaborazione con direttori di casting e produttori indipendenti «noti e pluripremiati». Tutti alla ricerca di profili che dovevano rispettare alcune caratteristiche:
- Attori provenienti da contesti diversi o che potrebbero parlare più lingue.
- Una voce che sembra senza tempo.
- Una voce accessibile che ispira fiducia.
- Una voce calda, coinvolgente, che ispira fiducia, carismatica con un tono ricco.
- Naturale e facile da ascoltare.
Da quel momento, era il mese di maggio dello scorso anno (quindi un anno fa) sono iniziate le audizioni a cui hanno partecipato – moltissimi doppiatori e attori americani:
«Nel maggio del 2023, l’agenzia di casting e i nostri direttori del casting hanno lanciato un bando di selezione per talenti. In meno di una settimana, hanno ricevuto oltre 400 proposte da doppiatori e attori cinematografici. Per l’audizione, agli attori è stata fornita una sceneggiatura delle risposte ChatGPT e gli è stato chiesto di registrarle. Questi esempi spaziavano dalla risposta a domande sulla consapevolezza al brainstorming sui piani di viaggio e persino al coinvolgimento in conversazioni sulla giornata di un utente».
Oltre 400 candidature per selezionare le cinque voci che – oggi – si celano dietro i nomi di altrettanti assistenti vocali dell’evoluzione di ChatGPT: Breeze, Cove, Ember, Juniper e, per l’appunto, Sky.
Le dinamiche
Prima , però, quei 400 nomi erano stati scremati “manualmente” per ridurre la rosa a 14 candidati. Questi ultimi, nei mesi di giugno e luglio, si sono recati – come spiega OpenAI – negli studi di San Francisco per registrare le loro voci. Da qui, la selezione finale dei cinque vincitori che si è conclusa alla fine dell’estate. Insomma, questo è ciò che spiega l’azienda di Sam Altman, sottolineando come il 25 settembre scorso siano state lanciate queste voci selezionate su ChatGPT. Dunque, molti mesi prima rispetto al lancio di GPT-4o.
Ma è proprio questo calendario a non rendere chiare le cose. Perché contattare Scarlett Johansson a settembre del 2023 se le procedure di selezione e casting si erano completate nei mesi precedenti? Perché non trovare il modo di dichiarare al pubblico i nomi e i cognomi di chi ha prestato la loro voce ai cinque assistenti vocali di ChatGPT? Domande che sollevano più di qualche dubbio sul reale comportamento di Sam Altman e della sua azienda.