La scorsa settimana un gruppo di ricercatori di Microsoft ha annunciato lo sviluppo di VALL-E, un nuovo modello di intelligenza artificiale in grado di riprodurre fedelmente la voce di una persona partendo da un breve frammento audio. Dopo aver “ascoltato” solamente 3 secondi di specifica voce, VALL-E è poi in grado di leggere un qualsiasi testo imitando la voce in modo estramemente fedele, preservando anche il tono emotivo originale dell’oratore. Un sistema di questo genere potrebbe essere applicati in moltissimi contesti, dal cinema ai call center. Per ora i ricercatori non ha fornito il codice di VALL-E, probabilmente per evitare di alimentare sfiducia e inganni: con VALL-E sarebbe fin troppo facile spacciarsi per qualcun’altro e utilizzarlo in modo improprio per scherzi o, peggio, truffe telefoniche.
Rischio scampato? Certo che no! Ora che ne è stata dimostrata la concreta fattibilità, è solo questione di mesi prima che qualche concorrente (o malintenzionato) sviluppi un sistema analogo e inizi a commercializzarlo o utilizzarlo per i propri interessi.