Bloomberg riporta che Amazon, con l’obiettivo di migliorare la tecnologia di riconoscimento vocale di Alexa, impiega migliaia di persone in tutto il mondo per ascoltare, trascrivere e annotare clip audio registrate dai dispositivi Echo.
Citando fonti che hanno lavorato al progetto, Bloomberg afferma che Amazon ha dato incarico a migliaia di persone (tra dipendenti diretti e di società terze) di ascoltare quanto registrato dai dispositivi Echo in tutto il mondo. Questo lavoro ha l’obiettivo di aiutare Alexa a capire sempre meglio le richieste degli utenti.
Le clip che vengono ascoltate dai dipendenti Amazon includono sia i comandi espliciti ad Alexa, sia conversazioni in background. In pratica, quando un utente pronuncia una delle frasi trigger degli Echo (“Alexa”, “Echo”, “Computer”), il dispositivo avvia una connessione ai server di Amazon. Le registrazioni audio iniziano subito dopo.
Con gli Echo disponibili nelle case e negli uffici di tutto il mondo, gli utenti parlano liberamente citando nomi di persone o condividendo magari dati sensibili come le informazioni bancarie. In questo caso, Amazon ha dato ordine di contrassegnare queste clip come “dati critici“.
Il problema è che Amazon non informa gli utenti sul fatto che alcune conversazioni di Alexa vengono ascoltate dai propri dipendenti, anche se sul sito web dell’azienda viene specificato che “le richieste degli utenti ad Alexa vengono utilizzate per migliorare i nostri sistemi di riconoscimento vocale e di comprensione del linguaggio naturale”.
Le persone che hanno lavorato al progetto affermano che questo tipo di lavoro è poco interessante, visto che per lo più vengono registrate le richieste musicali inviate ad Alexa. Due dipendenti hanno però raccontato di aver ascoltato quella che sembrava essere una violenza sessuale in atto. In questi casi, visto che tutte le informazioni sono comunque anonime (tranne il numero di serie del prodotto), Amazon ha detto ai dipendenti che non è responsabilità dell’azienda agire per vie legali. Sembra anche che i dipendenti Amazon abbiamo iniziato a condividere tra di loro clip inquietanti o divertenti registrate tramite Alexa.
“Prendiamo sul serio la sicurezza e la privacy delle informazioni personali dei nostri clienti”, ha dichiarato Amazon dopo la pubblicazione di questo report. “Annotiamo solo un campione estremamente ridotto di registrazioni vocali di Alexa per migliorare l’esperienza del cliente. Ad esempio, queste informazioni ci aiutano ad addestrare i nostri sistemi di riconoscimento vocale e di comprensione del linguaggio naturale, in modo che Alexa possa capire meglio le vostre richieste e assicurare che il servizio funzioni bene per tutti“.
Con l’intervento umano, Amazon è in grado di insegnare al software di Alexa di riconoscere e rispondere a determinate parole e frasi. Come la maggior parte delle tecnologie di riconoscimento vocale, Alexa è alimentata dall’intelligenza artificiale, ma il sistema richiede una puntuale formazione da parte di operatori umani, in questo caso da lavoratori provenienti da Boston, Costa Rica, India e Romania. Queste persone possono ascoltare fino a 1.000 clip al giorno, afferma report di Bloomberg.
Ricordiamo che anche Apple impiega un processo di revisione umana per migliorare Siri. In un white paper sulla sicurezza, Apple fece sapere che Siri salva le registrazioni vocali “in modo che il sistema di riconoscimento possa utilizzarle per capire meglio la voce dell’utente“. Dalle registrazioni vengono rimosse tutte le informazioni identificabili, inoltre viene assegnato un identificatore casuale del dispositivo e vengono salvate per sei mesi, durante i quali il sistema può attingere ai dati per scopi di apprendimento. Dopo il periodo di sei mesi, l’identificatore viene cancellato e la clip viene salvata “per essere utilizzata da Apple per un massimo di due anno allo scopo di migliorare e sviluppare Siri”
Cosa ne pensate?