Apple ha pubblicato un nuovo articolo sul suo Machine Learning Journal, andando ad approfondire alcuni dettagli tecnici su come viene utilizzata la privacy differenziale per raccogliere informazioni anonime anche durante l’utilizzo delle emoji e della funzione QuickType sulla tastiera di iOS. E non mancano alcune curiosità proprio sull’utilizzo delle emoji da parte degli utenti Apple.
La Privacy Differenziale è una scienza statistica che cerca di imparare il più possibile su un gruppo, e il meno possibile sui singoli individui che ne fanno parte. Con la privacy differenziale, Apple può raccogliere e memorizzare i dati dei propri utenti in un formato che gli permette di avere informazioni su ciò che le persone fanno, su come lo fanno e su cosa vogliono. Ma Apple non può conoscere informazioni su un singolo individuo. E nessuno, nè hacker nè agenzie governative, sarebbe mai in grado di farlo sul software Apple. Tramite un apposito algoritmo, Apple raccoglie i dati in gruppi e utilizza queste informazioni statistiche per migliorare il proprio software, senza però sapere mai nulla sui singoli utenti. Si tratta di una scienza conosciuta, che rende matematicamente impossibile accedere ai dati dei singoli utenti.
In pratica, i dati raccolti da Apple vengono gestiti in maniera differenziale, tramite tre tipologie di trasformazioni:
- Hashing, una funzione di crittografia che trasforma in modo irreversibile i dati in una stringa unica di caratteri casuali
- Sottocampionamento, che permette di prendere solo una parte dei dati
- Noise injection, che aggiunge dati casuali per oscurare i dati sensibili e reali dei singoli utenti
Questa tecnologia viene utilizzata a partire da iOS 10, per aiutare Apple a scoprire le modalità di utilizzo del sistema operativo da parte degli utenti. Questo permetterà all’azienda di consocere le abitudini degli utenti e le loro esigenze, in maniera del tutto anonima, così da poter migliorare l’esperienza generale di utilizzo del software.
Esistono quindi due tipi di privacy differenziale: centralizzata e locale. Apple ha scelto di utilizzare quella locale, il che significa che i dati vengono randomizzati prima di essere inviati dai vari dispositivi, in modo che i server non possano mai visualizzare o ricevere i dati non elaborati dagli utenti.
Quando gli utenti impostano il loro dispositivo, Apple chiede esplicitamente se desiderano fornire informazioni anonime sull’utilizzo del terminale. Se l’utente rifiuta, nessun dato viene raccolto da Apple a meno che l’utente non cambi idea in un secondo momento (andando in Impostazioni > Privacy > Analisi)
Apple spiega che i dati raccolti servono a migliorare l’esperienza degli utenti. Ad esempio, per suggerire le parole in QuickType o le emoji più utilizzate. Inoltre, i dati servono anche a identificare siti web che non si caricano correttamente e che consumano troppa memoria o batteria.
Esempio pratico, quando un utente che ha attivato la funzione Analisi digita una emoji:
- I dati vengono immediatamente resi anonimi tramite la privacy differenziale locale
- I dati vengono temporaneamente memorizzati sul dispositivo utilizzando una tecnologia chiamata Data Protection, spiegata nel dettaglio anche nella Guida alla sicurezza su iOS di Apple
- Successivamente, un campione casuale di dati viene raccolto e inviato ai server Apple
I dati inviati ad Apple non includono identificatori dei dispositivi, timestamp o altri dati legati all’utente. La comunicazione tra un dispositivo e il server Apple è crittografata tramite TLS.
Piccola curiosità: l’emoji più utilizzata dagli utenti che utilizzano la tastiera inglese è quella della faccina che ride, seguita dal cuoe e dalla faccina che piange.
E voi, quale emoji utilizzate di più?