Apple, come tutte le grandi multinazionali, vuole sapere il più possibile sui propri clienti. L’azienda, però, ha anche un’immagine da tutelare che in questi anni si è legata sempre di più alla protezione della privacy dei propri clienti, a differenza di concorrenti come Google che dai dati degli utenti ci guadagna direttamente. Insomma, Apple vuole sapere il più possibile, ma anche… il meno possibile. E durante il keynote della WWDC 2016, l’azienda ha presentato la sua “Differential Privacy”, che cerca di spiegare questo piccolo paradosso.
Per chiarire questa situazione, Craig Federighi ha sottolineato che Apple non raccoglie i profili degli utenti e che su iMessage e FaceTime è attiva la cifratura end-to-end che rende praticamente impossibile decifrare i messaggi privati e le conversazioni audio/video degli utenti. Inoltre, Apple cerca di mantenere la maggior parte dei dati in locale, sul dispositivo dell’utente, senza memorizzare nulla sui propri server. Ma Federighi ha anche riconosciuto che la raccolta di alcune informazioni utente è fondamentale per migliorare il software, qualsiasi software, soprattutto in un’epoca di grande analisi dei dati e di apprendimento automatico. La risposta di Federighi si chiama “Differential Privacy“, che lui stesso ha cercato di spiegare: “Crediamo che si dovrebbero offrire agli utenti grandi funzionalità e grande tutela della privacy. La Differential Privacy è un tema di ricerca nei settori delle statistiche e analisi dei dati che utilizza hashing e sottocampionamenti per permettere l’apprendimento di alcune informazioni di gruppo, mantenendo i dati dei singoli utenti completamente privati. Apple ha fatto un super-lavoro in questo settore, per permettere la privacy differenziale e distribuirla su larga scala”.
In pratica, la Differential Privacy è una scienza statistica che cerca di imparare il più possibile su un gruppo, e il meno possibile sui singoli individui che ne fanno parte. Con la privacy differenziale, Apple può raccogliere e memorizzare i dati dei propri utenti in un formato che gli permette di avere informazioni su ciò che le persone fanno, su come lo fanno e su cosa vogliono. Ma Apple non può conoscere informazioni su un singolo individuo. E nessuno, nè hacker nè agenzie governative, sarebbe mai in grado di farlo sul software Apple.
Tramite un apposito algoritmo, Apple raccoglie i dati in gruppi e utilizza queste informazioni statistiche per migliorare il proprio software, senza però sapere mai nulla sui singoli utenti. Si tratta di una scienza conosciuta, che rende matematicamente impossibile accedere ai dati dei singoli utenti.
Federighi ha quindi ammesso che Apple raccoglie una serie di dati degli utenti sui propri server, proprio come fanno Google e Facebook, ma tali dati vengono gestiti in maniera differenziale, tramite tre tipologie di trasformazioni:
- Hashing, una funzione di crittografia che trasforma in modo irreversibile i dati in una stringa unica di caratteri casuali
- Sottocampionamento, che permette di prendere solo una parte dei dati
- Noise injection, che aggiunge dati casuali per oscurare i dati sensibili e reali dei singoli utenti
Questa tecnologia sarà utilizzata a partire da iOS 10, per aiutare Apple a scoprire le modalità di utilizzo del sistema operativo da parte degli utenti. Questo permetterà all’azienda di consocere le abitudini degli utenti e le loro esigenze, in maniera del tutto anonima, così da poter migliorare l’esperienza generale di utilizzo del software.