Apple spiega come addestra Apple Intelligence usando (anche) i tuoi dati

Apple introduce un nuovo sistema per addestrare Apple Intelligence.

Apple-Intelligence

Mentre il debutto completo delle funzionalità avanzate di Siri con Apple Intelligence è stato rinviato, Apple rilancia sul piano della qualità dell’addestramento dei suoi modelli linguistici, senza però rinunciare alla tutela della privacy degli utenti.

In un nuovo report pubblicato da Bloomberg e basato su un documento ufficiale della divisione Apple Machine Learning Research, l’azienda spiega nei dettagli il nuovo approccio ibrido all’addestramento dell’AI, che mette insieme dati sintetici e una piccola parte delle email reali degli utenti, ma in un modo completamente anonimo, decentralizzato e rispettoso della privacy.

Apple ha sempre fatto affidamento su dati sintetici per addestrare i suoi modelli linguistici, ovvero messaggi, frasi ed email generate artificialmente. Questo approccio garantisce una base ampia e controllata, ma ha un limite importante: i dati sintetici non riescono a catturare le sfumature linguistiche dei messaggi reali, come i trend nei modi di dire, la struttura delle email, le variazioni nei toni e nei contenuti.

Ecco perché Apple ha deciso di introdurre una nuova tecnologia, disponibile prossimamente in beta su iOS 18.5 e macOS 15.5, che affianca al modello sintetico un confronto intelligente con i dati reali dell’utente, senza mai esporli ai server di Apple.

In pratica, Apple genera un ampio set di email sintetiche (esempio: “Vuoi giocare a tennis domani alle 11:30?”). Ogni messaggio viene trasformato in un embedding, ovvero una rappresentazione matematica che ne sintetizza lingua, argomento, lunghezza e struttura.

Questi embedding vengono inviati solo ai dispositivi degli utenti che hanno attivato “Analisi dispositivi” nelle impostazioni. A questo punto, i dispositivi selezionano un piccolo campione di email recenti, mai inviate ad Apple, e le trasformano anch’esse in embedding.

Il confronto avviene localmente: il dispositivo determina quali email sintetiche sono più simili a quelle reali. Quindi, il dispositivo invia ad Apple solo l’identificativo delle email sintetiche più rilevanti, non i dati reali.

Apple utilizza questi risultati per affinare e creare nuovi set sintetici sempre più “vicini al linguaggio reale”.

In questo modo, Apple migliora le capacità di generazione e sintesi di testo (come i riassunti email in Siri) senza mai sapere nulla dei tuoi contenuti personali.

Il cuore del sistema si basa su una tecnica chiamata differential privacy, una metodologia già utilizzata da Apple per raccogliere statistiche senza compromettere l’identità degli utenti. Con questo approccio, Apple può rilevare trend generali, ma non può mai sapere chi ha scritto cosa, né accedere a contenuti specifici.

Offerte Amazon di oggi
News