Apple spiega nel dettaglio come funziona il Deep Neural Network di “Hey Siri”

Apple ha pubblicato un nuovo articolo nel suo Machine Learning Journal, spiegando nel dettaglio il funzionamento di “Hey Siri” e del relativo Deep Neural Network.

Il post pubblicato da Apple è molto tecnico e spiega nel dettaglio i vari meccanismi che si nascondono dietro Siri e il suo DNN (Deep Neural Network).

Apple spiega che il microfono di iPhone e Apple Watch “trasforma la tua voce in un flusso di campioni di forme d’onda istantanee, con un tasso di 16.000 onde al secondo” prima che il rilevatore presente sul dispositivo decida se l’utente sta effettivamente richiamando Siri. In pratica, lo stadio di analisi dello spettro converte il flusso voce in forme d’onda, con uno spettro sonoro di circa 0,01 secondi. Circa venti di questi fotogrammi alla volta (0,2 secondi di audio) vengono trasmessi  alla rete neurale che converte questi modelli acustici in un insieme di classi vocali: quelle utilizzate nella frase “Hey Siri”, più il silenzio successivo ed eventuali altri suoni, per un totale di 20 classi.

Apple spiega poi che utilizza una serie di variabili per decidere se l’utente sta realmente invocando Siri: “Abbiamo costruito il tutto con una certa flessibilità per facilitare l’attivazione di Siri in condizioni difficili e per evitare al massimo attivazioni false. Esiste una soglia primaria o normale, e poi una soglia inferiore che normalmente non fa attivare Siri. Se il punteggio supera la soglia inferiore, ma non quella superiore, allora è probabile che l’utente stia chiamando l’evento “Hey Siri”. Quando il punteggio è in questo intervallo, il sistema entra in uno stato più sensibile per alcuni secondi, in modo tale che se l’utente ripete la frase senza particolari sforzi allora verrà quasi sicuramente riconosciuta.  

Su Apple Watch, il rilevatore “Hey Siri” funziona solo quando il coprocessore di movimento rileva un gesto di sollevamento del polso.

Infine, Apple spiega perchè è stata scelta proprio la frase “Hey Siri”: “Prima di attivare questa funzione, una piccola percentuale di utenti già diceva la frase Hey Siri subito dopo aver cliccato sul tasto Home per richiamare l’assistente virtuale. Abbiamo quindi iniziato a fare i primi test in inglese con questa frase e i risultati erano positivi”. 

NovitàAcquista il nuovo iPhone 16 su Amazon
News