Apple ha pubblicato un nuovo articolo sul suo Machine Learning Journal, blog dedicato all’apprendimento automatico. Questa volta, gli ingegneri audio di Apple hanno spiegato le sfide che hanno dovuto affrontare per integrare il riconoscimento vocale nell’HomePod, oltre al modo in cui lo speaker utilizza modelli di apprendimento automatico sfruttando il chip A8.
Gli ingegneri spiegano che l’HomePod deve essere in grado di mantenere un’elevata accuratezza del riconoscimento vocale, anche quando è in riproduzione musica ad alto volume tramite lo speaker stesso, quando l’utente è lontano e quando ci sono altri rumori nella stanza.
Il post è dedicato ad un pubblico molto tecnico, e chiaramente il linguaggio usato da Apple riflette questo target. In estrema sintesi, Apple spiega che l’HomePod utilizza un filtro multicanale personalizzato per eliminare l’eco e i rumori di fondo, grazie a modelli di apprendimento automatico che permettono di isolare la voce dell’utente che ha pronunciato la frase “Hey Siri”, anche rispetto alle voci delle altre persone presenti nella stanza.
Vengono quindi spiegati tutti i meccanismi di questo sistema, anche tramite formule matematiche che piaceranno a tutti gli ingegneri che ci stanno leggendo. Ad esempio, Apple spiega che il processore audio multicanale utilizza meno del 15% di un singolo core del chip A8 che si trova all’interno dell’HomePod.