Il team Siri pubblica tre post sul blog dedicati al Machine Learning

Dopo aver lanciato il nuovo blog dedicato al Machine Learning, poche ore fa il team Siri ha condiviso tre nuovi post relativi alla ricerca presentata alla Interspeech 2017 di Stoccolma tenutasi la scorsa settimana.

Uno dei post, intitolato “Deep Learning for Siri’s Voice: On-device Deep Mixture Density Networks for Hybrid Unit Selection Synthesis“, illustra l’evoluzione della voce di Siri fino a iOS 11 e il processo utilizzato da Apple per la sintesi vocale. Sono incluse anche le registrazioni che confrontano le voci di Siri in iOS 9, iOS 10 e iOS 11 per dimostrare i miglioramenti portati avanti da Apple versione dopo versione:

Con iOS 11 abbiamo scelto una nuova e talentuosa voce femminile, con l’obiettivo di migliorare la naturalezza, la personalità e l’espressività di Siri. Abbiamo valutato centinaia di candidati prima di scegliere il migliore. Poi abbiamo registrato oltre 20 ore di dialoghi e abbiamo costruito una nuova voce TTS usando la nuova tecnologia che si basa sul deep learning. Di conseguenza, la nuova voce americana di Siri suona meglio di prima.

Gli altri due post, intitolati “Improving Neural Network Acoustic Models by Cross-bandwidth and Cross-lingual Initialization” e “Inverse Text Normalization as a Labeling Problem” spiegano come Siri utilizza il machine learning per visualizzare elementi come date, tempi e indirizzi, e quali sono le tecniche che Apple utilizza per introdurre una nuova lingua nel modo più agevole possibile.

Apple descrive questo blog come “un luogo dove gli utenti possono leggere i post scritti da ingegneri Apple che parlano del loro lavoro e dei progressi fatti per le tecnologie di machine learning in azienda”.

NovitàAcquista il nuovo iPhone 16 su Amazon
News