Fine della privacy, automatizzata la lettura labiale

La nuova tecnologia per la lettura labiale è stata sviluppata presso l’Università di East Anglia potrebbe aiutare a risolvere i crimini e fornire assistenza di comunicazione per le persone con problemi di udito e disturbi del linguaggio.
La tecnologia di riconoscimento vocale visiva è stata creata dalla dottoressa Helen L. Bear e il Prof Richard Harvey dell’UEA School of Computing Sciences. La dottoressa Helen L. Bear ha detto:
«La tecnologia per la lettura labiale può essere applicata in qualsiasi luogo in cui l’audio non è sufficiente per determinare ciò che si dice. I risultati presentati in occasione dell’International Conference on Acoustics, Speech and Signal Processing (ICASSP) a Shanghai il 25 marzo, hanno evidenziato che i problemi unici per determinare un discorso sorgono quando il suono non è disponibile ad esempio su filmati CCTV, o se l’audio è inadeguato e non ci sono indizi per dare il contesto di una conversazione. I suoni “p”, “b”, “e”, “m”, sulle labbra ha un aspetto simile, ma ora per una traduzione più accurata la tecnologia di classificazione della macchina della lettura labiale può distinguere tra i suoni.
Stiamo ancora imparando la scienza del linguaggio visivo e ciò che la gente ha bisogno di sapere per creare un modello di riconoscimento infallibile per la lettura labiale, questo sistema di classificazione migliora i precedenti metodi di lettura labiale utilizzando un sistema di formazione innovativo per i classificatori.
Potenzialmente, un robusto sistema di lettura labiale potrebbe essere applicato in una serie di situazioni, dalle indagini penali all’intrattenimento. La lettura labiale è utilizzata per individuare le parole dei calciatori urlate nei momenti più caldi in campo, è probabile che sia di uso più pratico in situazioni in cui ci sono alti livelli di rumore, come ad esempio in auto o nelle cabine di pilotaggio degli aerei.
Fondamentalmente, mentre ci sono ancora miglioramenti da apportare, un tale sistema potrebbe essere adattato per l’uso per una serie di scopi, ad esempio, per le persone con menomazioni dell’udito o della parola. In alternativa, una buona macchina per la lettura labiale potrebbe integrarsi in un sistema di riconoscimento audiovisivo».
Il Prof Harvey ha aggiunto:
«La lettura delle labbra è uno dei problemi più difficili nel campo dell’intelligenza artificiale quindi è ottimo per fare progressi su uno degli aspetti più complicati, come quello di addestrare le macchine a riconoscere l’aspetto e la forma delle labbra umane».
La ricerca fa parte di un progetto triennale, è stata sostenuta dal Dipartimento di Ingegneria e Scienze Fisiche Research Council (EPSRC).
Il documento, “Decoding visemes: Improving machine lip-reading” (Decodifica visemi: migliorare la macchina di lettura labiale), è stato pubblicato il 25 marzo 2016 su Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing 2016.

,
Avatar photo

About Pino Silvestri

Pino Silvestri, blogger per diletto, fondatore, autore di Virtualblognews, presente su Facebook e Twitter.
View all posts by Pino Silvestri →

Lascia un commento