Il futuro del Voice Recognition

Condividi!

Siamo passati da scene epiche in cui si litigava con una macchina per cercare di farsi comprendere a interazioni con sistemi a riconoscimento vocale si sono evoluti in modo impressionante e sono entrati a far parte della quotidianità delle persone tanto da non poterne più fare a meno. Pensiamo a Google, Siri ma a quello che sta per arrivare nel nostro Paese ma che in altri è già realtà: gli smart speakers/home devices tipo Alexa, Google Home, Homepod etc etc.

Da molte parti si dice il futuro è rappresentato dal Voice recognition perché frictionless (e tutto quello che è frictionless è benedetto), quindi naturale, e fa risparmiare tempo (i comandi vocali possono essere dati in situazioni multitask). Vediamo cosa dicono altri esperti del settore.

Chris Kirby, VP of Voices.com


“Voice recognition e l’artificial intelligence e la comprensione potrà solo divenire più sofisticata andando avanti. going forward. Una volta definiti i contenuti di base, ci si potrà concentrare sulla emissione vocale, il tono di voce e cose di questo genere.

In futuro non solo gli algoritmi capiranno quello che diciamo, ma anche come. L’inflessione di tono e altre caratteristiche aggiungeranno significato alla parola parlata e diventeranno parte del processo di comprensione. In questo modo si potrà determinare l’umore del parlante, il livello di stress e il grado di veridicità delle cose che dice. Questo sistema potrebbe essere utilizzato in situazioni di sicurezza, ad esempio o per diagnosticare lo stato mentale di persone sotto processo. Infine, altri elementi performativi, come il sarcasmo, potrebbero essere riconosciuti e aggiungere un livello importante alla comunicazione.”

 

Daria Evdokimova, CEO & Co-founder of VoiceOps


“Nei prossimi 5-10 anni, è molto possibile che le macchine speech-to-text sorpasseranno le attuali capacità umane di trascrizione sia in accuratezza che velocità. La velocità nello sviluppo tecnologico aumenterà ulteriormente nei prossimi anni grazie anche alla diffusione dei virtual assistant come Alexa e Siri.

L’evoluzione ci porterà a vedere, probabilmente, l’applicazione del Natural Language Processing (NLP) direttamente sui dati audio rispetto all’applicazione sulle trascrizioni di dati audio. Gli esseri umani interpretano i dati audio riconoscendo i suoni che arrivano dalle parole, non trascrivendo i suoni in testo e poi leggendo il testo. E’ molto più naturale.”

Rishi Khanna, CEO of ISHIR


“The sci-fi movies are turning real. We can already see that as we have started talking to devices. There have been major advances in speech recognition, supported by faster wireless speeds, and the phenomenal cloud computing growth, what can possibly stop the growth of voice assistants? As humans, we are an inquisitive lot and we wonder what next to Alexa, Siri and OK Google.

In futuro, i virtual assistant domineranno le nostre vite, poiché la voce ci aiuterà a comunicare con i nostri sistemi di domotica ad esempio. Cresceranno enormemente anche i device controllati dalla voce. La mobilità hands-free avrà un ruolo critico negli ospedali, nei laboratori nelle factory. In più avremo molta più intelligence nelle nostre vetture, nell’intrattenimento, nei trasporti e servizi location based. Sempre per lasciare le mani libere alle persone.”

Tyler Schulze, VP of Strategy & Development, Cognitive Engines at Veritone, Inc


“In meno di 10 anni, le macchine avranno la capacità di identificare il voiceprint di ciascuno di noi attraverso il relativo spettogramma, in real time. Pubblico e privato possono già correlare le registrazioni vocali ai profili personali delle persone come chiamate al customer service, segreterie telefoniche e video distribuiti sui social.

Similarmente, gli algoritmi potranno presto riprodurre una voce perfettamente. Ovviamente tutto questo continua a creare domande sulla sicurezza e l’anonimato.”

 

Brian Roemmele, Founder & Editor-in-chief of Multiplex Magazine


“All prior computer interaction systems have one central point in common. They force humans to be more like the computer by forcing the operator to think through arcane commands and procedures. We take it for granted and forget the ground rules we all had to learn and continue to learn to use our computers and devices. I equate this to learning any arcane language that requires new vocabularies as new operating systems are released and new or updated applications are available.

What if we didn’t need to learn arcane commands? What if you could use the most effective and powerful communication tool ever invented? This tool evolved over millions of years and allows you to express complex ideas in very compact and data dense ways yet can be nuanced to the width of a hair. What is this tool? It is our voice.

We are at the precipice of something grand and historic. Each improvement in the way we interact with computers brought about long term effects nearly impossible to calculate. Each improvement of computer interaction lowered the bar for access to a larger group. Each improvement in the way we interact with computers stripped away the priesthoods, from the 1960s computer scientists on through to today’s data science engineers. Each improvement democratized access to vast storehouses of information and potentially knowledge.

The last 60 years of computing humans were adapting to the computer. The next 60 years the computer will adapt to us. It will be our voices that will lead the way; it will be a revolution and it will change everything.”

 

Peter T. Boyd, President & Founder of PaperStreet


“Star Trek style full conversations where the computer interacts with the user and can control technology. Everyone can have a personal assistant to get routine tasks done, items purchased, calculations made, and control devices in your office, home and car. With that will be security concerns in being able to mimic voices and break-into various devices, but they can probably be overcome with additional security in other ways (pass codes or other body signatures).”

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Close
[wpgmza id="1"]
[contact-form-7 id="135" title="Contact form 1"]