Come un computer capisce ciò che diciamo
Il riconoscimento vocale automatico è la tecnologia che consente ad una macchina di identificare una o più parole appartenenti ad un vocabolario prefissato, all'interno di un segnale acustico normalmente costituito da voce e rumore.
I primi sistemi di riconoscimento vocale sono stati sviluppati negli anni Settanta da centri di ricerca universitari e indipendenti statunitensi, quali il MIT (Massachusetts Institute of Technology) e la CMU (Carnegie Mellon University), oppure da centri di ricerca di società di telecomunicazione negli Stati Uniti (Bell Labs) ed in Europa (CSELT di Telecom Italia, CNET di France Telecom).
Per capire come può funzionare un computer che sia in grado di
Vogliamo un sistema che sia capace di comprendere una sola voce, la voce del padrone per così dire (riconoscitore dipendente dal parlatore, ovvero
Vogliamo un sistema che riconosca solo parole isolate (riconoscitore a parlato isolato,
Infine vogliamo un sistema capace di comprendere qualunque tipo di domanda o di richiesta (riconoscitore indipendente dal contesto) o ci è sufficiente un sistema che sappia interpretare le nostre richieste in un contesto definito (riconoscitore dipendente dal contesto), ad esempio una richiesta di informazioni sulle previsioni del tempo di domani?
Da quest’elenco di possibilità capiamo che lo stato della ricerca e le possibilità della tecnologia non consentono ancora di realizzare sistemi di riconoscimento capaci di operare con successo in un mondo senza confini. Non siamo ancora arrivati a costruire un sistema che riconosca tutte le voci, in qualsiasi situazione e indipendentemente dall’argomento. Possiamo però scegliere tra sistemi in grado di riconoscere qualunque parola e frase pronunciata da