Una richiesta semplice, una frase breve: il cervello umano interpreta facilmente ciò che si intende, crea il contesto e innesca una reazione corrispondente. Per una macchina tutto questo è molto più complicato. Per poter controllare dispositivi tecnici tramite la voce, sono necessari molti singoli passaggi.

Riconoscere e interpretare il linguaggio

"Dammi una penna!". Un comando molto semplice come questo mantiene fortemente occupato il computer in background. Per prima cosa, la frase pronunciata viene convertita in testo. Il software di riconoscimento vocale deve riconoscere quali parole sono contenute sulla base degli schemi di frequenza e, quindi, superare diversi ostacoli: pronuncia indistinta, parole identiche con significati diversi, accenti o dialetti diversi. Confrontando la frase con database enormi, in cui sono memorizzati innumerevoli esempi di parole e i loro modelli di frequenza, il software scopre di quali parole si tratta.

Il passo successivo è quello di capire il significato della frase. A tal fine, il software invia il testo a un'interfaccia vocale, che verifica la presenza di determinate parole chiave. Il programmatore deve definire anticipatamente tutti i termini e i comandi necessari, i cosiddetti Intents, nonché i loro sinonimi e definire quale azione dovrebbe esserci dietro. Ad esempio, la prima parte di "Dammi", ossia "Da", viene riconosciuta come una richiesta di trasportare un oggetto fino a un certo punto, mentre il suffisso "[m]mi" viene inteso come una persona o come obiettivo dell'azione.

L'intelligenza artificiale trova la soluzione ottimale

Una volta che l'interfaccia ha riconosciuto il significato della frase, genera un cosiddetto oggetto contesto: un codice software con il quale il controller del dispositivo può lavorare. Per poter dare istruzioni chiare alla macchina, "l'intelligenza artificiale" mette in campo qui un software aggiuntivo. Questo software analizza il contenuto dell'oggetto di contesto e riceve simultaneamente informazioni sulla posizione del dispositivo e su ciò che gli sta intorno da vari sensori. Il software contiene moduli per diversi metodi di soluzione, che vengono assegnati ad azioni specifiche.