Pogovarjanje s stroji

Novi koncepti upravljanja umetne inteligence

"Siri, kakšno bo danes vreme?" "Ok, Google, utišaj glasbo!" "Alexa, ponovno mi naroči modre superge!" Tehnologija, ki uboga vsako vašo besedo, je z glasovnimi pomočniki že zdavnaj postala del vsakdanjega življenja. V ozadju potekajo zapleteni procesi programske opreme, ki zagotavljajo nemoteno upravljanje prek jezika. Za pravilno razlago govorjenih ukazov so nujni: veliko pripravljalnega dela, visoka zmogljivost računalnika in ne nazadnje umetna inteligenca.

Preprosta prošnja, kratka poved – za človeške možgane je otročja igra, da razberejo, kaj je mišljeno, ugotovijo kontekst in sprožijo ustrezen odziv. Pri stroju je to veliko bolj zapleteno. Če želite upravljati tehnične naprave z govorom, je treba opraviti veliko posameznih korakov.

Prepoznavanje in tolmačenje jezika

"Daj mi svinčnik!" – zelo preprost ukaz, ki pa v ozadju močno zaposluje računalnik. Najprej se izgovorjena poved pretvori v besedilo. Programska oprema za prepoznavanje govora mora uporabiti frekvenčni vzorec, da prepozna, katere besede so vsebovane, in pri tem premaga številne izzive: nejasna izgovarjava, enake besede z različnimi pomeni, različne intonacije ali narečja. Programska oprema jih primerja z obsežnimi podatkovnimi zbirkami, ki vsebujejo nešteto primerov besed in njihovih frekvenčnih vzorcev, ter tako ugotovi, za katere besede gre.

Naslednji korak je razvozlati pomen povedi. Pri tem programska oprema pošlje besedilo glasovnemu vmesniku, ki v njem preveri določene ključne besede. Programer mora vnaprej opredeliti vse potrebne izraze in ukaze – tako imenovane namere – ter njihove sopomenke in določiti, katero dejanje se bo skrivalo za vsakim od njih. Na primer "daj" je prepoznano kot prošnja za transport predmeta na določen kraj, beseda "meni" pa je razumljena kot oseba ali cilj dejanja.

Umetna inteligenca najde optimalno rešitev

Če vmesnik prepozna pomen povedi, izpiše tako imenovani kontekstni predmet: programska koda, s katero lahko deluje nadzor enote. Da bi stroju dali jasna navodila za ukrepanje, je zdaj v igri "umetna inteligenca" z dodatno programsko opremo. Ta oceni vsebino predmeta konteksta in hkrati od različnih senzorjev prejme informacije o položaju naprave in njene okolice. Programska oprema vsebuje module za različne rešitve, ki so dodeljene določenim ukrepom.

Iz vseh teh informacij program sestavi ukaz, kako in kam naj se na primer premakne roka prijemala, in ga pošlje v krmilnik naprave. Senzorska tehnologija prepozna, kje na mizi je svinčnik in katero pot mora naprava opraviti, da ga pobere in preda osebi. Pri tem se programska oprema postopoma nauči, katera pot rešitve je optimalna za vsako dejanje, in to znanje uporabi pri naslednjem dejanju.

Vsi ti zapleteni procesi morajo potekati v delčkih sekunde, saj ljudje od stroja pričakujejo, da se bo odzval hitro in predvsem pravilno. Čeprav prepoznavanje govora po več kot 30 letih uporabe že razmeroma dobro deluje, je v ozadju glasovnega upravljanja strojev še veliko raziskovalnega in razvojnega dela – dokler ne bomo nekega dne lahko govorili s strojem tako naravno kot s sosedom.

Pregled