Računala uče čitati usne

Računala uče čitati usne


Glasovni pomoćnici poput Siri ili Alexa već su naučili kako pouzdano prepoznati naš govor. Ali tehnologija ne ostaje mirna – najnovija istraživanja, predstavljena na Međunarodnoj konferenciji o akustici i obradi glasovnih signala u Šangaju, kažu da će u bliskoj budućnosti biti strojevi koji čitaju usne.

Neposredno nakon objavljivanja studije, stručna je zajednica podijeljena u dva logora. Neki su to vidjeli kao zastrašujuću mogućnost za još jednu invaziju na privatnost. S druge strane, njihovi protivnici nisu vidjeli nikakvu zlonamjernu namjeru u tehnologiji i predlagali su ga, primjerice, za poboljšanje dupliciranja filmova.

Zapravo, učiti automobil da razumije ljudski govor na usnama je vrlo težak zadatak. Činjenica je da osoba u procesu razgovora sa svojim usnama reproducira samo 14 izražajnih mimika koji prate oko 50 različitih zvukova. To znači da su, primjerice, zvukovi "p" i "b" iz "izgleda" isti, ali se izriču drugačije.

Tim istraživača na Sveučilištu East Anglia pod vodstvom Helen Beera razvio je novi algoritam koji će pomoći strojevima da razlikuju takve zvukove.Za to su korišteni video i audio zapisi od 12 ljudi, izgovorivši 200 rečenica. Znanstvenici su podučavali računalo da izdvoji nekoliko zvukova koji odgovaraju određenim izrazima lica usta.

Zatim, uz pomoć treninga, program je naučio razlikovati slične riječi s različitim prvih zvukova i odrediti nužnu riječ iz konteksta. Iako je točnost algoritma još uvijek daleko od idealnog, on prepoznaje samo 25% govora bez pogrešaka. Međutim, mnogo je učinkovitiji od postojećih događaja.

Like this post? Please share to your friends:

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: