Googleov AI je naučio prepoznati pojedinačne glasove u gomili

Googleov AI je naučio prepoznati pojedinačne glasove u gomili

Novi razvoj američkog IT-div Googlea izgleda kao tehnologija s dvostrukom namjenom. S jedne strane, to je nalaz za špijuna koji može identificirati i prisluškivati ​​na zvučniku s udaljenosti, čak i ako se skriva u mnoštvu ljudi. S druge strane, proboj u analizi glasovnih podataka pomoći će brojnim ljudima s oštećenjem sluha i povećat će učinkovitost samih Googleovih usluga. Pa kako to radi?

Prepoznavanje glasa osobe, čak i u prisutnosti smetnji, je jednostavno – problem je identificirati njezin vlasnik. Googleovi programeri jednostavno stavljaju video kameru na mikrofon pomoću algoritma koji reagira na izraze lica neke osobe. Sustav uspoređuje pokrete na licu zvučnika, "čita usne" i istodobno analizira zvuk. Ako su rezultati isti, dobro, AI izolira taj lik i može samo gledati njegov govor na pozadinu opće kakofonije zvukova.

Neuronska mreža najprije je naučila tehniku ​​čitanja usana, a zatim je naučila razlikovati ljude koji govore od smijeha, prepoznavati izraze lica tijekom razgovora, čak i ako je lice djelomično skriveno od strane brade ili mikrofona. Zatim je sustavu dodan mehanizam razvrstavanja – kada se izračunava zvučnik, njegovi podaci ulaze u zasebni akustični profil.Zahvaljujući tome, AI može razlikovati riječi različitih ljudi, čak i ako ih konkretno pokušavaju zbuniti i govoriti ili pjevati zajedno.

Razumijevanje razgovora određene osobe dobra je stvar ne samo za špijunažu. Na primjer, moguće je s velikom preciznošću prenijeti slušni aparat riječi sugovornika osobe s invaliditetom, prosijavajući druge glasove, poput buke. Ili proširite funkciju videochata, kao što su Hangouts i Duo. Osim toga, to su nove značajke za sustave glasovnog upravljanja, a sada je nemoguće oboriti zaštitu govora samo uz pomoć lažnog akustičkog snimanja.

Izvor blog Google istraživanja

Like this post? Please share to your friends:

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: