Rory Bremner proti programski opremi za prepoznavanje govora: zdaj vemo, kdo bi zmagal

Rory Bremner proti programski opremi za prepoznavanje govora: zdaj vemo, kdo bi zmagal

Kateri Film Si Ogledati?
 

Komik in impresionist posnema ljudi za zabavo. Vendar pravi, da je znanost, ki stoji za prepoznavanjem govora, smrtno resna





nerodna igralska zasedba sezone 4

Ena mojih najljubših gledaliških zgodb se nanaša na igralko Edith Evans, ki je najbolj znana po svoji pretirani izgovorjavi (pomislite nanjo kot na Lady Bracknell, ki izreče frazo, torbica?). Ko so jo nekoč vprašali, ali pozna igralca Kennetha Williamsa, je v značilnem ekscentričnem slogu zavpila: Ah ja! Spomnim se! Zelo nenavaden glas!



Lonci in grelniki vode, bi lahko rekli. Toda ali so naši glasovi res edinstveni? Moj glas je moje geslo je stavek, ki ga zadnje čase slišiš veliko pogosteje, saj so banke začele izpopolnjevati programsko opremo za prepoznavanje glasu in biometrične podatke. Toda ali res lahko rečemo, da je vsak glas edinstven? Vsekakor je bilo nekaj ikoničnih govornih glasov skozi zgodovino – Winston Churchill, Morgan Freeman, Margaret Thatcher, če naštejemo le nekatere – toda ali so popolnoma izključujoči in individualni na enak način, kot si mislimo o prstnih odtisih ali DNK? Ali lahko zdaj govorimo o ljudeh, ki imajo edinstven glasovni odtis?

Rad mislim, da imam razumen posluh za glasove. Moja kariera impresionista navsezadnje v veliki meri temelji na sposobnosti razlikovanja med poudarki, glasovnimi vrstami in značilnostmi. Nagibam se k temu, da je ta sposobnost nagonska; darilo, trik za zabavo, celo. To je bilo, preden sem srečal forenzične fonetike za svoj dokumentarec na Radiu 4.

Forenzični fonetiki so lingvistični znanstveniki in analitiki govora, katerih preučevanje glasov ljudi spravlja moje instinktivno uho v sramoto, ne nazadnje zato, ker sem tako, no, forenzik. Medtem ko so moji vtisi in karikature (saj to so, niso natančna reprodukcija) narejeni zaradi komičnega ali satiričnega učinka, se analiza strokovnjakov, ki vključuje identifikacijo govorca ali profiliranje, pogosto uporablja kot dokaz v kazenskih zadevah. Tudi v boju proti terorizmu je glasovna analiza bistveno orodje, saj varnostne službe analizirajo na tisoče ur vredne posnetke govora.



Bolj fascinantna kot spraševanje, ali je moj Donald Trump blizu izvirniku in dovolj smešen (ali celo oboje), so vprašanja, ki tvorijo delo fonetikov: ali je glas osumljenca enak glasu tistega, ki šepeta grožnjo z bombo. policijski posnetek? Iz katerega dela Walesa je oseba, ki je izsiljevala? Je bil pilot med pogovorom s kontrolo letenja tik pred strmoglavljenjem letala pod vplivom alkohola?

Takoj, ko kazenski primer vključuje človeški govor ali kakršno koli zvočno sled, je potrebno strokovno znanje forenzičnega fonetika in to so vprašanja, s katerimi se strokovnjak za prepoznavanje govorcev spopada vsak dan. Pravzaprav je vsako leto v Združenem kraljestvu med 500 in 600 kazenskih primerov, v katerih se kot dokaz uporabljajo glasovni podatki. Kot vse druge izvedenske dokaze tudi to ureja zakonodajalec forenzične znanosti Ministrstva za notranje zadeve, parlament pa priznava kot strokovno področje.

To je specializacija, ki pokriva širok spekter področij: profiliranje govorca (kdo je ta govorec? Katere informacije lahko izberemo iz glasu?); glasovne primerjave, kjer se znani vzorec glasu primerja z osumljencem (znani vzorec glasu pridigarja Abu Hamze je bil primerjan s tajno posnetimi kasetami drugih pridig rasnega sovraštva, da bi ugotovili, ali je govornik ista oseba); izboljšanje govora; avtentikacija na traku; in pomoč policiji pri izvajanju glasovnih postavitev: slušni ekvivalent parade identitete.



kar naprej vidim 1111 in 111

Vse to delo poteka z združevanjem veščin usposobljenih fonetikov z vse bolj izpopolnjenimi avtomatiziranimi sistemi za prepoznavanje govorcev (ASRS), ki imajo zdaj moč analizirati človeški glas do stopnje brez primere.

polnilec za krmilnik xbox one

Toda zgovorno je, da je še vedno človeški analitik – posamezni fonetik – katerega strokovnost je odločilna. Dejansko je bil eden najbolj opaznih primerov v forenzični fonetiki tisti, ki ni uporabil nobenega stroja. Dialektolog in fonetik Stanley Ellis je slavno analiziral trak Wearside Jack, ki je iztiril preiskavo Yorkshire Ripperja. S skrbnim raziskovanjem in analiziranjem govora navadnih ljudi po severu Anglije je Ellis uspel natančno določiti naglas prevaranta do nekaj milj na severni strani Weara v Sunderlandu.

To izjemno človeško znanje je nekaj, česar se Britanci še vedno oklepajo. Medtem ko večina drugih evropskih držav priznava pravno veljavnost programske opreme za samodejno prepoznavanje govorcev, je bila tradicija Združenega kraljestva vedno uporaba izkušenega dialektika, ki bi enega za drugim analiziral zvok samoglasnikov, dvig in padec glasu, njegovo melodijo, preko notnega sistema mednarodne fonetične abecede.

Vendar to ni natančna znanost – znanstvena skupnost je razdeljena glede najučinkovitejše metode za identifikacijo glasov, bodisi prek avtomatiziranih sistemov bodisi prek strokovnega znanja fonetika ali, kot se zdi trenutna najboljša praksa, obojega.

Poleg tega se naši glasovi razlikujejo: če smo prehlajeni; če smo pijani; če smo živčni. Kot dokaz je torej glasovna analiza še vedno le potrditev, ne pa odločilna sama po sebi.

Kaj pa impresionisti? Zdi se, da lahko nekatere ljudi včasih preslepimo. Toda opreme ne moremo preslepiti. V programu smo se zabavali in primerjali moj vtis Trumpovega glasu z izvirnikom. Zabava znanstvenike, vendar ne zavaja tehnologije.

Saj ne, da je tehnologija popolna. V začetku tega leta je novinarju BBC-ja uspelo preslepiti varnostno programsko opremo HSBC, tako da je svojega dvojčka prisilil, da posnema njegov glas. Vendar s tem ni zaslužil denarja. Mislim, da se bom moral držati komedije.

najbogatejših dežel v nas

Tekma za prstni odtis človeškega glasu je v sredo ob 21. uri na Radiu 4