Bahay Software Teknolohiya ng pagkilala sa boses: nakakatulong o masakit?

Teknolohiya ng pagkilala sa boses: nakakatulong o masakit?

Talaan ng mga Nilalaman:

Anonim

Nakatawag ka na ba ng isang kumpanya upang makakuha ng tulong o magbayad ng iyong bayarin, lamang na batiin ng isang maayang naitala na boses na nais na magkaroon ng isang pag-uusap sa iyo - ngunit hindi maiintindihan ang kalahati ng iyong sinasabi? O marahil ay nagmamay-ari ka ng isang iPhone, at habang si Siri ay unang tila isang mabuting kaalyado, napagtanto mo na kung minsan (OK, maging tapat tayo, madalas) hindi niya ito nakuha? Ang teknolohiya ng pagkilala sa boses (VRT), na kilala rin bilang speech-to-text, ay nahuhulog sa isang karaniwang bitag: ito ay may potensyal na maging hindi mapaniniwalaan o kapani-paniwala cool (at batang lalaki, kami ay rooting para dito), ngunit mas madalas, ito ay paggiling ng ngipin. mag-ehersisyo sa pagkabigo.


Kapag ang isang ideya na kabilang sa larangan ng science fiction, ang pagkilala sa boses ay lumago mula pa noong kanyang pagkabata noong 1950s, nang ang sistema ng Bell Laboratories Audrey ay dinisenyo upang makilala ang mga digit na sinasalita sa isang solong tinig, sa modernong network ng mga pakikipag-usap sa elektronik na nakikipag-ugnay na tayo ngayon sa pang-araw-araw na batayan - na may halo-halong mga resulta.

Upang Magsalita sa isang Tao, Mangyaring Pindutin ang 0

Marami sa mga negosyo ngayon ang gumagamit ng mga system na tinatawag na interactive voice response (IVR) upang mahawakan ang mga tawag sa serbisyo sa customer. Ang pinaka-karaniwang paggamit ay para sa mga naka-navigate na mga menu, ngunit ang ilang mga kumpanya ay gumagamit ng mga sistema ng IVR na maaaring ma-access ang impormasyon ng account sa customer at sagutin ang mga menor de edad na katanungan. Karaniwan ang isang software ng Menu IVR ay may isang limitadong bokabularyo, na maaaring limitahan sa "oo, " "hindi" at mga numero. Ang mas kumplikadong mga system ay maaaring makilala ang mga salita at parirala na tiyak sa kumpanya.


Ang mga sistemang ito ay nagiging mas tanyag - hindi bababa sa mga negosyo - para sa isang simpleng kadahilanan: epektibo ang gastos sa kanila. Ayon sa isang ulat sa 2010 ng Wall Street Journal, isang tipikal na tawag sa customer na umaabot sa isang ahente ng gastos sa pagitan ng $ 3 at $ 9, habang ang isang tawag na hawakan sa pamamagitan ng isang awtomatikong sistema ay nagkakahalaga lamang ng lima hanggang pitong sentimos. At, siyempre, ang mga programa sa computer ay hindi napapagod, tumawag sa sakit, o maging bigo sa mga customer (kahit na tiyak na nabigo ang mga customer sa kanila!).


Sa kabutihang palad, hindi ito nangangahulugang ang IVR ay tumatagal ng mga trabaho sa mga tao - o hindi bababa sa lahat ng tao ay nawawala mula sa mga call center. Pinapayagan ng mga katulong na ito na tinulungan ng boses ang mga serbisyo ng customer ng tao na maging mas produktibo sa pamamagitan ng pagturo ng mga tawag at pagsagot sa mga simpleng katanungan.


Siyempre para sa mga gumagamit ng tao na nakikipag-ugnay sa mga teknolohiyang ito, hindi palaging maayos na paglalayag. Tumutulong ang teknolohiya upang mapagbuti ang mga karaniwang problema sa teknolohiya ng IVR, tulad ng problema sa mga accent, ngunit ang pagbubutas ng mga awtomatikong sistema ay isang pangkaraniwang tema online. Suriin ang komedya ng skedyul na ito tungkol sa isang elevator na nilagyan ng pagkilala sa boses, na nagtatampok ng pagkabigo na maaaring magawa ng mga pagkakamali sa mga sistema ng IVR.

Mga Application ng Personal na Telepono: Siri, Google Ngayon

Karamihan sa mga tao ay pamilyar sa pagkilala sa boses para sa mga smartphone. Habang ang karamihan sa mga pinakabagong mga modelo ng telepono ay may VR, ang kanilang pagiging popular - at katakut-takot - na-swak nang ipinakilala ng Apple si Siri, ang banayad na mapang-uyam, boses-aktibo na "personal na katulong" para sa iPhone 4S noong 2011. Sa lalong madaling panahon nilikha ng Google ang isang direktang katunggali: Google Ngayon para sa Android Jelly Bean OS. Ang parehong mga sistema ay nagtatampok ng mga tinig ng kababaihan at sopistikadong mga tampok ng pagkilala na nagpapahintulot sa mga gumagamit na "makipag-usap" sa kanilang mga telepono gamit ang kaswal na wika.


Ngunit habang ang mga sistemang ito ay higit na mas sopistikado at pagganap kaysa sa kanilang mga nauna, ipinakikita rin nila na ang teknolohiya ay mayroon pa ring mahabang paraan. Ang mga biro tungkol sa pagkabigo ni Siri ay naging isang tanyag na meme sa Internet. Isang lalaki pa ang nagsampa sa Apple ng maling patalastas tungkol sa mga kakayahan ni Siri.


Marahil na kung bakit habang nilikha ng Apple si Siri upang maging advanced at nagbibigay-kaalaman, ang VR software ay kaunti din sa gilid ng sassy. Halimbawa, kung nagsasalita ka ng isa sa mga pinaka-kahihiyan na mga linya ng teknolohiya ng katalinuhan sa kasaysayan ng sinehan mula sa 1968 na pelikula "2001: Isang Space Odyssey" - "buksan ang mga pintuan ng pod bay" - Si Siri ay sasagot sa alinman sa linya ng pagsagot mula sa pelikula, " Ikinalulungkot ko (ang iyong pangalan), natatakot ako na hindi ko magagawa iyon, "o ang mas naiinis, " kami ng mga ahente ng intelihente ay hindi kailanman mabubuhay iyon, tila. "


Ang pagtawag sa iyo ng pangalan ay isa lamang sa mga pag-andar na sumusubok na gawing mas madali ang pagmamahal kay Siri, at kaunti pa sa tao. Ang katulong sa VR ay maaaring sundin ang mga utos ng boses upang tumawag, kumuha ng pagdidikta at magpadala ng mga teksto, magsagawa ng mga paghahanap sa Internet para sa impormasyon, maghanap ng mga kalapit na tindahan, magbigay ng mga direksyon sa pagmamaneho at higit pa, lahat nang walang pangangailangan na hawakan ang anupaman. Ang mga sagot ay sabay-sabay na sinasalita ng telepono at ipinapakita sa screen.


Ang Google Now, ang bahagi ng VR ng platform ng Android Jelly Bean, ay halos kapareho sa Siri. Nag-aalok ang system ng parehong malawak na mga kakayahan sa pagkilala sa pamamagitan ng pagsasalin ng kaswal na pagsasalita sa mga utos na nagpapahintulot sa mga gumagamit na tumawag, magpadala ng mga teksto, magpatakbo ng mga paghahanap, magsagawa ng mga kalkulasyon at conversion, grab ang mga kahulugan ng salita, magtakda ng mga alarma, maglaro ng mga kanta, at makakuha ng mga mapa at direksyon.


Sa mga personal na katulong sa boses tulad ng Siri at Google Now, ang mga benepisyo ay halata. Ang lahat mula sa pagtawag at pag-text hanggang sa paghahanap at libangan ay mas mabilis at madali. Sabihin lamang kung ano ang gusto mo, at (halos lahat ng oras) ay kinuha ito ng VR app para sa iyo. Ang hands-off na teknolohiya ng VR ay lalong kapaki-pakinabang habang nagmamaneho. At habang maraming mga tao ang nag-ugat ng mga bahid ng Siri, at pinagtalo ng mga manunulat na ang kakayahan ng Google Now na mahalagang patakbuhin ang buhay ng mga gumagamit ay kapwa nakakatakot ng isang pang-iinsulto, karamihan sa mga tao ay nararamdaman pa rin ang mga futuristic na teknolohiyang ito ay medyo cool.


Siyempre, ang mga personal na application ng telepono tulad ng Siri at Google Now ay malayo sa perpekto - bagaman ipinapakita nila kung saan maaaring mapamumunuan ang teknolohiyang ito sa hinaharap. Nangangahulugan ito na kahit na si Siri ay mali ang sagot, malamang na matawa tayo at patawarin siya, alam na ang susunod na bersyon ay magiging mas mahusay.

Kung saan ang VR Falls Flat

Kung nakatagpo ka ng isang IVR nang tumawag ka ng isang negosyo, maaaring napansin mo ang ilang mga hadlang sa komunikasyon. Ang ilang mga programa ay gumagamit ng isang robotic na text-to-speech na tinig na hindi sinasadya ang mga salita at ginagawang mahirap maunawaan ang mga bagay. Ang iba ay may mga problema sa sensitivity na nagreresulta sa pagiging hindi ma-proseso ang software kung ano ang sinasabi mo kung masyadong malakas, masyadong malambot, o hindi maingat na binibigkas.


Bilang karagdagan, maraming mga tao ay hindi pa rin kumportable na nakikipag-usap sa isang makina. Kung nagpapatakbo ka ng ilang mga paghahanap sa IVR, makatagpo ka ng mga listahan ng mga tao na pinagsama ang mga paraan upang makaligtaan ang mga sistema ng IVR at makapunta sa isang "tunay na tao." Ang mga solusyon na ito ay mula sa "panatilihin ang pagpindot sa 0 para sa isang operator" na "manumpa sa makina hanggang sa makuha nito ang isang tao." Bilang isang resulta, ang karamihan sa mga kamakailan-lamang na pag-unlad sa mga sistema ng IVR ay umiikot sa paggawa ng mga ito nang higit na nakalulugod para sa mga tao; na ginagawang mas makabagbag-damdamin at hindi gaanong robotic, na ginagawang mas madaling mag-navigate ang system, at ipaalam sa mga tumatawag na kung gaano katagal aabutin ang buong bagay mula sa simula hanggang sa katapusan. Iyon ay nagmumungkahi na ang mas mahusay na teknolohiya ay kalahati lamang ng labanan dito; ang iba pang kalahati ay nakakakuha ng mga gumagamit na nakasakay sa pakikipag-usap sa isang makina.

Ang hawak ng kapalaran

Sa kabila ng mga hamong ito, ang teknolohiya ng pagkilala sa boses ay nagpapabuti sa lahat ng oras. Ang mga aplikasyon tulad ng Siri at Google Now - mga bahid at lahat - ay pa rin labis na kahanga-hanga sa kanilang pagganap, at maraming mga kumpanya ang nagpapalawak ng mga kakayahan ng VR sa iba pang mga aplikasyon.


Halimbawa, si Nuance, ang mga tagalikha ng Dragon NaturallySpeaking speech-to-text software, ay nakabuo na ng mga kontrol sa boses para sa mga telebisyon at sasakyan, at ang mga bersyon ng teknolohiyang ito ay isinama sa ilang mga Samsung TV at ang mga sistema ng entertainment sa SYNC na ginamit sa ilang mga sasakyan ng Ford.


At habang ang Google at Apple ay nagpapatuloy na makahanap ng mga bagong gamit para sa kanilang mga teknolohiya sa pagkilala sa boses, malamang na tayo ay parating na makikipag-usap sa lahat ng uri ng mga pang-araw-araw na makina, mula sa aming telebisyon hanggang sa aming mga toasters. At, sa sandaling muli, mukhang tama ang fiction ng science. Inaasahan lang natin na ang mga matalinong manunulat ay mali tungkol sa isang bagay. Kung ang mga makina na ito ay kumukuha, maaari kang maging maraming problema sa susunod na hihilingin mo kay Siri na "buksan ang mga pintuan ng pod bay."

Teknolohiya ng pagkilala sa boses: nakakatulong o masakit?