T:
Ano ang pagkakaiba sa pagitan ng pagsasalita sa teksto at chatbots?
A:Ang maraming mga makabuluhang pagkakaiba sa pagitan ng mga teknolohiya sa pagsasalita-sa-teksto at chatbots ay bahagi ng kung ano ang napagmasdan sa mabilis na ebolusyon ng mga proyekto ng chatbot at voicebot.
Ang isang teknolohiya sa pagsasalita-sa-teksto ay isa lamang na nag-convert ng pandiwang pananalita sa teksto sa isang digital na pahina. Iyon ang buong pag-andar nito, ngunit hindi ito isang simple na idinisenyo. Upang ma-convert ang pandiwang pagsasalita sa teksto, ang teknolohiya ay kailangang masira ang mga salita at pangungusap sa mga indibidwal na ponema at magtrabaho kasama sila ayon sa mga kumplikadong algorithm upang lumikha ng teksto na tumpak at kumakatawan sa sinabi ng nagsasalita.
Ang mga chatbots, sa kabilang banda, ay mga teknolohiya na nakamit ang layunin ng pakikipag-usap sa isang tao. Mayroong dalawang uri ng chatbots: mga text chat at voicebots. Mahigit na mas matagal ang mga text chat sa text, dahil hindi nila kailangan ang elemento ng pagsasalita na ginagamit ng mga voicebots.
Ang pangunahing pagkakaiba sa pagitan ng mga teknolohiya sa pagsasalita-sa-teksto at saklaw ng mga chatbots. Tulad ng nabanggit, ang lahat ng teknolohiyang speech-to-text ay kailangang gawin ay ang pag-transcribe ng pandiwang pagsasalita. Ang chatbot, sa kabilang banda, ay kailangang kumuha ng pagsasalita sa alinmang form na ginawa nito, maunawaan ito, at magbigay ng mga sagot na naghahangad na ipasa ang pagsubok na Turing - ang pagsubok kung ang isang teknolohiya ay maaaring mangloloko sa isang tao sa pag-iisip na siya ay nakikipag-usap sa ibang tao.
Sa pag-iisip, ang mga chatbots ay mas madali upang lumikha kaysa sa mga voicebots. Ang chatbot ay tumatagal sa teksto ng tao at nagbibigay ng tugon ng teksto. Kahit na medyo simpleng chatbots ay nakapagbigay ng kawili-wili at kasiya-siyang resulta para sa mga tao mula noong huling bahagi ng 1980s at unang bahagi ng 1990s.
Ang voicebot, sa kabilang banda, ay kailangang kumuha ng pandiwang pagsasalita, i-convert ito sa teksto, suriin ito para sa kawastuhan, makagawa ng isang tugon, at bubuo ang tugon mula sa makina sa makina sa naririnig na pagsasalita. Ang malaking bilang ng mga medyo makabuluhang gawain ay nangangahulugan na ang voicebot ay tumatagal ng maraming lakas ng computing at maraming disenyo upang maitayo.
Ang mga proyekto tulad ng Siri, Cortana at Alexa ay nagpapakita ng bahagi ng vanguard ng mga teknolohiyang voicebot. Inilalarawan din nila na ang teknolohiyang ito ay nasa pagkabata pa lamang. Kahit na ang Alexa at iba pang mga teknolohiya ay maaaring tumugon nang pasalita sa pagsasalita ng tao, hindi sila lubos na may kakayahang sa kamalayan na nakikipag-ugnay kami sa pasalita ng tao sa pangkalahatan. Sa madaling salita, medyo may limitasyon sa mga tugon na maibibigay ng mga teknolohiyang ito. Mayroong kahit isang limitadong kakayahan ng henerasyon ngayon ng mga personal na katulong upang talagang makabuo ng pagsasalita sa teksto, halimbawa, para sa mga layunin ng pag-uulat ng isang email o pagtulong sa isang tao na magsulat ng isang sanaysay nang hindi gumagamit ng kanilang mga kamay. Ang ilan sa mga tiyak na programa sa pagsasalita-sa-teksto sa merkado ay gumagawa ng mas mahusay kaysa sa Siri o Cortana, marahil dahil sa paglalaan ng mga mapagkukunan. Gayunpaman, may mga palatandaan na ang pag-unlad ng voicebot ay malapit nang mag-alis - tulad ng platform ng Lex ng Amazon na nagpapahintulot sa isang kapaligiran sa studio para sa pagbuo ng mga ganitong uri ng mga teknolohiya.
Sa isang matalino at nagtuturo na sanaysay tungkol sa paksa, pinag-uusapan ni Tobias Goebel ang pagkakaiba sa pagitan ng mga teknolohiyang ito, na pinaghahambing ang proseso ng "pagsulat, " na ginagawa ng pagsasalita sa teksto, sa trabaho ng pag-unawa, na dapat gawin ng mga chatbots.
"Habang tinatanggal ang pangangailangan para sa pagkilala sa pagsasalita ay ginagawang mas madali ang isang bagay para sa isang chatbot, ang pangunahing hamon na bumuo ng mga gumaganang bots ay nasa natural na pag-unawa sa wika, " sulat ni Goebel.
Kinilala din ni Goebel ang marami sa kasalukuyang mga manlalaro sa industriya:
Ang namumuno sa merkado para sa pagkilala sa pagsasalita ay si Nuance, na nasa likuran ng mga kilalang sistema tulad ng Dragon NaturallySpeaking para sa pagdidikta sa isang PC, na naging mula pa noong mga siyamnapu, ngunit din Siri: ang pagsasalita sa pagkilala / transkripsyon na gawain na isinagawa sa Apple cloud ay gumagamit ng Nuance teknolohiya sa likod ng mga eksena. Ang iba ay ang LumenVox, Verbio, o Pakikipag-ugnay, ngunit ang pagkilala sa pagsasalita ay inaalok din bilang isang serbisyo sa ulap sa pamamagitan ng mga API ng mga kagustuhan ng Amazon, Google, Microsoft, at IBM.
Tulad ng pagbuo ng mga chatbots, ipinapalagay na ang kanilang pag-unawa ay magpapatuloy sa pagtaas sa ilang tilapon - at higit na ipinapalagay din na mas maraming teknolohiya ng bot ang ipapasa mula sa mga interface ng teksto hanggang sa mga verbal interface, na nangangailangan ng karagdagang halaga ng computing power.