T:
Bakit mahalaga para sa mga siyentipiko ng data na maghanap ng transparency?
A:Ang transparency ay mahalagang mahalaga sa mga proyekto sa agham ng data at mga programa sa pag-aaral ng machine, na bahagi dahil sa pagiging kumplikado at pagiging sopistikado na nagtutulak sa kanila - dahil ang mga programang ito ay "pag-aaral" (bumubuo ng mga resulta ng probabilistic) sa halip na sundin ang mga paunang natukoy na mga tagubiling programa sa pag-programming, at dahil bilang isang resulta, mahirap maunawaan kung paano nakarating ang mga konklusyon sa teknolohiya. Ang "itim na kahon" na problema ng mga algorithm sa pag-aaral ng machine na hindi ganap na maipaliwanag sa mga gumagawa ng desisyon ng tao ay isang malaking bagay sa larangang ito.
Sa pag-iisip, ang kakayahang makabisado ang nalalantad na pagkatuto ng makina o "explainable AI" ay malamang na maging pangunahing pokus sa kung paano ituloy ng mga kumpanya ang pagkuha ng talento para sa isang siyentipiko ng data. Ang DARPA, ang institusyon na nagdala sa amin ng internet, ay pagpopondo ng isang pag-aaral na multimilyon-dolyar sa explainable AI, sinusubukan na itaguyod ang mga kasanayan at mga mapagkukunan na kinakailangan upang lumikha ng pag-aaral ng makina at artipisyal na mga teknolohiyang paniktik na malinaw sa mga tao.
Isang paraan upang pag-isipan ito ay madalas na isang "yugto ng pagbasa" ng pagbuo ng talento at isang "hyperliteracy stage." Para sa isang scientist ng data, ang tradisyonal na yugto ng pagbasa at kaalaman ay kung paano pagsasama-sama ang mga programa sa pagkatuto ng makina at kung paano bumuo algorithm na may mga wika tulad ng Python; kung paano bumuo ng mga neural network at makipagtulungan sa kanila. Ang yugto ng hyperliteracy ay ang kakayahang makabisado ang masasabing AI, upang magbigay ng transparency sa paggamit ng mga algorithm ng pagkatuto ng makina at mapanatili ang transparency habang ang mga programang ito ay nagtatrabaho patungo sa kanilang mga layunin at mga layunin ng kanilang mga tagapangasiwa.
Ang isa pang paraan upang maipaliwanag ang kahalagahan ng transparency sa data science ay ang mga set ng data na ginagamit na patuloy na nagiging mas sopistikado, at samakatuwid ay mas potensyal na makialam sa buhay ng mga tao. Ang isa pang pangunahing driver ng explainable machine learning at data science ay ang European General Data Protection Regulation na ipinatupad kamakailan upang subukang hadlangan ang hindi pangkaraniwang paggamit ng personal na data. Gamit ang GDPR bilang isang kaso ng pagsubok, makikita ng mga eksperto kung paano naaangkop ang pangangailangan sa pagpapaliwanag ng mga proyekto sa agham ng data sa mga alalahanin sa privacy at seguridad, pati na rin ang etika ng negosyo.