T:
Higit pa ay hindi palaging mas mahusay. Paano mababawas ng mga organisasyon ang ingay sa kanilang data upang makamit ang na-target, tumpak na analytics?
A:Sa mga malalaking sistema ng data, ang isa sa mga malaking katanungan para sa mga kumpanya ay kung paano mapanatiling maayos at mahusay ang mga proyektong ito. Marami sa mga tool at mapagkukunan na itinayo para sa malaking data ay binuo upang masipsip ang napakaraming impormasyon sa isang malawak na lambat. Hindi sila palaging masigasig sa pagpino sa data na iyon, at pinapanatili itong simple. Gayunpaman, may ilang mga pinakamahusay na kasanayan na umuusbong sa industriya upang lumikha ng mas target at kapaki-pakinabang na mga malaking proyekto ng data.
Ang isang haligi ng isang naka-target na malaking diskarte ng data ay ang paggamit ng tamang mga tool sa software at mapagkukunan. Hindi lahat ng mga analytics at malaking sistema ng data ay pareho. Ang ilan ay maaaring mas epektibong i-filter ang labis o hindi nauugnay na data, at payagan ang mga negosyo na tumuon lamang sa mga mahahalagang katotohanan na matukoy ang kanilang mga pangunahing proseso at operasyon.
Ang isa pang pangunahing bahagi nito ay nagsasangkot sa mga tao. Bago pa makisali sa isang malaking proyekto ng data, at habang ang software ng nagtitinda ng software, ang pagpapatupad ng pagpapatupad at pagsasanay sa iba, ang isang gitnang pangkat ng mga tao ay kailangang maging namamahala sa proseso, at ang pag-delegate ng mga gawain sa pananaliksik at pag-brainstorming. Maaari itong gumawa ng isang malaking diskarte sa data sa isang tumpak, pamamaraan ng kirurhiko na mapapahusay ang negosyo nang hindi masyadong masyadong mabigat at nakakagambala sa pang-araw-araw na operasyon.
Halimbawa, ang mga puwersa ng gawain o iba pang mga pangunahing pangkat ay maaaring umupo at tingnan nang detalyado sa mga paraan kung paano isasagawa ang pagpapatupad, kung paano magsisimula ang negosyo upang suriin ang mga set ng data, kung paano nila tatawid ang mga account ng index, kung anong uri ng papel o mga digital na presentasyon na gagamitin nila upang maipakalat ang impormasyong iyon, kung paano sila magtatayo ng mga kapaki-pakinabang na ulat, atbp. Ang mga detalyeng ito ay mapoprotektahan ang negosyo mula sa malalaking pagdugong data.
Gayundin, habang nagsisimula ang mga kumpanya na makakuha ng mas maraming mga serbisyo ng vendor, gumawa ng mas malaking data crunching at gawing mas kumplikado ang mga arkitektura ng IT, natutunan nilang paghiwalayin ang pinaka sensitibong data mula sa lahat.
Ang isang paraan upang gawin ito ay upang lumikha ng isang tiered system. Halimbawa, ang isang pangunahing hanay ng data ng mga ID at mga kasaysayan ng customer ay maaaring itago sa isang espesyal na pinananatili na database sa ilalim ng isang partikular na kontrata ng seguridad sa ulap, o nasa site. Ang iba pang mga hanay ng data ay maaaring manirahan sa hindi gaanong dalubhasang mga kapaligiran ng data, alinman dahil sila ay hindi gaanong sensitibo sa mga tuntunin ng mga paglabag sa data, o dahil hindi gaanong direktang nauugnay sa analytics na ginagawa ng negosyo. Pinapayagan ang mga sistema ng tinulak o multi-level para sa mabisang pagpapatupad ng malaking data.
Ito ang ilan sa mga paraan na ang mga negosyo ay nakakakuha ng matalino tungkol sa pagkuha ng malaking data sa tamang paraan. Sa halip na i-vacuuming up ang anumang data na maaari nilang kunin, tinatrato nila ang ilang mga set ng data bilang pinaka kritikal upang makuha ang karamihan sa intelektuwal na negosyo na may hindi bababa sa pagsisikap.