Talaan ng mga Nilalaman:
- Pabula: Nauna sa atin ang lahat sa pag-ampon ng malaking data.
- Pabula: Marami kaming data; hindi namin kailangan mag-alala tungkol sa bawat maliit na data na kapintasan.
- Pabula: Ang teknolohiya ng malaking data ay aalisin ang pangangailangan para sa pagsasama ng data.
- Pabula: Ang paggamit ng isang bodega ng data para sa advanced na analytics ay walang kahulugan.
- Pabula: Ang mga lawa ng data ay papalit sa bodega ng data.
- Malaking Data Gumagana - Mga Bagong Pamamaraan ng Data ng Paggamit ng Data Maaaring Hindi
Bumalik noong Mayo 2014, ang Forrester Research ay naglabas ng dalawang ulat na kumukuha ng ilang mga konklusyon tungkol sa hype na nakapalibot sa malaking data. Ang kompanya ng pananaliksik ay nag-survey higit sa 250 mga marketing at executive-development executive. Ayon sa mga may-akda ng ulat, ang malaking data retorika ay nasa lahat ng oras, at ang mga vendor ng teknolohiya ay mga produkto ng touting sa kung ano ang mukhang hindi kapani-paniwala na mga paghahabol.
Sumasang-ayon si Gartner sa Forrester Research; ang malaking substansiya ay pumapalibot sa malaking data. Sa ulat ng Setyembre 2014, ang mga deboto ng Gartner na lima sa mga pinakamalaking alamat ng data, at nag-aalok ang mga analyst ng Gartner ng kanilang opinyon tungkol sa kung ano ang hindi pagkakaunawaan tungkol sa malaking data at pagmamanipula nito. Kaya ano ang pinakamalaking alamat ng malaking data? Tignan natin.
Pabula: Nauna sa atin ang lahat sa pag-ampon ng malaking data.
Sinabi ni Gartner na ang interes sa malaking data ay nasa lahat ng oras. Sa kabila nito, ang isang paltry 13 porsyento ng mga polled ay may mga sistema ng pagtatrabaho. Ang dahilan: ang karamihan sa mga kumpanya ay hindi pa malaman kung paano minahan ng anumang halaga mula sa malalaking repositori ng data. Dito, ang survey ni Gartner ay mas maasahin sa mabuti kaysa sa ulat ng Forrester, na natagpuan na 9 porsiyento lamang ng mga kalahok sa survey ang nagsabing balak nilang ipatupad ang mga big-data tehcnologies sa susunod na taon. (Malaki ang ibibigay ng malaking data. Matuto nang higit pa sa 5 Mga Problema sa Real-Mundo na Malutas ng Malaking Data.)Pabula: Marami kaming data; hindi namin kailangan mag-alala tungkol sa bawat maliit na data na kapintasan.
Nag-aalala si Gartner tungkol sa isang kamangha-manghang mga tao na mayroon kami: "Marami kaming, ang maliit na masama ay hindi mahalaga." Si Ted Friedman, bise presidente at kilalang analyst sa Gartner ay naniniwala na ito ang maling paraan upang tingnan ang sitwasyon.
"Sa katotohanan, kahit na ang bawat indibidwal na kapintasan ay may isang mas maliit na epekto sa buong dataset kaysa sa ginawa noong mas kaunting data, may mas maraming mga kapintasan kaysa sa dati dahil mayroong mas maraming data, " sabi ni Friedman. "Samakatuwid, ang pangkalahatang epekto ng mahinang kalidad ng data sa buong dataset ay nananatiling pareho."
Nagdagdag si Friedman ng isa pang dahilan para sa pag-aalala. Ang malaking pagkuha ng data ay madalas na nagsasama ng data mula sa labas ng negosyo, na kung saan ay samakatuwid ay hindi kilalang istraktura at pinagmulan. Pinatataas nito ang potensyal para sa mga pagkakamali.
Pabula: Ang teknolohiya ng malaking data ay aalisin ang pangangailangan para sa pagsasama ng data.
Mayroong dalawang mga pangunahing diskarte sa pagsusuri ng data na maaaring mailapat sa malaking data: "schema on write" o "schema on read." Hanggang sa kamakailan lamang, ang panukala sa pagsulat ay ang tanging pamamaraan na ginamit. Ang schema on basahin ay ang kasalukuyang pagkahumaling sa pamamahala ng database. Hindi tulad ng schema sa pagsulat, na nangangailangan ng isang nakaayos na format, ang data ay nai-load sa mga database ng schema-on-read sa raw format nito. Pagkatapos ang mga developer - gamit ang hindi nakaayos na mga platform ng database tulad ng Hadoop - ibaluktot ang magkakaibang data sa isang magagamit na format. Ang schema on read ay may halatang pakinabang ngunit, tulad ng pagbanggit ni Gartner, ang pagsasama ng data ay kailangang mangyari sa ilang mga punto.Pabula: Ang paggamit ng isang bodega ng data para sa advanced na analytics ay walang kahulugan.
Ang paggastos ng oras upang lumikha ng isang bodega ng data ay tila walang saysay sa maraming mga tagapamahala ng impormasyon, lalo na kapag ang mga bagong nakunan na data ay naiiba sa na sa bodega ng data. Gayunpaman, binabalaan muli ni Gartner kahit ang mga advanced na data analytics ay gagamit ng mga warehouses ng data at mga bagong data, na nangangahulugang dapat na:- Pinuhin ang mga bagong uri ng data upang gawing angkop ang mga ito para sa pagsusuri
- Magpasya kung aling data ang may kaugnayan, at ang antas ng kalidad ng data na kinakailangan
- Alamin kung paano pinagsama ang data
- Maunawaan na ang pagpipino ng data ay maaaring mangyari sa mga lugar maliban sa data bodega
Pabula: Ang mga lawa ng data ay papalit sa bodega ng data.
Ang mga lawa ng data ay mga repositori ng magkakaibang data, kumpara sa mga bodega ng data kung saan ang data ay nasa isang nakaayos na format. Ang paglikha ng isang lawa ng data ay nangangailangan ng kaunting pagsisikap (hindi na kailangang i-format ang data) kumpara sa mga bodega ng data, na ang dahilan kung bakit ang interes ng mga lawa.
Binibigyang diin ng Gartner na ang pagkakaroon ng data ay hindi ang punto - ang kakayahang manipulahin ang nakuha na data para sa kaalaman na paggawa ng desisyon ay ang punto. Bukod dito, ang paggamit (medyo hindi pinagsama) mga lawa ng data upang mapadali ang paggawa ng desisyon ay may problema.
"Ang mga bodega ng data ay mayroon nang mga kakayahan upang suportahan ang isang malawak na iba't-ibang mga gumagamit sa buong isang samahan, " sabi ni Nick Heudecker, direktor ng pananaliksik sa Gartner. "Ang mga pinuno ng impormasyon-pamamahala ay hindi kailangang maghintay para makuha ang mga lawa ng data." (Matuto nang higit pa tungkol sa pag-ampon ng malaking data sa 7 Mga bagay na Dapat Mong Malaman Tungkol sa Malaking Data Bago Pag-ampon.)
Malaking Data Gumagana - Mga Bagong Pamamaraan ng Data ng Paggamit ng Data Maaaring Hindi
Ang kadahilanang sinabi ni Gartner na "pinakamalaking mitolohiya ng data" sa halip na "mga alamat ng malalaking data" ay naging malinaw pagkatapos basahin ang ulat. Ang Gartner ay hindi leery ng malaking data. Ang Gartner ay leery ng mga nakakaramdam ng mga mas bagong pamamaraan ng pagmamanipula ng malaking data ay handa na para sa "kalakasan ng panahon."