Bahay Audio Ano ang apat na pundasyon ng pagiging isang mahusay na siyentipiko ng data?

Ano ang apat na pundasyon ng pagiging isang mahusay na siyentipiko ng data?

Anonim

T:

Ano ang apat na pundasyon ng pagiging isang mahusay na siyentipiko ng data?

A:

Tulad ng itinuturo ng maraming mga eksperto, ang pagiging isang mahusay na siyentipiko ng data ay nangangailangan ng isang kumbinasyon ng mga kasanayan at karanasan na mabubuo sa pamamagitan ng nakatuong pag-aaral at pagsusuri ng isang kumplikadong larangan. Ang mga siyentipiko ng data bilang mga administrador at mga curator ng mahalagang mga assets ng data ay talagang hinihiling ngayon. Tingnan natin kung ano ang kasangkot sa ilan sa mga kasanayang pang-foundational na ito.

Ang una sa apat na pangunahing sangkap ng akdang siyentipiko ng data ay matematika at istatistika. Ang mahusay na data ng mga siyentipiko ay dapat matutunan na maging mapag-usap sa iba't ibang mga konseptong matematiko na may kaugnayan sa pag-aaral ng pinangangasiwaan at hindi sinusubaybayan, kabilang ang mga uri ng algorithm tulad ng mga puno ng pagpapasya, random na kagubatan, logistic regression, clustering at ang paggamit ng dimensionality sa pag-aaral ng makina (ML). Sa pangkalahatan, dapat silang magkaroon ng isang mahusay na hawakan sa pagtatrabaho sa mga equation ng matematika at mga istatistika gamit ang mga mapagkukunan ng pagtatasa ng istatistika.

Ang pangalawang pangunahing pangunahing sangkap ng gawaing agham ng data ay nagsasangkot ng pamamahala at pamamahala sa database. Ang mga indibidwal ay dapat na malakas sa mga wika ng script tulad ng Python at istatistika na wika tulad ng R, kasama ang karanasan at kasanayan sa database at SQL semantics at mga pamamaraan sa pagpapatakbo. Ang kaalaman sa mga bahagi ng software tulad ng Hadoop, MapReduce, Hive at Pig ay kaakit-akit din sa mga employer.

Ang pangatlong pangunahing sangkap ng pagiging isang mahusay na siyentipiko ng data ay ang teoretikal at pilosopikal na sangkap ng pag-unawa sa agham ng data at pag-aaral ng makina. Ang mga indibidwal na ito ay dapat na nagsisimula sa sarili problema solvers sa mausisa isip - pagkatapos ng lahat, pinagsasama nila ang raw quantitative analysis sa malikhaing pag-unawa sa pag-aaral ng machine at data science. Sa halip na maging mga numero ng teknikal na tao lamang, dapat silang magkaroon ng isang malalim na saligan sa kung ano ang ibig sabihin ng lumikha ng mga proyekto sa pag-aaral ng makina at magtrabaho sa mga inisyatibo ng data sa agham sa mga tuntunin ng mga layunin sa pagtatapos at mga resulta ng pagtatapos.

Ang isang pang-apat na pangunahing haligi ng pag-aaral upang maging isang mahusay na data ng mga siyentipiko ay nagsasangkot sa pagtatrabaho sa mga tao at kakayahang gumamit ng data sa mga paraan na may katuturan sa ibang tao.

Ang mabuting mga siyentipiko ng data ay maaaring maging mga mananalaysay - maaari nilang isalin ang dami ng data sa mga salaysay at pananaw. Tulad nito, dapat silang magkaroon ng mahusay na mga kasanayan sa komunikasyon upang maihatid ang kanilang gawain sa talahanayan at ikalat ito sa maraming mga stakeholder o isang mabisang tagapakinig na epektibo. Ito ang ilan sa mga pangunahing uri ng mga kasanayan na nagtatayo ng isang mahusay na siyentipiko ng data na handa na lumahok sa mabilis at mabilis na pagsulong sa industriya ng IT.

Ano ang apat na pundasyon ng pagiging isang mahusay na siyentipiko ng data?