T:
Ano ang pagkakaiba sa pagitan ng pag-aaral ng makina at data mining?
A:Ang pagmimina ng data at pag-aaral ng makina ay dalawang magkakaibang magkakaibang mga termino - ngunit madalas silang parehong ginagamit sa parehong konteksto, na kung saan ay ang kakayahan ng mga partido na pinuhin at pag-uri-uriin ang mga datos na magkaroon ng mga pananaw at konklusyon. Ang pagkakapareho at pagkakaiba na pinagsama ay maaaring gumawa ng pakikipag-usap tungkol sa dalawang magkakaibang magkakaibang proseso na nakalilito para sa mas kaunting mga madla ng tech.
Ang pagmimina ng data ay ang proseso ng pag-iipon ng data at pagkatapos kunin ang kapaki-pakinabang na data mula sa mas malaking set ng data. Ito ay isang uri ng pagtuklas ng kaalaman na nagaganap mula pa noong nagawa nating pag-iipon ang malaking halaga ng data. Maaari mong gawin ang pagmimina ng data na may isang medyo primitive system: Ang programa ay na-program upang maghanap para sa mga tukoy na pattern at mga trend ng data, at ang teknikal na impormasyon ay "minahan" mula sa hilaw na masa ng data sa anumang form na maaaring nasa.
Ang pag-aaral ng makina ay isang mas bago at mas sopistikado. Ang pag-aaral ng makina ay gumagamit ng mga set ng data, ngunit hindi tulad ng pagmimina ng data, ang pag-aaral ng makina ay gumagamit ng masalimuot na mga algorithm at pag-setup tulad ng mga neural network upang aktwal na payagan ang makina upang malaman mula sa data ng pag-input. Tulad nito, ang pag-aaral ng makina ay medyo mas malalim kaysa sa isang operasyon ng pagmimina ng data. Halimbawa, sa isang neural network, gumagana ang mga artipisyal na neuron sa mga layer upang kumuha ng data ng pag-input at ilabas ang data ng output na may masalimuot na aktibidad na "itim na kahon" sa pagitan ng (ang salitang "itim na kahon" ay nalalapat sa mas sopistikadong mga sistema kapag ang mga tao ay may mahirap na pag-unawa kung paano ang mga neural network o algorithm ay aktwal na ginagawa ang kanilang mga trabaho).
Ang pagmimina ng data at pag-aaral ng makina ay iba rin sa kanilang mga aplikasyon sa negosyo. Muli, ang pagmimina ng data ay maaaring magpatuloy sa loob ng anumang naibigay na aplikasyon ng ERP, at sa maraming magkakaibang proseso.
Sa kabaligtaran, ang isang proyekto sa pag-aaral ng machine ay nangangailangan ng maraming mapagkukunan. Ang mga tagapamahala ng proyekto ay kailangang mag-ipon ng data ng pagsasanay at pagsubok, maghanap ng mga problema tulad ng pag-overfitting, magpasya sa pagpili ng tampok at pagkuha ng tampok, at marami pa. Ang pag-aaral ng makina ay maaaring mangailangan ng mga kumplikadong anyo ng pagbili mula sa iba't ibang mga stakeholder, samantalang ang mga aktibidad sa pagmimina ng data ay karaniwang nangangailangan lamang ng isang mabilis na pag-sign-off.
Sa kabila ng mga pagkakaiba na ito, ang parehong data ng pagmimina at pag-aaral ng makina ay nalalapat sa kaharian ng agham ng data. Ang pag-aaral nang higit pa tungkol sa agham ng data ay nakakatulong sa mga stakeholder na matuto nang higit pa tungkol sa kung paano gumagana ang mga prosesong ito at kung paano sila mailalapat sa anumang industriya.