Talaan ng mga Nilalaman:
- Kahulugan - Ano ang ibig sabihin ng Kahulugan ng Kaalaman sa Mga Databases (KDD)?
- Ipinapaliwanag ng Techopedia ang Kaalaman ng Pag-alam sa Mga Databases (KDD)
Kahulugan - Ano ang ibig sabihin ng Kahulugan ng Kaalaman sa Mga Databases (KDD)?
Ang pagkatuklas ng kaalaman sa mga database (KDD) ay ang proseso ng pagtuklas ng kapaki-pakinabang na kaalaman mula sa isang koleksyon ng data. Ang malawak na ginagamit na pamamaraan ng pagmimina ng data ay isang proseso na kinabibilangan ng paghahanda at pagpili ng data, paglilinis ng data, isinasama ang paunang kaalaman sa mga set ng data at pagbibigay kahulugan sa mga tumpak na solusyon mula sa mga naobserbahang resulta.
Ang mga pangunahing lugar ng aplikasyon ng KDD ay kinabibilangan ng marketing, detection ng pandaraya, telecommunication at manufacturing.
Ipinapaliwanag ng Techopedia ang Kaalaman ng Pag-alam sa Mga Databases (KDD)
Ayon sa kaugalian, ang data mining at pagtuklas ng kaalaman ay manu-manong ginanap. Habang lumipas ang oras, ang dami ng data sa maraming mga sistema ay lumaki nang mas malaki kaysa sa laki ng terabyte, at hindi na maingat na mapangalagaan nang manu-mano. Bukod dito, para sa matagumpay na pagkakaroon ng anumang negosyo, ang pagtuklas ng mga batayan ng mga pattern sa data ay itinuturing na mahalaga. Bilang isang resulta, maraming mga tool sa software ang binuo upang matuklasan ang mga nakatagong data at gumawa ng mga pagpapalagay, na nabuo ng isang bahagi ng artipisyal na katalinuhan.
Ang proseso ng KDD ay umabot sa rurok nito sa huling 10 taon. Nagtataglay ito ngayon ng maraming iba't ibang mga diskarte sa pagtuklas, na kinabibilangan ng induktibong pag-aaral, estadistika ng Bayesian, pag-optimize ng semantiko ng query, pagkuha ng kaalaman para sa mga dalubhasang sistema at teorya ng impormasyon. Ang panghuli layunin ay upang kunin ang mataas na antas ng kaalaman mula sa mababang antas ng data.
Kasama sa KDD ang maraming aktibidad na multidisiplinary. Kasama dito ang pag-iimbak at pag-access ng data, pag-scale ng mga algorithm sa napakalaking mga hanay ng data at pagbibigay kahulugan sa mga resulta. Ang proseso ng paglilinis ng data at pag-access ng data na kasama sa data warehousing ay mapadali ang proseso ng KDD. Sinusuportahan din ng artipisyal na katalinuhan ang KDD sa pamamagitan ng pagtuklas ng mga batas sa empatiya mula sa eksperimento at obserbasyon. Ang mga pattern na kinikilala sa data ay dapat na may bisa sa bagong data, at nagtataglay ng ilang antas ng katiyakan. Ang mga pattern na ito ay itinuturing na bagong kaalaman. Ang mga hakbang na kasangkot sa buong proseso ng KDD ay:
- Kilalanin ang layunin ng proseso ng KDD mula sa pananaw ng customer.
- Maunawaan ang mga domain ng application na kasangkot at kaalaman na kinakailangan
- Pumili ng isang set ng target na data o subset ng mga sample ng data kung saan isinasagawa ang pagtuklas.
- Linisin at preprocess data sa pamamagitan ng pagpapasya ng mga diskarte upang hawakan ang nawawalang mga patlang at baguhin ang data ayon sa bawat kinakailangan.
- Pasimplehin ang mga hanay ng data sa pamamagitan ng pag-alis ng mga hindi kanais-nais na variable. Pagkatapos, pag-aralan ang mga kapaki-pakinabang na tampok na maaaring magamit upang kumatawan sa data, depende sa layunin o gawain.
- Itugma ang mga layunin ng KDD sa mga pamamaraan ng pagmimina ng data upang magmungkahi ng mga nakatagong pattern.
- Pumili ng mga algorithm ng pagmimina ng data upang matuklasan ang mga nakatagong pattern. Kasama sa prosesong ito ang pagpapasya kung aling mga modelo at mga parameter ang maaaring angkop para sa pangkalahatang proseso ng KDD.
- Maghanap ng mga pattern ng interes sa isang partikular na form ng representasyon, na kinabibilangan ng mga panuntunan sa pag-uuri o mga puno, regression at kumpol.
- I-interpret ang mga mahahalagang kaalaman mula sa mga pattern ng mina.
- Gamitin ang kaalaman at isama ito sa ibang sistema para sa karagdagang aksyon.
- I-dokumento ito at gumawa ng mga ulat para sa mga interesadong partido.
