T:
Bakit dapat bantayan ng mga tagapamahala laban sa kalabisan ng database?
A:Ang mga tagapamahala ng database at iba pang mga propesyonal sa IT ay dapat magbantay laban sa "kalabisan ng database" o "kalabisan ng data" dahil sa lahat ng mga negatibong epekto na maaaring magkaroon ng kalabisan sa isang database system o kapaligiran. Kung saan ang isang tiyak na piraso ng data ay nadoble, alinman sa dalawang mga patlang sa isang database, o sa dalawang magkakaibang mga database ng database, maaari itong magkaroon ng mga kahihinatnan para sa pagkuha ng data.
Ang isa sa mga unang dahilan sa pag-iwas sa kalabisan ng data ay maaaring maging masayang o labis.
Mahalagang ituro na ang ilang mga uri ng data kalabisan ay binalak, upang maprotektahan at i-back up ang data. Gayunpaman, ang iba ay lumitaw mula sa mahirap o hindi mahusay na pag-cod, o ang kawalan ng pansin sa mga pinakamahusay na kasanayan. Sa maraming mga kaso, ang malaking halaga ng kalabisan ng data ay nagdudulot ng database na mabilis na lumaki nang higit sa isang makatwirang sukat. Sa isip nito, maraming mga pagsisikap upang labanan ang kalabisan ng data ay ginagawa upang makatipid ng puwang sa isang database, at dahil dito, upang mabawasan ang mga gastos at pagsusumikap sa pagpapanatili. Gayunpaman, ito ay dapat gawin nang isang mata patungo sa pagiging praktiko - ang mga inhinyero ay maaaring magsagawa ng isang bagay na tinatawag na data deduplication, ngunit dapat itong gawin sa paraang mahusay.
Halimbawa, maaaring galugarin ng mga tagapamahala ng database ang isang bagay tulad ng pag-alis ng isang string mula sa paulit-ulit na patlang, tulad ng isang ibinahaging customer o pangalan ng kumpanya, at palitan ito ng isang simpleng variable na sangguniang kung saan gaganapin ang string sa ibang lugar. Makakatipid ito ng puwang sa isang database - ngunit maaari rin itong mangailangan ng mas maraming aktibidad ng server upang magsagawa ng isang naibigay na query, kaya hindi ito magiging mabisa sa tila ito.
Ang isa pang malaking dahilan upang maibawas ang data o maiwasan ang kalabisan ng data ay dahil sa pagkalito na maaaring magresulta. Ang data ng kalabisan sa isang database ay maaaring maging sanhi ng iba't ibang mga uri ng anomalya. Ang isa sa mga ito ay tinatawag na isang pag-update ng anomalya - nangyari ang mga pag-update ng mga anomalya kapag ang isang rekord ay naipasok muli na may na-update na impormasyon, ngunit ang pag-update ay hindi ibabalik ito sa orihinal na tala. Sa ganoong sitwasyon, maaaring mayroong tatlong magkakaibang mga tala para sa isang partikular na empleyado ng kumpanya, na may tatlong magkakaibang mga pamagat ng trabaho at tatlong magkakaibang mga address, dahil ang impormasyon ng tao ay hindi na-update sa buong buong database, ngunit sa tala lamang ang huling naipasok.
Tulad ng iminungkahi ng mga eksperto, maiiwasan ng mga administrador ng database ang kalabisan ng data sa pamamagitan ng disenyo. Maaari rin silang makisali sa mga gawi ng normalisasyon ng data na maaaring ayusin ang mga pag-update ng mga anomalya at iba pang mga uri ng mga anomalya sa pamamagitan ng pag-standard sa mga paraan kung saan pinapanatili ang mga talaan ng mga talahanayan ng database. Maaari ring ituloy ng mga administrator ng database ang mga pagsisikap sa pagbabawas ng data na linisin at pamantayan ang data sa iba pang mga paraan. Ang lahat ng ito ay naglilingkod sa layunin ng paglikha ng mga malinis na talahanayan ng database, na ginagawang mas pare-pareho ang mga talaan ng database at pinipigilan ang lahat ng sakit ng ulo at kumplikadong mga problema na nauugnay sa hindi planadong kalabisan ng data.