Bahay Sa balita Bakit napakahalaga ang pagpili ng tampok sa pag-aaral ng machine?

Bakit napakahalaga ang pagpili ng tampok sa pag-aaral ng machine?

Anonim

T:

Bakit napakahalaga ang pagpili ng tampok sa pag-aaral ng machine?

A:

Napakahalaga ng pagpili ng tampok sa pag-aaral ng machine lalo na dahil nagsisilbi itong pangunahing pamamaraan upang idirekta ang paggamit ng mga variable sa kung ano ang pinaka mahusay at epektibo para sa isang naibigay na sistema ng pagkatuto ng makina.

Pinag-uusapan ng mga eksperto kung paano ang pagpili ng tampok at gawain ng pagkuha ng tampok upang mabawasan ang sumpa ng dimensionality o tulong na makitungo sa sobrang pag-aayos - ang mga ito ay magkakaibang mga paraan upang matugunan ang ideya ng labis na kumplikadong pagmomolde.

Libreng Pag-download: Pag- aaral ng Machine at Bakit Mahalaga ito

Ang isa pang paraan upang sabihin ito ay ang pagpipilian ng tampok na tumutulong upang bigyan ang mga developer ng mga tool upang magamit lamang ang pinaka may-katuturan at kapaki-pakinabang na data sa mga set ng pagsasanay sa pag-aaral ng machine, na kapansin-pansing binabawasan ang mga gastos at dami ng data.

Ang isang halimbawa ay ang ideya ng pagsukat ng isang kumplikadong hugis sa sukat. Bilang mga antas ng programa, kinikilala nito ang mas maraming bilang ng mga puntos ng data at ang sistema ay nagiging mas kumplikado. Ngunit ang isang kumplikadong hugis ay hindi ang pangkaraniwang hanay ng data na ginagamit ng isang sistema ng pagkatuto ng makina. Ang mga sistemang ito ay maaaring gumamit ng mga set ng data na malaki ang pagkakaiba-iba ng mga antas ng pagkakaiba-iba sa pagitan ng iba't ibang mga variable. Halimbawa, sa pag-uuri ng mga species, maaaring gamitin ng mga inhinyero ang pagpili ng tampok upang pag-aralan lamang ang mga variable na magbibigay sa kanila ng pinaka-target na mga resulta. Kung ang bawat hayop sa tsart ay may parehong bilang ng mga mata o binti, na maaaring alisin ang data, o iba pang mga nauugnay na mga punto ng data ay maaaring makuha.

Ang pagpili ng tampok ay ang diskriminasyon na proseso kung saan ang mga inhinyero direktang mga sistema ng pag-aaral ng makina patungo sa isang target. Bilang karagdagan sa ideya ng pag-alis ng pagiging kumplikado mula sa mga sistema sa laki, ang pagpili ng tampok ay maaari ding maging kapaki-pakinabang sa pag-optimize ng mga aspeto ng tinatawag ng mga eksperto na "bias variance trade-off" sa pagkatuto ng makina.

Ang mga dahilan kung bakit nakakatulong ang pagpili ng tampok sa bias at pagkakaiba-iba ng pagsusuri ay mas kumplikado. Ang isang pag-aaral mula sa Cornell University sa pagpili ng tampok, pagkakaiba-iba ng bias at pag-bagging ay nagsisilbi kung paano naglalarawan ang mga tampok ng mga proyekto sa pagpili ng pagpili.

Ayon sa mga may-akda, ang papel na "sinusuri ang mekanismo kung saan ang pagpili ng tampok ay nagpapabuti sa kawastuhan ng natutunan na pag-aaral."

Ang karagdagang pag-aaral ay nagsasaad:

Ang isang empirical bias / variance analysis bilang tampok sa pagpili ng tampok ay nagpapahiwatig na ang pinaka-tumpak na set ng tampok na tumutugma sa pinakamahusay na bias-variance tradeoff point para sa algorithm ng pagkatuto.

Sa pagtalakay sa paggamit ng malakas o mahina na kaugnayan, pinag-uusapan ng mga manunulat ang pagpili ng tampok bilang "isang paraan ng pagbabawas ng pagkakaiba-iba" - may katuturan ito kapag iniisip mo ang pagkakaiba-iba bilang mahalagang halaga ng pagkakaiba-iba sa isang naibigay na variable. Kung walang pagkakaiba-iba, ang data point o array ay maaaring maging walang silbi. Kung mayroong napakataas na pagkakaiba-iba, maaari itong maibilang sa kung ano ang maaaring isipin ng mga inhinyero bilang "ingay" o hindi nauugnay, di-makatwirang mga resulta na mahirap para sa sistema ng pag-aaral ng makina.

Kaugnay nito, ang pagpili ng tampok ay isang pangunahing bahagi ng disenyo sa pagkatuto ng makina.

Bakit napakahalaga ang pagpili ng tampok sa pag-aaral ng machine?