T:
Ano ang mas mahusay, isang platform o isang magdadala-iyong-sariling algorithm sa pag-aaral ng machine sa AWS?
A:Sa mga araw na ito, maraming mga kumpanya ang nagsasama ng mga solusyon sa pag-aaral ng machine sa kanilang tool ng analytics na itinakda upang mapahusay ang pamamahala ng tatak, mapabuti ang karanasan ng customer at dagdagan ang kahusayan sa pagpapatakbo. Ang mga modelo ng pagkatuto ng makina ang pangunahing sangkap ng mga solusyon sa pag-aaral ng machine. Ang mga modelo ay sinanay gamit ang matematika algorithm at malalaking set ng data upang makagawa ng maaasahang hula. Dalawang karaniwang halimbawa ng mga hula ay (1) pagtukoy kung ang isang hanay ng mga transaksyon sa pananalapi ay nagpapahiwatig ng pandaraya o (2) pagtatasa ng sentimento ng consumer sa isang produkto, batay sa input na nakolekta mula sa social media.
Ang Amazon SageMaker ay isang ganap na pinamamahalaang serbisyo na nagpapahintulot sa mga developer at data na siyentipiko na magtayo, magsanay at mag-deploy ng mga modelo ng pag-aaral ng machine. Sa SageMaker, maaari kang gumamit ng mga algorithm ng out-of-the-box o pumunta sa landas na magdadala ng iyong sariling sariling para sa isang mas napasadyang solusyon. Ang parehong mga pagpipilian ay may bisa at maglingkod nang pantay-pantay pati na rin ang batayan para sa isang matagumpay na solusyon sa pagkatuto ng makina.
(Tala ng editor: Maaari kang makakita ng iba pang mga kahalili sa SageMaker dito.)
Kabilang sa mga algorithm ng SageMaker ang mga sikat, mataas na na-optimize na mga halimbawa para sa pag-uuri ng imahe, pagproseso ng natural na wika, atbp Ang kumpletong listahan ay matatagpuan dito .
- Mga kalamangan sa labas ng Kotse: Ang mga algorithm na ito ay nai-pre-optimize (at sumasailalim sa patuloy na pagpapabuti). Maaari kang maging up, tumatakbo at mabilis na naka-deploy. Dagdag pa, magagamit ang awtomatikong hyper-parameter na pag-tune.
- Mga Pagsasaalang-alang sa Labas: Ang tuluy-tuloy na mga pagpapabuti na nabanggit sa itaas ay maaaring hindi makagawa ng mga resulta tulad ng kung ikaw ay may kumpletong kontrol sa pagpapatupad ng iyong mga algorithm.
Kung ang mga algorithm na ito ay hindi angkop para sa iyong proyekto, mayroon kang tatlong iba pang mga pagpipilian: (1) Apache Spark Library ng Amazon, (2) pasadyang Python code (na gumagamit ng TensorFLow o Apache MXNet) o (3) "dalhin ang iyong sariling" kung saan ka ay mahalagang hindi nakakaugnay, ngunit kakailanganin upang lumikha ng isang imahe ng Docker upang sanayin at maglingkod sa iyong modelo (maaari mong gawin ito gamit ang mga tagubilin dito ).
Nagdudulot sa iyo ang pagdadala ng iyong sariling sariling kumpletong kalayaan. Maaari itong patunayan na kaakit-akit sa mga siyentipiko ng data na nakapagpatayo ng isang aklatan ng pasadya at / o pagmamay-ari ng algorithmic code na maaaring hindi kinakatawan sa kasalukuyang hanay ng kahon.
- Dalhin-Iyong Sariling Mga Bentahe: Pinapagana ang kumpletong kontrol sa buong data ng pipeline ng data kasama ang paggamit ng proprietary IP.
- Mga Pagsasaalang-alang sa Iyong Pag-aari: Kinakailangan ang pagbubuo sa pagsasanay at pagsilbi sa nagresultang modelo. Ang pagsasama ng mga pagpapabuti ng algorithm ay ang iyong responsibilidad.
Anuman ang iyong pagpipilian sa algorithm, ang SageMaker sa AWS ay isang diskarte na isinasaalang-alang, na ibinigay kung gaano nakatuon ang nakatuon sa kadalian na paggamit mula sa isang pananaw sa agham ng data. Kung sinubukan mong lumipat ng isang proyekto sa pag-aaral ng makina mula sa iyong lokal na kapaligiran sa isang naka-host, magugulat ka sa kung paano ito ginagawa ng walang tahi. At kung nagsisimula ka mula sa simula, mayroon ka nang ilang mga hakbang na mas malapit sa iyong layunin, na ibinigay kung magkano ang nasa iyong mga daliri.