Bahay Audio Paano pinapagana ng mga bagong kakayahan sa pag-aaral ng makina ang pagmimina ng mga dokumento ng stock para sa data sa pananalapi?

Paano pinapagana ng mga bagong kakayahan sa pag-aaral ng makina ang pagmimina ng mga dokumento ng stock para sa data sa pananalapi?

Anonim

T:

Paano pinapagana ng mga bagong kakayahan sa pag-aaral ng makina ang pagmimina ng mga dokumento ng stock para sa data sa pananalapi?

A:

Isa sa mga kapana-panabik na mga bagong hangganan ng pag-aaral ng makina at AI ay ang mga siyentipiko at mga inhinyero ay nagsisimula sa iba't ibang mga paraan upang magamit ang ganap na mga bagong uri ng mga mapagkukunan upang mahulaan ang paggalaw ng stock at mga resulta ng pamumuhunan. Ito ay isang napakalaking laro-changer sa pinansiyal na mundo, at babaguhin ang mga diskarte sa pamumuhunan sa isang napakalalim na paraan.

Ang isa sa mga batayang ideya para sa pagpapalawak ng ganitong uri ng pananaliksik ng stock ay computational linguistic, na nagsasangkot sa pagmomolde ng natural na wika. Sinisiyasat ng mga eksperto kung paano gamitin ang mga dokumento ng teksto, mula sa mga pag-file ng SEC hanggang sa mga titik ng shareholder hanggang sa iba pang mga mapagkukunan na nakabatay sa teksto na peripheral, upang madagdagan o pag-aralan ang stock analysis o upang mabuo ang buong bagong pagsusuri.

Libreng Pag-download: Pag- aaral ng Machine at Bakit Mahalaga ito

Ang mahalagang pagtanggi ay ang lahat ng ito ay nagagawa lamang sa pamamagitan ng bagong mga pagsulong sa mga neural network, pag-aaral ng makina at pagsusuri ng natural na wika. Bago ang pagdating ng ML / AI, ang mga teknolohiya ng computing na kadalasang ginagamit na linear programming upang "basahin" ang mga input. Ang mga dokumento ng teksto ay hindi masyadong nakabalangkas upang maging kapaki-pakinabang. Ngunit sa pag-unlad na ginawa sa natural na pagsusuri ng wika sa loob ng nakaraang ilang taon, natuklasan ng mga siyentipiko na posible na "minahan" ang natural na wika para sa mga natukoy na resulta o, sa madaling salita, ang mga resulta na maaaring makalkula sa ilang paraan.

Ang ilan sa mga pinakamahusay na katibayan at pinaka-kapaki-pakinabang na mga halimbawa nito ay nagmula sa iba't ibang disertasyon at gawaing doktor na magagamit sa web. Sa isang papel, "Mga Aplikasyon ng Learning sa Machine at Computational Linguistics sa Financial Economics, " na inilathala noong Abril 2016, mailarawang ipinaliwanag ni Lili Gao ang mga kaugnay na proseso na partikular sa pagmimina ng mga corporate SEC filings, shareholder na tawag, at mga mensahe sa social media.

"Ang pagkuha ng mga makabuluhang signal mula sa hindi nakabalangkas at mataas na dimensional na data ng teksto ay hindi isang madaling gawain, " sulat ni Gao. "Gayunpaman, sa pag-unlad ng pag-aaral ng machine at computational na pamamaraan sa lingguwistika, pagproseso at pag-aaral ng istatistika na pagsusuri ng mga dokumento na tekstuwal ay maaaring maisakatuparan, at maraming mga aplikasyon ng pagtatasa ng istatistika ng statistic sa mga agham panlipunan ay napatunayan na matagumpay." Mula sa talakayan ni Gao tungkol sa pagmomodelo at pagkakalibrate sa abstract, ipinapakita ng buong binuo na dokumento kung paano gumagana nang detalyado ang ilan sa ganitong uri ng pagsusuri.

Ang iba pang mga mapagkukunan para sa mga aktibong proyekto ay kinabibilangan ng mga pahina tulad ng maikling proyekto ng GitHub na ito, at ang mapagkukunang IEEE na partikular na nakikipag-usap tungkol sa pagkuha ng mahalagang impormasyon sa pananalapi mula sa "pag-aaral ng sentimento sa Twitter."

Ang nasa ilalim na linya ay ang paggamit ng mga bagong modelo ng NLP ay nagmamaneho ng mabilis na pagbabago sa paggamit ng lahat ng uri ng mga dokumento ng teksto, hindi lamang para sa pagsusuri sa pananalapi, kundi para sa iba pang mga uri ng pagtuklas ng gilid, na lumabo na tradisyonal na itinatag na linya sa pagitan ng "wika" at "data."

Paano pinapagana ng mga bagong kakayahan sa pag-aaral ng makina ang pagmimina ng mga dokumento ng stock para sa data sa pananalapi?