Bahay Audio I-embed ang analytics kahit saan: pagpapagana ng siyentipiko ng data ng mamamayan

I-embed ang analytics kahit saan: pagpapagana ng siyentipiko ng data ng mamamayan

Anonim

Sa pamamagitan ng Techopedia Staff, August 25, 2016

Takeaway: Tinatalakay ng Host na si Rebecca Jozwiak ang kababalaghan ng naka-embed na analytics at mga datos na mamamayan ng data kasama sina Dr. Robin Bloor, Dez Blanchfield at David Sweenor.

Dapat kang magparehistro para sa kaganapang ito upang matingnan ang video. Magrehistro upang makita ang video.

Rebecca Jozwiak: Mga kababaihan at mga ginoo, kumusta at maligayang pagdating sa Hot Technologies. "I-embed Kahit saan: Paganahin ang Citizen Data Scientist" ang aming paksa ngayon. Pinupunan ko para sa iyong karaniwang host, ito ay Rebecca Jozwiak na pinupunan para kay Eric Kavanagh. Oo, mainit ang taong ito. Lalo na ang salitang "siyentipiko ng data" ay nakakakuha ng maraming pansin kahit na ginamit namin ang tawag sa kanila na mga pangalan ng pagbubutas tulad ng "estadistika" o "eksperto sa analytics, " medyo nakikipag-tackle sa parehong uri ng mga aktibidad ngunit nakakakuha ito ng isang bagong bagong pangalan at ito ay nakakakuha ng maraming pansin. Lubos silang kanais-nais na magkaroon sa lugar ng trabaho, kapaki-pakinabang sa samahan, at lahat ay nais ng isa. Ngunit ang mga ito ay: 1) mahal, 2) mahirap hanapin. Alam mo, ang lahat ay nasa buong balita tungkol sa kakulangan sa kasanayan ng siyentipiko ng data, oo, ngunit nag-aalok pa rin sila ng napakalaking halaga sa samahan at ang mga tao ay uri ng pag-clamoring upang malaman kung paano makukuha ang halagang iyon nang hindi kinakailangang i-drop ang dime, kaya sa magsalita

Ngunit ang mabuting balita ay nakikita natin ang mga tool at software na lumalabas na uri ng compensating para sa kakulangan na iyon. Mayroon kaming automation, pag-aaral ng makina, naka-embed na analytics, na kung saan ang matututunan natin tungkol sa ngayon, at ito ay uri ng naibigay na bagong termino, "ang scientist data data ng mamamayan, " at ano ang ibig sabihin nito? Hindi, hindi ito ang iyong sinanay na siyentipiko ng data, maaaring maging iyong gumagamit ng negosyo, iyong dalubhasa sa BI, isang tao mula sa IT, isang taong may background ngunit marahil hindi kinakailangan ang kadalubhasaan. Ngunit kung ano ang ginagawa nito, ang mga tool na ito at software, ay nagbibigay sa mas maraming mga tao ng pag-access sa mga matalinong solusyon kahit na hindi nila alam ang malalim na coding. Ngunit nakakatulong lamang ito na mapabuti ang pangkalahatang pagganap kapag binigyan mo ang lahat ng kaunti pang pag-access sa pag-iisip na iyon. Hindi mo kailangang magkaroon ng pagsasanay na kinakailangang magkaroon ng uri ng pag-usisa na maaaring humantong sa magagandang pananaw para sa iyong kumpanya.

Tinatalakay na sa amin ngayon ay ang aming sariling Robin Bloor, pinuno ng analyst sa Bloor Group, isa sa mga mailap na mga siyentipiko ng data, si Dez Blanchfield ay tumatawag, at pagkatapos ay mayroon kaming David Sweenor mula kay Dell Statistica ay bibigyan kami ng isang pagtatanghal ngayon. At kasama ko itong ipapasa kay Robin Bloor.

Robin Boor: Okay, salamat sa pagpapakilala na iyon. Nag-iisip ako tungkol dito sa isang makasaysayang konteksto. Ang talagang tinitingnan natin dito ay isa sa mga disenyo ni Leonardo da Vinci para sa isang uri ng glider na maaaring ilagay sa isang tao ang isang tao. Wala akong ideya kung ito ay talagang gumagana. Hindi ako papasok, kailangan kong sabihin. Gayunpaman, da Vinci, sa tuwing naiisip ko ang tungkol kay da Vinci, iniisip ko siya bilang isa sa mga pinaka-matanong at analytical na mga tao na dati nang umiiral. At medyo malinaw kung titingnan mo lamang ang glider na ito ay idinisenyo batay sa isang pakpak ng isang ibon at mayroon siyang sa isang paraan o ibang pinag-aralan ang mga flight ng mga ibon upang mabuo ito.

Kung kukuha tayo ng makasaysayang pananaw - talagang tinignan ko ito - ang analytics ay marahil ang pinakalumang aplikasyon ng matematika. Mayroong mga census sa petsang iyon hanggang sa mga panahon ng Babilonya. Alam namin ang tungkol dito dahil sa karaniwang may ilang mga cuneiform tablet na may data tulad nito sa kanila. Hindi alam kung mayroong anumang bagay na bumalik sa una. Ngunit ang malinaw na bagay ay nakuha mo ang iyong sarili ng isang sibilisasyon na may isang malaking populasyon ng mga tao, talagang nangangailangan ito ng pagpaplano at sulit na malaman kung ano ang pinaplano mo at kung ano ang mga kinakailangan ng mga taong iyon.

At iyon ang uri ng kung saan ito nagsimula at narito rin kung saan nagsimula ang pag-compute dahil ang mga unang computer, ang maagang mechanical computer, ay sa totoo lang, sa palagay ko ang una ay ang census na nilikha ni Hollerith, na naging IBM, naniniwala ako. Ang lahat ng ito ay sumulong. Nagkaroon ng ilang uri ng pagsasama sa pagitan ng marahil sa mga 1970 at sa kasalukuyan, kung saan mayroong isang malaking bilang ng iba pang mga aplikasyon at analytics, maaari mong sabihin, kumuha ng isang upuan sa likod. Oo, nagkaroon ng analytics na nangyayari - nangyayari ito sa mga malalaking organisasyon, lalo na sa mga bangko at kumpanya ng seguro, at talagang General Electric at telco at mga bagay na tulad nito - ngunit hindi ito karaniwang ginagamit sa buong negosyo at ngayon nagsisimula itong masanay sa pangkalahatan sa buong negosyo. At binago ang laro, talaga. Ang unang bagay na naisip ko na iguguhit ko ang pansin, ang data na pyramid, na gusto ko lalo. Ito ay, ang ibig kong sabihin, iginuhit ko ang isa sa mga 20 taon na ang nakakaraan - hindi bababa sa 20 taon na ang nakakaraan - upang subukan at maunawaan, talaga, sa oras na iyon, sinubukan kong maunawaan ang BI at ang ilan sa mga naunang pagmimina ng data na ginagawa. Ang tinukoy ko dito ay ang ideya ng data at ang mga halimbawa ay mga senyas, pagsukat, pag-record, kaganapan, transaksyon, kalkulasyon, pagsasama-sama, indibidwal na mga punto ng impormasyon. Maaari mong isipin ang mga ito bilang mga molekula ng impormasyon, ngunit ang mga ito ay mga indibidwal na puntos. Nagiging impormasyon ito sa sandaling nakakakuha ito ng konteksto. Ang naka-link na data, nakabalangkas na data, database, visualization ng data, plotters, schemers, at ontologies - lahat sila ay kwalipikado sa aking isip bilang impormasyon sapagkat ang iyong nagawa ay pinagsama-samang maraming magkasama at lumikha ng isang bagay na higit pa sa isang punto ng data, isang bagay na talagang may hugis, isang hugis ng matematika.

Sa itaas na mayroon tayong kaalaman. Maaari nating, sa pamamagitan ng pagsusuri ng impormasyon, matututuhan natin na may iba't ibang mga pattern at maaari nating magamit ang mga pattern na iyon sa pamamagitan ng pagbabalangkas ng mga patakaran, patakaran, patnubay, pamamaraan, at pagkatapos ay kukuha ito ng anyo ng kaalaman. At halos lahat ng mga programa sa computer, anuman ang kanilang ginagawa, ay kaalaman sa isang uri, dahil nagtatrabaho sila laban sa data at nag-aaplay ng mga patakaran sa kanila. Mayroon kaming tatlong mga layer na ito at mayroong isang pagtaas ng pagpipino na nagpapatuloy sa pagitan ng mga layer. At sa kaliwang bahagi ng diagram na ito ay ipinakita mo ang mga bagong data na pumapasok, kaya maraming mga bagay na ito ay static. Ang data ay naiipon, ang impormasyon ay natipon at ang kaalaman ay maaaring lumago. Sa tuktok, mayroon kaming "Pag-unawa" at mapanatili ko, kahit na ito ay isang pilosopikal na argumento, ang pag-unawa ay nakatira lamang sa mga tao. Kung mali ako tungkol doon, lahat tayo ay papalitan ng mga computer sa ilang oras sa oras. Ngunit sa halip na magkaroon ng debate, magpapatuloy ako sa susunod na slide.

Nang tiningnan ko ito, ang nakawiwiling bagay, ito ay isang bagay kamakailan, ang kagiliw-giliw na bagay ay subukan at malaman kung ano talaga ang analytics. At sa huli sa pamamagitan ng pagguhit ng iba't ibang mga diagram at nagtatapos sa isang katulad nito, napunta ako sa konklusyon, sa aktwal na katunayan, ang pag-unlad ng analytics ay talagang pag-unlad ng software na may isang kakila-kilabot na halaga ng mga pormula sa matematika. Ang pagsaliksik ng analitikal ay medyo naiiba sa pag-unlad ng software sa kamalayan na talagang kumuha ka ng maraming, maraming iba't ibang mga modelo at mag-imbestiga sa kanila upang makabuo ng bagong kaalaman tungkol sa data. Ngunit kapag nabuo mo ito, ipinatupad ang alinman sa sa palagay ko bilang suporta ng pasibo sa pasya, na ang impormasyon ay pinakain lamang sa isang gumagamit; suporta ng interactive na desisyon, na kung saan ay mga bagay tulad ng OLAP, kung saan ang gumagamit ay bibigyan ng isang nakaayos na hanay ng data na maaari nilang siyasatin at ibigay ang mga bagay para sa kanilang sarili gamit ang iba’t ibang magagamit na mga tool. Ang daming visualization ay ganyan. At pagkatapos ay mayroon kaming automation kung maaari mo lamang i-on ang ilang analytical na pananaw na natipon mo sa isang set ng mga patakaran na maipatupad, hindi mo kailangan ng isang tao na makakasangkot. Iyon ang uri ng paraan na tiningnan ko ito nang gawin ko ang lahat ng iyon. At iba't ibang mga bagay na nagsimula na mangyari sa akin. Kapag ang isang lugar ng aktibidad, dapat nating sabihin, sa sandaling ang isang domain ng data ay talagang mined, lubusan na mined, lubusang ginalugad sa bawat posibleng direksyon, sa kalaunan ay naging crystallized BI lamang ito. Ang kaalaman na naimbento ay nagsisimula upang maging kaalaman na nagpapaalam sa iba't ibang mga gumagamit sa iba't ibang paraan, at pinatataas ang kanilang kakayahan, sana, na talagang gawin ang gawaing kanilang ginagawa.

Isa sa mga bagay na napansin ko at tiningnan ko ang predictive analytics ng halos limang taon, ngunit ang mga nahuhulaan na analytics ay nagiging BI, sa kahulugan na ito ay nagiging kapaki-pakinabang na impormasyon upang mapakain sa mga tao at tulad ng naituro ko na, mayroong awtomatikong pag-uulat ng BI, BI explorative, BI, ibang-iba na mga gradasyon nito at ang mga nahuhulaan na analytics ay talagang pupunta sa lahat ng tatlong direksyon. At ang proseso ng analytical na itinuro ko ay hindi naiiba sa pag-unlad ng software, na ginagawa lamang ng iba't ibang mga tao na may bahagyang magkakaibang mga kasanayan. Ipagpalagay ko na dapat kong bigyang-diin na ang mga kasanayan na kinakailangan upang makagawa ng isang talagang mahusay na siyentipiko ng data ay tumagal ng mga taon upang makuha. Hindi nila madaling nakuha at hindi isang malaking bilang ng mga tao ang maaaring gawin ito, ngunit iyon ay dahil sa pagsasama nito sa pag-unawa sa matematika sa isang napaka sopistikadong antas upang malaman kung ano ang may bisa at kung ano ang hindi wasto. Ang mga pagpapaunlad ng Analytics, pagtuklas ng bagong kaalaman, pagtatanim ng analytics, ito ay tungkol sa paggawa ng kaalaman sa pagpapatakbo. Iyon ang uri ng backdrop na nakikita ko sa kabuuan ng analytics. Ito ay isang malaking lugar at marami, maraming mga sukat dito, ngunit sa palagay ko na ang pangkalahatang pag-aangkop ay nalalapat sa lahat.

Pagkatapos mayroong pagkagambala sa negosyo, tulad ng nabanggit ko na mayroong isang bilang ng mga samahan, ang mga kumpanya ng parmasyutiko ay isa pa, na mayroon sa kanilang DNA nakuha nila ang analytics. Ngunit maraming mga organisasyon na talagang wala ito sa kanilang DNA, at mayroon na silang kakayahan, ngayon ang software at ang hardware ay mas mura kaysa sa dati, ngayon mayroon silang kakayahan na samantalahin ito. Sasabihin ko ang isang bilang ng mga bagay. Ang unang bagay ay ang analytics ay, sa maraming mga pagkakataon na ito ay R&D. Maaari ka lamang mag-aplay ng mga analytics sa isang tukoy na lugar ng samahan at maaaring tila pangmatagalan na ikaw ay sa isang paraan o ibang pagsusuri sa mga order ng customer muli mula sa iba't ibang mga pananaw, pagsali dito sa iba pang data. Ngunit ang analytics ay talagang lumilikha ng posibilidad na tingnan ang samahan nang buo at upang masuri ang anumang partikular na aktibidad na nangyayari sa loob ng samahan at buong kadena ng mga aktibidad. Ngunit kapag talagang lumipat ka sa lugar na iyon, mapanatili kong pananaliksik at pag-unlad ito. At mayroong isang katanungan na tinanong ako ng ilang beses, na kung saan, "Magkano ang dapat gastusin ng isang kumpanya sa analytics?" At sa palagay ko ang pinakamahusay na paraan upang mag-isip tungkol sa pagbibigay ng sagot sa iyon ay mag-isip ng analytics bilang R&D, at itanong lamang, "Well magkano ang gugugol mo sa R&D sa lugar ng kahusayan ng negosyo?"

At ang mga negosyong hindi kasama ng analytics, maraming bagay na hindi nila alam. Una sa lahat, hindi nila alam kung paano ito gagawin. Karaniwan kung sila ay talagang pupunta sa isang paraan o ibang magpatibay ng analytics sa loob ng samahan - talagang talagang wala silang pagpipilian ngunit pumunta sa isang consultant na makakatulong sa kanila sa paggawa nito dahil, imposible o talagang mahirap para sa karamihan mga negosyo na talagang umarkila ng isang siyentipiko ng data, paghahanap ng isa, nagbabayad para sa isa, at talagang nagtitiwala sa kanila na gawin ang nais mong gawin. Napakahirap. Karamihan sa mga negosyo ay hindi alam kung paano mag-upa o turuan ang mga kawani upang aktwal na gawin ang gawaing ito, at ang dahilan para sa na lamang ay wala pa ito sa kanilang DNA, kaya hindi ito bahagi ng kanilang mga natural na proseso ng negosyo. Ito feed sa susunod na punto. Hindi nila alam kung paano ito gagawing proseso ng negosyo. Pinakamahusay na paraan upang gawin iyon, sa pamamagitan ng paraan, ay upang kopyahin kung ano ang mga kumpanya ng parmasyutiko at mga kumpanya ng seguro, tignan lang, at ilang mga kumpanya sa health care center, tingnan lamang ang paraan na ginagamit nila ang analytics at kopyahin ito. Dahil ito ay isang proseso ng negosyo. Hindi alam kung paano ito i-pulis o i-audit ito. Iyon talaga, lalo na ngayon na isang kakila-kilabot na mga kumpanya ng software ang lumikha ng mga produkto na awtomatiko ang isang kakila-kilabot na maraming analytics. Ang punto tungkol sa pag-awdit ay mahalaga, kapag mayroon kang isang pagkonsulta o isang tao sa site na maaasahan upang maunawaan kung ano ang mga resulta ng anumang pagkalkula ng analitikal, iyon ay isang uri ng pagpipilian na kailangan mong gawin, ngunit kung inilalagay mo ang talagang malakas na mga tool na analitikal ang mga kamay ng mga taong hindi maunawaan nang wasto ang mga analytics, malamang na tumalon sila sa mga konklusyon na maaaring hindi tama. At tulad ng sinabi ko, ang mga kumpanya ay hindi alam kung paano badyet para dito.

Ito ang mga lasa ng analytics, tatakbo lang ako sa kanila. Ang analytics ng statistika at istatistika ng istatistika ay makabuluhang naiiba upang mahulaan ang analytics, na ang karamihan sa pamamagitan ng paraan ay angkop sa kurba. Ang pag-aaral ng makina ay naiiba sa mga bagay na iyon, ang path analytics at serye ng oras, na kung saan ay karaniwang ginagawa sa mga stream ng katayuan ay naiiba muli. Ang graphic analytics ay naiiba muli, at ang mga text analytics at semantikong analytics ay naiiba muli. Itinuturo lamang nito na ito ay isang napaka bagay na multi-genre. Hindi, hindi ka nagsisimulang gumawa ng mga analytics, nagsisimula kang tumingin sa mga problema mo at maghanap para sa iba't ibang mga tool at iba't ibang lasa ng analytics na angkop sa mga iyon. At sa wakas, ang net net. Dahil sa ebolusyon ng hardware at software, sa aking palagay ang analytics ay nasa pagkabata nito. Marami pa, marami pang darating at makikita natin itong magbukas sa mga darating na taon. Sa palagay ko maipapasa ko ang bola kay Dez ngayon.

Dez Blanchfield: Oo, pag-usapan ang tungkol sa isang matigas na kilos na dapat sundin, Robin. Bisitahin ko nang maikli ang paksang ito mula sa isa sa aking mga paboritong anggulo, na kung saan ay ang anggulo ng tao. Maraming pagbabago ang nagaganap sa ating pang-araw-araw na buhay. Isa sa mga pinakadakilang pagkagambala sa ating pang-araw-araw na buhay, na sa kasalukuyan ay nakikita ko, ay ang pang-araw-araw na gawain lamang. Ang pag-upo at pagsisikap na gawin ang trabahong inupahan mong gawin, at ang pagtaas ng inaasahan na pupunta ka mula sa isang pang-araw-araw na tao sa isang superhero at ang dami ng impormasyong umaagos sa paligid ng mga samahan at napakabilis, ito ay isang makabuluhang hamon at higit pa at marami pa tayong kinakailangang magbigay ng mas mahusay at mas mahusay na mga tool sa mga tao upang subukan at makayanan ang daloy ng kaalaman at impormasyon at sa gayon ay naisip kong subukan at darating ito mula sa kaunting isang masayang anggulo . Ngunit, palagi itong tinatamaan sa akin kung paano namin nakuha ang mataas na kaisipan o flash mobs at iba pa, iyon ang uri ng pagmamaneho sa amin patungo sa kung ano ang pinag-uusapan natin bilang analytics ngunit talagang ang pinag-uusapan natin ay ang pagbibigay ng impormasyon na magagamit sa mga tao, at nagpapahintulot sa kanila na makihalubilo dito at gawin ito sa paraang natural at naramdaman itong normal.

At sa katunayan, ito ay nagpapaalala sa akin ng isang video sa YouTube ng isang bata, maliit na sanggol, na nakaupo sa sahig at nakaupo doon na naglalaro kasama ang isang iPad at iniikot at pinaputok at pinipiga at pinalabas ang mga imahe at naglalaro sa screen, ang data doon. At pagkatapos ay kinuha ng magulang ang iPad at naglalagay ng magazine, isang naka-print na magazine sa kandungan ng bata. At ang batang ito marahil ay hindi hihigit sa dalawang taong gulang. Ang bata ay nagsisimulang subukan at mag-swipe sa screen ng magazine, at kurutin at pisilin at hindi tumugon ang magazine. Itinaas ng bata ang daliri nito at tiningnan ito at iniisip, "Hmm, hindi sa palagay ko ay gumagana ang aking daliri, " at iniikot ang sarili sa braso at iniisip, "Ah hindi, gumagana ang daliri ko ay nararamdaman ko ang aking braso at iyon maganda ang hitsura, "at pinipiga nito ang daliri, at ang daliri ay nakikipag-usap at tumutugon. Oo. Pagkatapos ay sinusubukan nitong makipag-ugnay muli sa magazine, at mababa at narito, hindi ito kurot at pisilin at mag-scroll. Pagkatapos ay inalis nila ang magazine at ibinalik ang iPad sa kandungan nito, at biglaang gumagana ang bagay. At kaya narito ang isang sanggol na sumama at sanay na gumamit ng isang analitikal na tool o isang live streaming na tool para sa libangan at hindi ito magagawa kung paano dapat magtrabaho ang isang magazine at kung paano i-flip ang mga pahina.

At iyon ang isang kawili-wiling konsepto sa kanyang sarili. Ngunit kapag iniisip ko ang tungkol sa kaalaman na gumagalaw sa mga samahan, at ang paraan ng pag-agos ng data at ang paraan ng pag-uugali ng mga tao, madalas kong iniisip ang konsepto na ito ng natutunan ng mga tao na maging isang flash mob, na kung saan ay isang kaganapan kung saan, at kung saan ginagawa ng social media mas madaling gawin ito, isang ideya tulad ng kung saan pupunta sa lugar na ito sa oras at petsa at pagkilos na ito, o video at alamin ang mga sayaw na ito, o magsuot ng kulay na sumbrero at ituro sa hilaga sa isang oras. At itinutulak mo ito sa pamamagitan ng iyong network, at palagiang isang buong pagkarga ng mga tao, daan-daang mga ito, lumiko sa parehong lugar nang sabay-sabay gawin ang parehong bagay at mayroong ganitong kadahilanan, tulad nito, "Banal na baka, iyon ay talagang kamangha-manghang! "Ngunit talagang ito ay isang napaka-simpleng ideya, at isang simpleng konsepto na itinulak lamang sa pamamagitan ng aming mga network at nakuha namin ang kinalabasan na ito na isang nakamamanghang nakamamanghang at naririnig na kamangha-manghang bagay. At kapag iniisip mo ang tungkol sa isang samahan, ang paraang nais nating kumilos ang mga tao at ang paraan na nais natin silang harapin ang mga sistema ng impormasyon at mga kostumer, madalas na simple, isang ideya o isang konsepto o isang kaugalian sa kultura o pag-uugali na sinusubukan nating ipasa sa pamamagitan at bigyan ng kapangyarihan ang mga tool at impormasyon.

At sinusuportahan ang lahat na ito ay ang mantra na mayroon ako ng higit sa dalawa at kalahating dekada at iyon ay, kung hindi mahahanap ng iyong kawani kung ano ang kailangan nilang gawin ang kanilang trabaho, maging mga kasangkapan ba ito o impormasyon, palagi silang susunurin ang gulong. At sa gayon ito ay isang patuloy na pagtaas ng hamon ngayon, kung saan marami kaming kaalaman at maraming impormasyon at mga bagay na gumagalaw nang napakabilis, na nais nating itigil ang mga tao na muling likhain ang gulong. At kapag iniisip namin ang tungkol sa aming kapaligiran sa pagtatrabaho, bumalik sa anggulo ng mga tao, na kung saan ay isa sa aking mga paborito, nagulat ako nang kami ay nagulat na ang mga cubicle ay hindi isang kasiya-siyang kapaligiran para sa magagandang kinalabasan, o nag-linya kami ng mga bagay na tulad ng kakila-kilabot na ito mga larawan dito, at hindi ito nagbago nang marami, ibinaba lamang ang mga pader at tinawag silang bukas na mga puwang sa pagtatrabaho. Ngunit sa gitna ng dilaw na loop sa paligid nila, mayroong dalawang tao na nagpapalitan ng kaalaman. At gayon pa man, kung titingnan mo ang natitirang silid ay silang lahat ay nakaupo roon nang walang pasubali na nakalawit doon, naglalagay ng impormasyon sa isang screen. At mas madalas kaysa sa hindi, hindi talaga pagpapalitan ng kaalaman at data, at mayroong isang saklaw na dahilan para sa. Ngunit ang pakikihalubilo sa gitna ng sahig sa kaliwa doon sa dilaw na bilog, mayroong dalawang tao na nakikipag-chat sa malayo roon, nagpapalitan ng kaalaman, at marahil sinusubukan na makahanap ng isang bagay, sinusubukan mong sabihin, "Alam mo ba kung nasaan ang ulat na ito, kung saan ako mahahanap ang data na ito, anong tool ang ginagamit ko upang gawin ang bagay na ito? "At marahil hindi ito nagtrabaho kaya wala silang nakuha, at gumala sa buong palapag, sinira ang panuntunan ng puwang ng opisina ng cubicle at ginawa ito nang personal.

At mayroon kaming mga katulad na kapaligiran sa paligid ng tanggapan na nagbibiro kami, ngunit ang katotohanan ay ang mga ito ay lubos na makapangyarihan at epektibo. At ang isa sa aking mga paborito ay ang mobile o naayos na platform ng analytics na tinatawag na water cooler, kung saan ang mga tao ay bumangon doon at chit-chat sa paligid doon at magpalitan ng kaalaman, at ihambing ang mga ideya at magsagawa ng analytics habang nakatayo sa water cooler, swap na mga ideya. Napakalakas na konsepto nila kapag iniisip mo ang mga ito. At kung maaari mong isalin ang mga ito sa iyong mga system at tool, nakakakuha ka ng isang kamangha-manghang kinalabasan. At nakuha namin ang lahat ng oras na paborito, na kung saan ay ang pinakamalakas na hub data ng pamamahagi ng opisina, kung hindi man kilala bilang ang desk ng pagtanggap. At kung hindi ka makahanap ng isang bagay, saan ka pupunta? Well lumakad ka sa harap ng opisina at pumunta ka sa pagtanggap at sasabihin, "Alam mo ba kung saan ang x, y, z ay?" At nangahas kong sinuman na sabihin sa akin na hindi nila nagawa iyon kahit isang beses sa isang bago trabaho o sa isang punto sa oras kung kailan hindi lamang nila mahanap ang isang bagay. At kailangan mong tanungin ang iyong sarili, bakit nangyari ang mga ito? Dapat itong maging sa isang lugar sa intranet o ilang tool o anupaman. Dapat itong madaling mahanap.

At kaya pagdating sa data at analytics at mga tool na ibinigay namin sa aming mga kawani upang gawin ang kanilang trabaho at ang paraan ng pakikipag-ugnay ng mga tao sa mga trabaho, nakuha ko ang pananaw na bago ang paglitaw ng mga tool sa analytics at malaking platform ng data, o "pagproseso ng data" na tawagin din ito sa lumang paaralan, pag-uulat at pagbabahagi ng kaalaman ay malayo sa pabago-bago o pakikipagtulungan o bukas, at kapag iniisip mo ang tungkol sa uri ng mga sistema na inaasahan nating gawin ng mga tao ang kanilang mga trabaho, mayroon kaming klasikal, ano tinawag ng mga tao ang legacy ngayon, ngunit ang katotohanan ay ang legacy lamang ang nakuha at narito pa rin ngayon, at samakatuwid ay hindi talaga ito pamana. Ngunit ang tradisyonal na mga sistema ng HR at mga sistema ng ERP - pamamahala ng mapagkukunan ng tao, pagpaplano ng mapagkukunan ng negosyo, pamamahala ng data ng negosyo, at mga sistema na ginagamit namin upang pamahalaan ang impormasyon upang magpatakbo ng isang kumpanya. Ito ay walang paltos na nakatahi. At mula sa tuktok na dulo, ang mga simpleng platform tulad ng mga intranets ng departamento, sinusubukan na makipag-usap kung nasaan ang mga bagay at kung paano makuha ang mga ito at kung paano makihalubilo sa kaalaman sa paligid ng lugar. Pop-up namin iyon sa aming intranet. Ito ay kasing ganda ng mga tao na gumawa ng oras at pagsisikap na ilagay ito doon, kung hindi, maiiwan lamang ito sa iyong ulo. O nakakuha ka ng data na nakaupo sa ilalim ng chain ng pagkain, sa mga corporate SAN at lahat ng nasa pagitan, kaya ang mga network ng lugar ng imbakan ay puno ng mga file at data, ngunit kung sino ang nakakaalam kung saan hahanapin ito.

Mas madalas kaysa sa hindi, itinayo namin ang mga saradong platform ng data o mga closed system, at sa gayon ang mga tao ay nakabalik sa mga gusto ng mga spreadsheet at PowerPoints upang maipasa ang impormasyon sa lugar. Ngunit mayroong isang kawili-wiling bagay na naganap kamakailan, sa aking isip, at iyon ay ang mga aparatong mobile at internet sa pangkalahatang gawain sa ideya na ang mga bagay ay maaaring maging mas mahusay. At higit sa lahat sa espasyo ng consumer. At ito ay isang kagiliw-giliw na bagay na araw-araw na buhay na nagsimula kaming magkaroon ng mga bagay tulad ng internet banking. Hindi namin kailangang pumunta sa isang aktwal na bangko upang makipag-ugnay sa kanila, magagawa namin ito sa pamamagitan ng telepono. Orihinal na clunky ngunit pagkatapos ay dumating ang internet at mayroon kaming isang website. Alam mo, at kung gaano karaming beses ka nang napunta sa iyong bangko kani-kanina lamang? Talagang hindi ako, nagkaroon ako ng pag-uusap tungkol sa iba pang araw, at talagang hindi ko matandaan ang huling oras na nagpunta ako sa aking bangko, na kung saan ay lubos akong nabigla ng, naisip kong dapat kong maalala ito, ngunit ito ay napakahaba nakaraan hindi ko talaga maalala kung saan ako nagpunta doon. At sa gayon mayroon kaming mga gadget na ito sa aming mga kamay sa anyo ng mga mobiles at telepono, tablet at laptop, mayroon kaming mga network at pag-access sa mga tool at system, at ang puwang ng mamimili na natutunan namin na ang mga bagay ay maaaring maging mas mahusay, ngunit dahil ng mabilis na pagbabago sa puwang ng mamimili na higit na nakakapagod at pagbabago ng glacial sa loob ng negosyo at mga kapaligiran, hindi namin palaging kinuha ang pagbabagong iyon sa pang-araw-araw na buhay sa pagtatrabaho.

At gustung-gusto ko ang masayang poking sa katotohanan na hindi ka mabubuhay ng data ng stream sa hardcopy. Sa imaheng ito dito mayroong isang taong nakaupo na naghahanap ng ilang analytics na ginanap, at mayroong isang magandang graph na ginawa ng isang tao na marahil ay binayaran ng maraming pera bilang isang istatistika o isang artista, at sila ay nakaupo doon na nagsisikap na gawin analytics sa isang hardcopy at poking dito. Ngunit narito ang nakakatakot na bagay para sa akin: Ang mga taong ito sa silid ng pagpupulong na ito, halimbawa, at gagamitin ko ito bilang isang halimbawa, nakikipag-ugnay sila sa data na pangkasaysayan. At ito ay bilang matanda mula kung kailan ginawa ang bagay na iyon at pagkatapos ay naka-print, kaya marahil ito ay isang linggong ulat. Ngayon sila ay gumagawa ng mga pagpapasya sa hindi gaanong masamang data ngunit ang mga lumang data, na palaging walang masamang data. Nagpapasya sila ngayon batay sa isang bagay na makasaysayan, na kung saan ay isang masamang lugar na dapat mangyari. Pinamamahalaang namin upang palitan ang hardcopy na iyon ng mga gusto ng mga tablet at telepono dahil mabilis kaming nagtrabaho sa espasyo ng consumer, at ngayon namin ito nagtrabaho sa puwang ng enterprise, na ang tunay na oras ay mga pananaw ay tunay na halaga ng oras.

At kami ay nakakakuha ng mas mahusay at mas mahusay sa na. At dinadala ako sa punto na itinaas ni Robin nang mas maaga, iyon ang konsepto ng scientist data ng mamamayan at ang drive ng konseptong ito. Para sa akin, ang isang mamamayang data scientist ay mga regular na tao lamang na may tamang mga kasangkapan at impormasyon sa mga gusto ng isang iPad. Hindi nila kailangang gawin ang mga matematika, hindi nila kailangang malaman ang mga algorithm, hindi nila kailangang malaman kung paano ilapat ang mga algorithm at pamamahala ng data, kailangan lang nilang malaman kung paano gamitin ang interface. At ibalik ako sa aking pagpapakilala at ang konsepto ng sanggol na nakaupo roon kasama ang isang iPad kumpara sa isang magasin, kumpara sa isang iPad. Ang bata ay maaaring napakabilis, matalinong malaman kung paano gamitin ang interface ng isang iPad upang sumisid sa impormasyon at makipag-ugnay dito, kahit na maaaring isang laro o streaming media o isang video. Ngunit hindi ito makakakuha ng parehong tugon o pakikipag-ugnay mula sa isang magazine bar at kumikislap na pahina pagkatapos ng pahina, na hindi masyadong nakakaengganyo, lalo na kung ikaw ay isang sanggol na lumaki sa mga iPads. Hindi nakakagulat, ang mga tao ay maaaring tumingin at matuto nang mabilis kung paano magmaneho ng mga tool at mga bagay na kung bibigyan lang natin sila, at kung bibigyan natin sila ng isang interface tulad ng mga mobile device at partikular na mga tablet at smartphone na may sapat na mga screen, at lalo na kung maaari kang makipag-ugnay ang mga ito sa touch, na may mga paggalaw ng daliri, lahat ng bigla mong makuha ang konsepto na ito ng isang mamamayan ng siyentipiko ng data.

Isang tao na maaaring mag-aplay ng agham ng data na may tamang mga tool, ngunit nang hindi talaga kailangang malaman kung paano ito gagawin. At sa aking isipan ay marami ito, tulad ng sinabi ko, ay hinimok ng impluwensya ng mamimili, na lumipat at nagbago sa demand at enterprise. Ang isang pares ng talagang mabilis na mga halimbawa. Kami, marami sa atin ang magsisimulang gumawa ng mga bagay sa aming mga blog at website, tulad ng ilagay sa maliit na mga ad o pagtingin sa pagsubaybay at paggalaw, ginamit namin ang mga tool tulad ng Google Analytics at kami ay nagising sa katotohanan na sa aming mga blog at maliit na website, maaari naming ilagay ang maliit na piraso ng code doon at bibigyan kami ng Google ng mga real-time na mga pananaw sa kung sino ang bumibisita sa website, kailan at saan at paano. At sa totoong oras maaari naming makita ang mga tao na tumama sa website, dumaan sa mga pahina at mawala. At medyo nakakagulat. Gustung-gusto ko pa rin ang paggawa nito, kapag sinubukan kong ipaliwanag ang real-time na analytics sa mga taong pinapabayaan ko ito upang ipakita lamang sa kanila ang isang website na naka-plug ang Google Analytics, at aktwal na nakikita ang live na pakikipag-ugnayan sa mga tao na pumapasok sa mga website at tanungin sila, "Isipin kung mayroon kang mga uri ng pananaw sa iyong negosyo sa real time. "

Kumuha ng isang halimbawa ng tingi, at marahil isang parmasyutiko, sa palagay ko ay tinatawag mo itong isang tindahan ng gamot sa Amerika, isang parmasya kung saan ka naglalakad at bumili ng lahat mula sa mga tablet ng sakit ng ulo hanggang sa sun cream at mga sumbrero. Sinusubukang patakbuhin ang samahan na walang impormasyon sa real-time ay isang nakakatakot na konsepto ngayon alam natin kung ano ang nalalaman natin. Halimbawa, maaari mong masukat ang trapiko sa paa, maaari kang maglagay ng mga aparato sa paligid ng tindahan na may isang nakangiting mukha sa isang gilid ng screen dahil masaya ka, at isang hindi maligayang pula sa kanang kanan at ilang magkakaibang lilim sa gitna. At mayroong isang platform na tinatawag na "Maligaya o Hindi" sa mga araw na ito, kung saan lumalakad ka sa isang shop at maaari kang mag-bang ng isang maligayang mukha o isang malungkot na mukha, depende sa iyong live na feedback sa kostumer. At maaari itong maging interactive sa totoong oras. Maaari kang makakuha ng live na presyo na hinihimok ng demand. Kung maraming mga tao doon, maaari mong itaboy nang kaunti ang mga presyo, at magagawa mo ang pagkakaroon ng stock at sabihin sa mga tao, halimbawa - ang mga airline, halimbawa, sasabihin sa mga tao kung gaano karaming mga upuan ang magagamit na ngayon sa website kapag ikaw muling pag-book ng flight, hindi ka lamang random na mag-dial in at umaasa na maaari mong i-up at makakuha ng flight. Live na data ng HR, maaari mong sabihin kung ang mga tao ay nag-i-orasan at nag-orasan. Ang pagkuha, kung nakakuha ka at nakakuha ka ng live na data, magagawa mo ang mga bagay tulad ng paghihintay ng isang oras at bakod laban sa presyo ng dolyar ng US upang bumili ng iyong susunod na pagkarga ng stock at magkaroon ng isang trak ng mga bagay na nakabukas.

Kapag ipinakita ko sa mga tao ang Google Analytics at isinalin ko ang uri ng anekdota, sa sandaling ito ng Eureka, ang sandaling ito "a-ha!", Ang lightbulb na ito ay napunta sa kanilang isip tulad ng, "Hmm, nakikita ko ang maraming mga lugar kung saan magagawa ko iyon . Kung mayroon lamang akong mga tool at kung mayroon lamang akong access sa kaalamang iyon. ”At nakikita natin ito ngayon sa social media. Sinuman na isang masigasig na gumagamit ng social media maliban sa pagpapakita lamang ng mga larawan ng kanilang agahan, ay may posibilidad na tingnan kung gaano karaming kagustuhan ang nakukuha nila at kung gaano karaming trapiko ang nakukuha nila at kung gaano karaming mga kaibigan ang kanilang nakuha, at ginagawa nila iyon sa kagaya ng, sabihin, ang Twitter bilang isang tool sa analytics. Maaari kang pumunta sa Twitter.com upang magamit ang tool, ngunit nag-type ka sa Google Twitter Analytics dot com, o mag-click sa tuktok na kanang pindutan at hilahin ang menu at gawin ito, nakakakuha ka ng mga magagandang, live na mga grapiko na nagsasabi sa iyo kung ilan mga tweet na ginagawa mo ang iyong sarili at kung gaano karaming mga pakikipag-ugnay sa kanila. At mga real-time na analytics lamang sa iyong personal na social media. Isipin kung mayroon kaming mga kagustuhan ng Google Analytics at Facebook at LinkedIn at Twitter, ang mga istatistika ng eBay ay darating sa iyo, ngunit sa iyong kapaligiran sa trabaho.

Ngayon nakuha namin ang live na uri ng web at mobile sa aming mga daliri, ito ay nagiging isang konsepto ng kuryente. At sa gayon ay nagdudulot sa akin ng aking konklusyon, at iyon ay palaging nasumpungan ko na ang mga organisasyon na nagamit ang mga kasangkapan at teknolohiya nang maaga, nakakakuha sila ng gaanong makabuluhang kalamangan sa kanilang mga kakumpitensya na maaaring hindi man lang nahuli. At nakikita namin na ngayon ay may salungatan ng siyentipiko ng data ng mamamayan. Kung maaari nating kunin ang mga tao na may mga kasanayan, ang kaalaman na inupahan namin ang mga ito, at maaari nating bigyan sila ng tamang mga tool, lalo na ang kakayahang makita ang data ng real-time at tuklasin ang data at malaman kung saan ito nang hindi naglalakad sa paligid ng mga cubicle at magtanong nang malakas, kinakailangang pumunta at tumayo sa mas cool na tubig upang gumawa ng ilang mga comparative analytics sa mga tao o pumunta at tanungin ang pagtanggap kung nasaan ang index. Kung magagawa nila iyon sa kanilang mga daliri at maaari nilang dalhin ito sa kanilang mga pagpupulong sa kanila at umupo sa isang boardroom flicking sa pamamagitan ng mga screen sa real time kaysa sa hardcopy, lahat ng biglaang binigyan tayo ng kapangyarihan ng aming mga tauhan na hindi kailangan maging aktwal data ng mga siyentipiko, ngunit upang aktwal na gumamit ng agham ng data at magdala ng mga kamangha-manghang mga resulta para sa mga organisasyon. At sa palagay ko ang tipping point na talagang naipasa namin ngayon kung saan ang consumer ay hinihimok sa negosyo, ang hamon ay kung paano namin ibibigay ang negosyong iyon, at iyon ang tema na nahuhulaan ko sa talakayan ngayon. At kasama nito, ibabalot ko ang aking piraso at ibigay upang marinig kung paano natin malulutas iyon. David, sa iyo.

David Sweenor: Sige, maraming salamat sa iyo guys, at salamat Robin. Alam mo, Robin, sumasang-ayon ako sa iyong orihinal na pagtatasa. Ang proseso ng analytic, ito ay hindi naiiba talaga kaysa sa pag-unlad ng software. Sa palagay ko ang hamon sa loob ng isang organisasyon ay talagang, alam mo, marahil ang mga bagay ay hindi mahusay na tinukoy, marahil mayroong isang exploratory na bahagi nito, at isang malikhaing sangkap dito. At alam ni Dez, sumasang-ayon ako sa iyo, maraming muling pagsasaayos ng gulong, at alam mo, walang isang organisasyon na pinapasukan ko ngayon, tanong mo, mabuti, bakit mo ito ginagawa? Bakit nagpapatakbo ang negosyo sa ganitong paraan? At madaling tanungin, at maraming beses kung nasa loob ka ng isang samahan, mahirap baguhin. Gustung-gusto ko ang pagkakatulad, ang consumerization ng mga bagay. At kaya hindi na kapag pumunta ako sa paliparan at nais na baguhin ang aking upuan - ginagawa ko ito sa aking cellphone. Hindi ko kailangang pumunta sa ahente sa booth, at panoorin na ang uri ng ahente ay nag-type ng isang bagay sa isang monochrome monitor sa loob ng 15 minuto upang mabago ang aking takdang-upuan. Mas gusto ko lang gawin ito sa aking telepono, at sa gayon ito ay isang kawili-wiling pag-unlad.

Ngayon, mag-uusap kami nang kaunti tungkol sa kolektibong katalinuhan. Para sa mga hindi nakakaalam, ang Statistica ay isang nangungunang gilid na platform ng analytics, na nasa loob ng higit sa 30 taon. Kung titingnan mo ang alinman sa mga pahayagan sa labas ng industriya ng analyst, palaging lumalabas ito sa tuktok bilang isa sa pinaka madaling maunawaan at madaling gamitin na advanced na pakete ng software ng analytics. Kaya ginugol namin ang nakalipas na ilang taon na nagtatrabaho sa isang konsepto na tinatawag na kolektibong intelihente, at dinadala namin ito sa susunod na antas. Nais kong simulan ang pag-uusap na ito: kung paano magawa ang trabaho sa iyong samahan?

At mayroong dalawang mga imahe dito. Ang isa sa kaliwa ay isang imahe mula 1960, at hindi ko sinimulan ang aking karera noong 1960s, ngunit ang imahe sa kanan ay - iyon ang pabrika ng semiconductor kung saan nagsimula akong magtrabaho. At nagtatrabaho ako sa itim na gusali, itim na rooftop up sa itaas na kaliwa. Ngunit gumawa sila ng mga bagay na semiconductor. Ito ay isang kamakailang larawan mula sa Mga Larawan sa Google. Ngunit kung bumalik ka sa imahe ng 1960 sa kaliwa, napaka-kawili-wili. Mayroon kang mga taong ito na nakaupo sa isang linya, at ginagawa nila, alam mo, ang mga integrated circuit at semiconductors. Ngunit mayroong isang standardisasyon, mayroong isang karaniwang paraan upang gawin ang mga bagay, at mayroong maayos na proseso. Alam mo, marahil dahil ang mga taong ito ay lahat ay nakaupo sa isang bukas na kapaligiran, marahil mayroong ilang pakikipagtulungan. Sa palagay ko nawala kami ng kaunti sa loob ng kaalaman sa paggawa.

Kapag nakaupo ako sa gusaling iyon sa itaas na kaliwa, kung nais kong makipagtulungan sa isang tao, hindi ito bukas. Mayroong mga tanggapan na ito, marahil ang ilan sa mga koponan ay malayo, o marahil ay kailangan kong maglakbay sa buong campus na ito; ito ay isang 25 minutong lakad, at kailangan kong pumunta makipag-usap sa isang tao sa gusali sa malayong kanan. Sa palagay ko nawalan tayo ng isang bagay. At sa gayon, alam mo, nagkaroon ako ng parehong pag-iisip na, bakit ang mga tao - kung gaano karaming mga tao ang patuloy na muling pinapanatili ang gulong sa loob ng iyong samahan? Sa palagay ko, alam mo, ang mga organisasyon sa kabuuan ay gumawa ng isang mahusay na trabaho noong 1990 at 2000s kasama ang CRM at data warehousing, at sa isang lawak ng BI. Para sa ilang kadahilanan, ang analytics ay medyo naka-haba ng kaunti. Mayroong makabuluhang pamumuhunan sa warehousing ng data, at pag-standard, at pag-normalize ng iyong data, at lahat ng ito, at CRM, ngunit ang mga analytics ay nahuli sa ilang kadahilanan. At nagtataka ako kung bakit. Marahil mayroong isang malikhain - marahil ang iyong proseso ay hindi mahusay na tinukoy, marahil hindi mo alam kung anong desisyon o lever na sinusubukan mong i-on, alam mo, sa iyong negosyo na baguhin ang mga bagay. Kapag nagpupunta tayo sa mga samahan ngayon, maraming tao ang mano-mano ang gumagawa ng mga bagay sa mano-mano mga spreadsheet.

At alam mo, tumingin ako sa isang stat kaninang umaga, sa palagay ko sinabi nito na 80, 90 porsyento ng mga spreadsheet ay may mga pagkakamali, at ang ilan sa mga ito ay maaaring maging makabuluhan. Tulad ng isa sa Whale, kung saan nawalan ng bilyun-bilyon at bilyun-bilyong dolyar ang JPMorgan Chase dahil sa mga pagkakamali sa spreadsheet. Kaya mayroon akong premise na sa palagay ko, kailangang may mas mahusay na paraan upang magawa ang mga bagay. At tulad ng nabanggit namin, mayroon kaming mga siyentipiko ng data. Ang mga taong ito ay mahal, at mahirap silang hanapin. At kung minsan sila ay medyo isang kakaibang pato. Ngunit sa palagay ko, alam mo, kung kailangan kong sumulat kung ano ang isang siyentipiko ng data, marahil ay isang tao na nakakaintindi ng data. Sa palagay ko ito ay isang taong nakakaintindi sa matematika, isang taong nakakaintindi sa problema. At talagang, isang tao na maaaring makipag-usap sa mga kinalabasan. At kung ikaw ay isang scientist ng data, maswerte ka ngayon sa mga araw na ito, dahil marahil ay nadoble ang iyong suweldo sa mga nakaraang taon.

Ngunit ang katotohanan ay sinabihan, maraming mga organisasyon, wala silang mga data na siyentipiko, ngunit ang iyong samahan ay may matalinong tao. Mayroon kang isang samahan, marami kang matalinong tao, at gumagamit sila ng mga spreadsheet. Alam mo, ang mga istatistika at matematika ay hindi ang kanilang pangunahing trabaho, ngunit gumagamit sila ng data upang maihatid ang pasulong sa negosyo. Talagang, ang hamon na tinutugunan namin ay, paano ka makukuha, kung masuwerteng magkaroon ka ng isang siyentipiko ng data o isang istatistika o dalawa, paano mo ito madadala, at paano mo mapapabuti ang pakikipagtulungan sa pagitan ng mga tao at ng ibang mga indibidwal sa loob ng iyong samahan? Kung titingnan natin ang uri ng kung paano nakaayos ang aming samahan, magsisimula ako, at pupunta ako mula sa kanan papunta sa kaliwa. At alam kong pabalik-balik ito, ngunit mayroon kaming linya na ito ng mga gumagamit ng negosyo.

Ito ang karamihan sa iyong populasyon ng manggagawa sa kaalaman, at para sa mga taong ito, kailangan mong mag-embed ng mga analytics sa iyong linya ng mga aplikasyon ng negosyo. Marahil nakakakita sila ng analytic output sa isang call center screen o isang bagay, at sinasabi nito sa kanila ang susunod na pinakamahusay na alok na ibigay sa isang customer. Marahil ito ay isang consumer o supplier sa isang web portal, at agad itong binigyan sila ng kredito, o mga bagay na katulad nito. Ngunit ang ideya ay, naubos nila ang analytics. Kung pupunta tayo sa gitna, ito ang mga trabahong may kaalaman. Ito ang mga tao na gumagawa ng mga bagay sa mga spreadsheet ngayon, ngunit ang mga spreadsheet ay madaling kapitan ng pagkakamali at sa ilang mga oras nauubusan sila ng gas. Ang mga siyentipiko ng data ng mamamayan na ito, tulad ng pagtawag namin sa kanila, alam mo, kung ano ang sinusubukan naming gawin para sa kanila ay talagang pinataas ang antas ng automation.

At naririnig mo sa pamamagitan ng analytics na 80 hanggang 90 porsyento ng trabaho ay nasa piraso ng prep prep ng data, at hindi ito ang aktwal na matematika, ngunit ito ang prep data. Sinusubukan naming i-automate iyon, kung gagawin mo iyon, at mayroon kaming mga wizard at template at magagamit muli na mga bagay, at hindi mo na kailangang magkaroon ng kaalaman sa pinagbabatayan na imprastruktura sa loob ng iyong kapaligiran. At pagkatapos kung titingnan namin sa kaliwang kaliwa, mayroon kaming mga siyentipiko na data. At tulad ng nabanggit ko, ang mga ito ay sa maikling supply. At kung ano ang sinusubukan naming gawin upang gawing mas produktibo ang mga ito, ay pinahihintulutan silang lumikha ng mga bagay na maaaring gawin ng mga datos na mamamayan ng data. Isipin ito tulad ng isang bloke ng Lego, kaya ang mga data na siyentipiko ay maaaring lumikha ng isang magagamit muli asset na maaaring magamit ng isang data sa siyentipiko ng mamamayan. Itayo ito nang isang beses, kaya hindi namin kailangang panatilihing muling maayos ang gulong.

At pagkatapos din, ang mga taong ito ay maaaring nag-aalala tungkol sa kung makakagawa tayo ng mga bagay sa database, at pag-gamit ng mga umiiral na mga pamumuhunan sa teknolohiya na ginawa ng iyong kumpanya. Alam mo, hindi makatuwiran sa araw na ito at edad upang mabalot ang data papunta sa buong mundo. Kaya kung titingnan natin ang Statistica, tulad ng nabanggit ko, ito ay isang platform na matagal nang matagal. At ito ay isang napaka-makabagong produkto. Ang pagsasama ng data, wala pa isang mapagkukunan ng data na hindi namin ma-access. Mayroon kaming lahat ng mga pagtuklas ng data at paggunita ng mga bagay na nais mong asahan; magagawa natin ito sa totoong oras. At marahil mayroon ito - sa palagay ko mayroong higit sa 16, 000 mga pag-andar ng analytical sa loob ng tool ng software, kaya mas maraming matematika kaysa sa dati kong ginamit o maintindihan, ngunit narito kung kailangan mo ito.

Mayroon kaming kakayahang pagsamahin ang parehong mga panuntunan sa negosyo at analytic workflows upang talagang makagawa ng isang desisyon sa negosyo. Malayo ka lang, narito ang isang algorithm, narito ang isang daloy ng trabaho, ngunit mayroon kang mga panuntunan sa negosyo na lagi mong dapat pakikitungo. Ligtas kami sa pamamahala. Kami ay ginagamit sa maraming mga kliyente sa parmasyutiko, na ang FDA ay tiwala sa amin. Alam mo, patunay lamang sa puding na mayroon tayong mga kontrol at kakayahan sa pag-audit na tatanggapin ng mga ito. At pagkatapos ay sa wakas, alam mo, kami ay bukas at nababaluktot at extensible, kaya kailangan mong lumikha ng isang platform na iyon, nais mong maging produktibo ang iyong data na siyentipiko, nais mong maging produktibo ang iyong data ng mamamayan ng mamamayan, nais mong maging produktibo upang maibahagi ang mga analytic output na ito sa mga manggagawa sa loob ng iyong samahan.

Kung titingnan natin ito, narito ang isang halimbawa ng ilan sa mga visualization. Ngunit na maipamahagi ang iyong analytic output sa mga gumagamit ng linya ng negosyo, kaya ang unang halimbawa sa kaliwa, iyon ang isang diagram ng analyt ng network. At marahil ikaw ay isang investigator ng pandaraya, at hindi mo alam kung paano nagawa ang mga koneksyon na ito, at ang mga ito ay maaaring maging mga tao, ang mga ito ay maaaring maging mga nilalang, maaaring maging mga kontrata, kahit ano talaga. Ngunit maaari mong manipulahin ito gamit ang iyong mouse, at makipag-ugnay sa ito upang maunawaan talaga - kung ikaw ay isang investigator ng pandaraya, upang maunawaan ang isang nauna nang listahan ng kung sino ang dapat mag-imbestiga, tama, dahil hindi ka makakausap sa lahat, kaya mayroon kang bigyang importansya.

Kung titingnan namin ang imahe sa kanang bahagi doon, para sa isang mahuhulaan na dashboard ng pagpapanatili, ito ay isang talagang kawili-wiling problema. Marahil ikaw ay may-ari ng isang paliparan, at mayroon kang mga scanner ng katawan na naroon. Ang mga scanner ng katawan na ito, kung pupunta ka sa isang paliparan, mayroong ilang mga sangkap doon na mayroong halos isang siyam na buwan na istante ng buhay. At ang mga bagay na ito ay talagang, mahal. Kung mayroon akong maramihang mga punto ng pagpasok, maraming mga scanner sa aking paliparan, bilang isa na nais kong siguraduhin na naaangkop ako ng mga kawani sa bawat isa sa mga pintuang-bayan, at para sa mga bahagi na nasa scanner, hindi ko nais na mag-order din sa kanila. maaga, at nais kong magkaroon sila bago ito masira. Mayroon kaming kakayahan, marahil kung nagmamay-ari ka ng isang paliparan, upang mahulaan kung kailan masisira ang mga bagay na ito at mahuhulaan ang mga antas ng kawani.

Kung titingnan namin ang ibabang kanan, ito ay kung ikaw ay nasa isang kapaligiran sa pagmamanupaktura, ito ay isang representasyong grapiko lamang ng daloy ng pagmamanupaktura. At medyo mahirap makita, ngunit mayroong pula at berdeng mga ilaw sa trapiko sa iba't ibang mga sektor na proseso, at kaya kung ako ay isang inhinyero, mayroong napaka sopistikadong matematika na pumapasok doon, ngunit maaari kong mag-drill down sa partikular na sektor ng proseso at tingnan ang ang mga parameter, at pag-input na, marahil ay nagdudulot na hindi mapigilan. Kung titingnan natin ang ating scientist data data, ang aming layunin ay talagang gawing madali para sa scientist data ng mamamayan. Mayroon kaming mga wizards at template, at isang bagay na sa palagay ko ay talagang kawili-wili, mayroon ba tayong automated data na tseke ng kalusugan ng data. At talagang kung ano ang ginagawa nito, nakabuo ito ng mga smarts.

Nabanggit ko ang data prep - kinakailangan ng isang makabuluhang halaga ng oras, iyon ay pareho sa pagsasama-sama ng data at ihahanda ito. Ngunit ipagpalagay natin na mayroon ako ng aking data, maaari kong patakbuhin ito sa pamamagitan ng node ng health check ng data, at sinusuri nito ang invariance, at sparseness, at outliers, at lahat ng mga bagay na ito, pinupunan nito ang mga nawawalang halaga at marami itong matematika na hindi ko Hindi ko maintindihan, kaya kong matanggap ang alinman sa mga default, o kung ako ay mas matalino, maaari kong baguhin ito. Ngunit ang punto ay, nais naming i-automate ang proseso na iyon. Ang bagay na ito ay ginagawa tungkol sa 15 iba't ibang mga tseke at kinalabasan sa isang nalinis na hanay ng data. Ang ginagawa namin ay ginagawang mas madali para sa mga tao na lumikha ng mga workflows na ito.

Ito ay kung saan pinag-uusapan natin ang pakikipagtulungan sa pagitan ng data ng mga siyentipiko at siyentipiko ng data ng mamamayan. Kung titingnan namin ang mga imaheng ito sa kanan, nakikita namin ang data prep workflow na ito. At marahil ito ay napaka sopistikado, marahil ito ay lihim na sarsa ng iyong kumpanya, hindi ko alam, ngunit alam namin na ang isang tao sa loob ng iyong samahan ay maaaring ma-access ang isa o higit pa sa mga data na silos na mayroon kami. Kailangan namin ng isang paraan upang, numero uno, kunin ang mga ito at tahiin ang mga ito, at bilang dalawa, marahil mayroong espesyal na pagproseso na nais naming gawin, na lampas sa aming pagsusuri sa kalusugan ng data, at iyon ang lihim na sarsa ng iyong kumpanya. Maaari akong lumikha ng daloy ng trabaho na ito sa loob ng aming samahan, at gumuho ito bilang isang node. Nakita mo ang arrow na tumuturo, ito ay isang node lamang, at maaari kaming magkaroon ng isang daang ng mga bagay na ito sa loob ng isang samahan. Ang ideya ay, mayroon kaming mga tao na nakakaalam ng isang bagay tungkol sa isang tiyak na puwang, maaari silang lumikha ng isang daloy ng trabaho, at ang ibang tao ay maaaring magamit muli. Sinusubukan naming i-minimize ang muling paghihinala ng gulong.

At maaari naming gawin ang parehong bagay sa mga analytic na modelong workflows. Sa kasong ito sa kanan, ang daloy ng trabaho na ito, marahil mayroong 15 iba't ibang mga algorithm, at nais kong pumili ng pinakamahusay para sa gawain. At hindi ko kailangang maunawaan bilang isang scientist data data ng mamamayan kung ano ang nangyayari sa spider web gulo doon, ngunit bumagsak lamang ito sa isang node, at marahil na ang node ay nagsasabing lamang, "kalkulahin ang marka ng peligro ng kredito." "Kalkulahin ang pagkakataon ng impeksyon sa kirurhiko sa site, "ano ang mayroon ka. "Kalkulahin ang posibilidad ng isang bagay na isang mapanlinlang na transaksyon." Bilang isang siyentipiko ng data ng mamamayan, maaari kong gamitin ang napaka sopistikadong matematika na binuo ng ibang tao, marahil ang isa sa mga data na siyentipiko na ito ay binuo sa loob ng aking samahan.

Mula sa isang pananaw sa agham ng data, alam mo, nakausap ko ang mga siyentipiko ng data na mahilig magsulat ng code, at nakausap ko ang mga siyentipiko ng data na ayaw sumulat ng code. At mabuti iyon, kaya mayroon kaming isang napaka-visual, graphic na interface ng gumagamit. Maaari naming kunin ang aming data, maaari naming gawin ang aming awtomatikong pagsusuri sa kalusugan ng data, at baka gusto kong sumulat ng code. Gusto ko si Python, gusto ko ang R, ngunit ang ideya ay, ang mga siyentipikong datos na ito, ang mga ito ay sa maikling supply, at gusto nila ang code sa isang partikular na wika. Wala kaming partikular na kagustuhan para sa kung anong wika ang nais mong code in, kaya kung nais mong gawin R, gawin R; kung nais mong gawin ang Python, gawin ang Python. Magaling yan. Kung nais mong sumabog ang iyong analytics sa Azure, sumabog ang iyong analytics sa ulap. At kaya ang layunin dito ay talagang mag-alok ng kakayahang umangkop at mga pagpipilian upang gawin ang iyong mga siyentipiko ng data bilang produktibo hangga't maaari.

Ngayon ang mga siyentipiko ng data, medyo matalino silang tao, ngunit marahil hindi sila espesyalista sa lahat, at marahil mayroong ilang mga puwang sa maaari nilang gawin. At kung titingnan mo sa loob ng industriya, maraming iba't ibang mga merkado ng analitiko na mayroon doon. Ito ay isang halimbawa ng, marahil kailangan kong gawin ang pagkilala sa imahe at wala akong kasanayan na iyon, marahil ay lumabas ako sa Algorithmia at kumuha ng algorithm ng pagkilala sa imahe. Siguro lumabas ako sa Apervita at kumuha ng isang napaka espesyal na algorithm sa pangangalaga ng kalusugan. Siguro nais kong gumamit ng isang bagay sa aklatan ng pag-aaral ng Azure machine. Marahil ay nais kong gumamit ng isang bagay sa katutubong platform ng Statistica.

Muli, ang ideya dito ay nais naming magamit ang pandaigdigang komunidad ng analytics. Dahil hindi ka magkakaroon ng lahat ng mga kasanayan sa loob ng iyong apat na pader, kaya paano tayo makalikha ng software - at ito ang ginagawa namin - na nagpapahintulot sa iyong mga siyentipiko ng data na gumamit ng mga algorithm mula sa iba't ibang mga merkado. Kami ay ginagawa ito sa R ​​at Python sa loob ng mahabang panahon, ngunit ito ay nagpapalawak na sa mga app marketplaces na mayroon doon. At ang parehong nakikita mo dito sa tuktok ng ito, gumagamit kami ng H2O sa Spark, kaya mayroong maraming mga analytic algorithm doon. Hindi mo kailangang tumuon sa paglikha ng mga ito mula sa simula, muling gamitin natin ito na naninirahan sa bukas na mapagkukunan na komunidad, at nais namin na ang mga taong ito ay maging produktibo hangga't maaari.

Ang susunod na hakbang, matapos na makuha namin ang aming data ng mga mamamayan ng siyentipiko at aming data na siyentipiko, kung paano mo isusulong at ipinamahagi mo ang mga pinakamahusay na kasanayan? Mayroon kaming teknolohiya sa loob ng aming software na nagbibigay-daan sa iyo upang ipamahagi ang analytics kahit saan. At ito ay higit pa sa isang view ng pamamahala ng modelo, ngunit hindi na ako nakagapos ng apat na pader o isang tiyak na pag-install sa loob ng Tulsa o Taiwan o California, o kung ano ang mayroon ka. Ito ay isang pandaigdigang platform, at marami kami, maraming mga customer na na-deploy sa paggamit nito ng maraming mga site.

At talagang, ang mga pangunahing bagay ay, kung gumawa ka ng isang bagay sa Taiwan at nais mong kopyahin ito sa Brazil, mahusay iyon. Pumunta doon, kunin ang mga magagamit na template, kunin ang mga workflows na gusto mo. Sinusubukan nitong lumikha ng mga pamantayang iyon, at ang karaniwang paraan ng paggawa ng mga bagay, kaya hindi namin ginagawa ang mga bagay na ganap na naiiba sa lahat ng dako. At ang iba pang pangunahing sangkap ng ito, ay talagang nais nating dalhin ang matematika kung saan nakatira ang data. Hindi mo kailangang i-shuffle ang data sa pagitan, alam mo, California at Tulsa at Taiwan at Brazil. Mayroon kaming teknolohiya na nagpapahintulot sa amin na dalhin ang matematika sa data, at magkakaroon kami ng isa pang Hot Technology webcast sa paksang iyon.

Ngunit tinawag namin ang arkitektura na ito, at narito ang isang sneak peek, Native Distributed Analytics Architecture. Ang pangunahing ideya sa likod nito ay mayroon kaming isang platform, Statistica, at mai-export ko ang isang analytic workflow bilang isang atom. At maaari kong gawin ang isang modelo, o isang buong daloy ng trabaho, kaya hindi mahalaga. Ngunit maaari kong likhain ito, at i-export ito sa isang wika na naaangkop sa target na platform. Sa kaliwang bahagi nito, maraming tao ang gumawa nito, ngunit nagmarka sila sa mapagkukunan ng sistema. Buti na lang, magagawa namin ang pagmamarka at magagawa namin ang pagbuo ng modelo sa database, kaya kawili-wili iyon.

At pagkatapos ay sa kanang bahagi, mayroon kaming Boomi. Ito ay isang kasamang teknolohiya, nagtatrabaho kami sa lahat ng ito. Ngunit maaari din nating kunin ang mga workflows na ito, at mahalagang dalhin ito kahit saan sa mundo. Anumang bagay na mayroong isang IP address. At hindi ko kailangang magkaroon ng isang Statistica na naka-install sa publiko o pribadong ulap. Anumang bagay na maaaring magpatakbo ng isang JVM, maaari naming patakbuhin ang mga analytic workflows, data prep workflows, o mga modelo lamang sa alinman sa mga target na platform. Ito man ay nasa aking pampubliko o pribadong ulap, maging ito sa aking traktor, kotse, bahay, paliparan, aking internet ng mga bagay, mayroon kaming teknolohiya na nagbibigay-daan sa iyo upang dalhin ang mga daloy ng trabaho kahit saan sa mundo.

Suriin natin. Alam mo, mayroon kaming linya ng mga gumagamit ng negosyo, kaya ang mga taong ito, mayroon kaming teknolohiya na pinapayagan silang ubusin ang output sa isang format na komportable sila. Mayroon kaming mga siyentipiko ng mamamayan ng data, at kung ano ang sinusubukan naming gawin ay mapabuti ang pakikipagtulungan, gawin silang bahagi ng isang koponan, di ba? At kaya nais namin na ang mga tao ay tumigil sa muling pagbuo ng gulong. At mayroon kaming mga siyentipiko na data, maaaring magkaroon ng isang puwang ng kasanayan doon, ngunit maaari silang mag-code sa isang wikang nais nila, maaari silang pumunta sa mga merkado ng analytic at gumamit ng mga algorithm doon. At sa ganito, paano mo hindi maisip na ang lahat ay kamangha-mangha sa ito? Ito ay perpekto, ito ang ginagawa namin. Nagtatayo kami ng reusable workflows, nagbibigay kami ng mga tagubilin sa mga tao, binibigyan namin sila ng mga bloke ng Lego upang mabuo nila ang mga makapangyarihang kastilyo na ito at anumang nais nilang gawin. Upang mabuo ito, mayroon kaming isang platform na nagbibigay kapangyarihan sa linya ng mga gumagamit ng negosyo, siyentipiko ng data ng mamamayan, siyentipiko ng mga programmer data, mayroon kaming - maaari naming matugunan ang anumang uri ng kaso ng paggamit ng IoT edge, at pinagana namin ang paniwala ng kolektibong intelihensiya. Gamit iyon, sa palagay ko marahil ay buksan natin ito para sa mga katanungan.

Robin Bloor: Well okay. Sa palagay ko ang una - ang ibig kong sabihin, maging matapat, ang ibig kong sabihin ay nai-briefed ako ni Dell Statistica dati, at sa totoo lang talagang nagulat ako sa mga bagay na hindi ko alam na nagdala ka sa pagtatanghal . At kailangan kong sabihin na ang isang bagay, ito ay isang bagay na naging isang bugbear para sa akin sa loob ng pag-ampon ng analytics, iyon ba, alam mo, ang pagkuha ng mga tool ay hindi, alam mo? Mayroong isang kakila-kilabot na mga tool sa labas, mayroong bukas na mga tool ng mapagkukunan, at iba pa at iba pa, at mayroong iba't ibang, kung ano ang tatawagin ko, mga semi-platform. Ngunit sa palagay ko ang pagkakaiba mo, lalo akong napahanga sa ilan sa mga daloy ng trabaho.

Ngunit ang pagkakaiba ay parang nagbibigay ka ng pagtatapos. Ito ay tulad ng analytics ay isang sopistikadong proseso ng negosyo na nagsisimula sa pagkuha ng data at pagkatapos ay dumadaan ito sa isang buong serye ng mga hakbang, depende sa kung gaano kalakas ang data, at pagkatapos ay maaari itong mag-sangay sa isang buong serye ng iba't ibang mga pag-atake sa matematika sa data. At pagkatapos ay lumitaw ang mga resulta sa isang paraan o sa iba pa at ang mga kailangang maging aksyon. Mayroong isang napakalaking halaga ng analytics na natagpuan ko kung saan naganap ang maraming mahusay na gawain ngunit wala itong inilalagay. At mukhang mayroon kang isang kakila-kilabot na maraming kailangan. Hindi ko alam kung gaano kalawak ito, ngunit ito ay paraan na mas malawak kaysa sa inaasahan ko. Hindi ako kapani-paniwala na napahanga sa na.

Nais kong magkomento sa mga spreadsheet. May sinabi ka na, ngunit isa sa mga bagay na napansin ko, at napansin ko sa mga nakaraang taon, ngunit ito ay naging mas maliwanag pa, ay mayroong isang kakila-kilabot na mga spreadsheet na mga sistema ng anino at talagang naiisip ko ang spreadsheet, ang ibig kong sabihin, ito ay isang kamangha-manghang tool noong ipinakilala ito at naging kamangha-mangha mula pa sa maraming iba't ibang paraan, ngunit ito ay isang pangkalahatang tool, hindi talaga ito angkop para sa layunin. Tiyak na hindi ito napakahusay sa konteksto ng BI at sa palagay ko kakila-kilabot sa konteksto ng analytics. At naisip ko kung mayroon kang ilang puna na isusumite, sabihin natin, mga halimbawa kung saan, alam mo, ang Statistica ay sumabog, labis na paggamit ng spreadsheet, o anumang puna na nais mong gawin tungkol sa?

David Sweenor: Yeah Sa palagay ko, alam mo, maaari kang tumingin ng mga sikat na pagkakamali sa spreadsheet. Ang Google o anumang search engine na ginagamit mo ay babalik sa isang resulta ng mga resulta. Sa palagay ko, alam mo, papalitan namin ang mga spreadsheet. Hindi iyon ang aming hangarin, ngunit maraming mga organisasyon na pinupuntahan ko, mayroong isang pares ng mga ito ng mga wsheards ng spreadsheet o ninjas o anumang nais mong tawagan sila, ngunit mayroon silang mga napaka sopistikadong mga spreadsheet na ito at kailangan mong mag-isip, kung ano ang mangyayari kapag ang mga ito ang mga tao ay nanalo sa lotto at hindi sila bumalik? At kung ano ang sinusubukan naming gawin ay, alam namin na mayroong mga spreadsheet upang maari nating maipamamalas ang mga iyon, ngunit sa palagay ko kung ano ang sinusubukan naming gawin ay bumuo ng isang visual na representasyon ng iyong daloy ng trabaho upang maunawaan at maibahagi ito sa ibang mga tao . Ang mga spreadsheet ay medyo mahirap, medyo mahirap ibahagi. At sa sandaling ipasa mo ang iyong spreadsheet sa akin, binago ko ito, at ngayon wala na kaming pag-sync at nakakakuha kami ng iba't ibang mga sagot. Ang sinusubukan naming gawin ay maglagay ng ilang mga bantay sa paligid nito at gawing mas mahusay ang mga bagay. At ang mga spreadsheet ay talagang kahila-hilakbot sa pagsasama-sama ng maraming mga hanay ng data, alam mo? Nahulog sila doon. Ngunit hindi namin papalitan ang mga ito, pinapansin namin ang mga ito at mayroon kaming mga tao na nagsisimula nang mag-shift dahil kung mayroon kaming isang node na nagsasabing "kalkulahin ang peligro" iyon ang sinusubukan na gawin ng tao. Kaya't wala na ang mga iyon.

Robin Bloor: Oo, ibig sabihin, sasabihin ko na, alam mo, mula sa isa sa mga pananaw na tinitingnan ko ang mga bagay, sasabihin ko na ang mga spreadsheet ay mahusay para sa paglikha ng impormasyon. Kahit na sila ay mahusay para sa paglikha ng mga isla ng kaalaman, ngunit talagang masama sila sa pagbabahagi ng kaalaman. Wala silang mekanismo para gawin iyon, at kung magpasa ka ng isang spreadsheet sa isang tao, hindi tulad ng mababasa mo ito tulad ng isang artikulo na ipinaliwanag nang eksakto kung ano ang kanilang ginagawa. Wala lang doon. Sa palagay ko, alam mo, ang bagay na higit na humanga sa akin tungkol sa pagtatanghal at tungkol sa mga kakayahan ni Statistica, mukhang hindi mapaniniwalaan o kapani-paniwala na agnostiko. Ngunit nakuha nito ang thread na ito sa pamamagitan ng daloy ng trabaho. Narito ba ako sa pag-aakala na maaari mong tingnan ang isang end-to-end na daloy ng trabaho sa kabuuan, alam mo, mula sa pagkuha ng data sa lahat ng paraan hanggang sa paglalagay ng mga resulta sa mga partikular na aplikasyon ng BI o kahit na tumatakbo ang mga aplikasyon?

David Sweenor: Oo, talagang. At mayroon itong kakayahan na end-to-end at ginagamit ng ilang mga organisasyon na buo, at wala akong ilusyon na ginagawa ng anumang kumpanya ngayong araw ang lahat mula sa isang tindero. May halo kami. Ang ilang mga tao ay gumagamit ng Statistica para sa lahat at ginagamit ito ng ilang mga tao para sa mga modeling workflows, ginagamit ito ng ilang mga tao para sa mga work prepows ng data. Ang ilang mga tao ay gumagamit nito upang ipamahagi ang daan-daang mga ulat sa inhinyero sa mga inhinyero. At sa gayon mayroon kaming lahat sa pagitan. At ito ay talagang end-to-end at ito ay, alam mo, isang agnostic platform, na kung mayroong algorithm na nais mong gamitin sa R ​​o Python, Azure, Apervita, anuman, alam mo, gamitin ang mga iyon. Napakaganda, maging produktibo, gumamit ng alam mo, gumamit ng komportable ka at mayroon kaming mga mekanismo upang matiyak na ang mga ito ay kontrolado at maririnig at lahat ng uri ng mga bagay.

Robin Bloor: Lalo kong gusto ang aspeto na ito. Ibig kong sabihin, hindi ko alam kung maaari kang magsalita nang higit sa iyong sinabi sa yaman ng kung ano ang nasa labas. Ibig kong sabihin, tiningnan ko ito ngunit hindi ko ito tinitingnan sa isang komprehensibong paraan at tiyak na mayroong isang malawak na halaga ng mga aklatan ng Python sa aming mga aklatan ngunit mayroon ka bang maari mong maidagdag sa larawang iyon? Dahil sa palagay ko iyon ay isang napaka-kagiliw-giliw na bagay, alam mo, ang ideya na magkakaroon ka ng mga sangkap na mapagkakatiwalaan, dahil alam mo ang iba't ibang mga tao na lumikha ng mga ito at iba't ibang mga tao na gumagamit ng mga ito na maaari mong i-download. Alam mo, maaari mo bang mapayaman ang sinabi mo tungkol doon?

David Sweenor: Oo, sa palagay ko ang ilan sa mga palengke ng app, alam mo, ang mga merkado ng algorithm na nandoon. Halimbawa, alam mo, Dr. John Cromwell sa Unibersidad ng Iowa, siya ay binuo ng isang modelo na mahuhulaan, na ginagamit sa real time habang pinatatakbo tayo, ay magbibigay sa iyo ng marka kung makakakuha ka ng impeksyon sa kirurhiko site. At kung ang sapat na iskor na iyon ay kukuha sila ng interbensyon mismo sa operating room. Nakakaintriga. Kaya marahil ay may isa pang ospital na hindi gaanong kalaki. Buweno, ang Apervita ay isang merkado ng kalusugan ng app para sa analytics. Maaari ka ring makahanap ng isa sa maraming mga merkado ng app na ito, maaari kang makahanap ng isa at muling magamit ang mga ito, at ang transaksyon ay nasa pagitan mo at kung sino ang nagmamay-ari nito, ngunit maaari kang maghanap ng isa o maaari mong sabihin, "Narito kung ano ang kailangan ko. "Sa palagay ko ito ay gumagamit ng pandaigdigang pamayanan dahil lahat ay espesyalista sa mga araw na ito, at hindi mo alam ang lahat. Sa palagay ko ang R at Python ay isang bagay ngunit ang ideyang ito ng, "Nais kong gawin ang pagpapaandar na ito, maglagay ng isang spec sa labas ng isa sa mga lugar ng merkado ng app na ito at magkaroon ng isang tao na bumuo para sa iyo." At maaari nilang gawing pera ang, na napaka-kawili-wili at ibang-iba kaysa purong bukas na modelo ng mapagkukunan.

Robin Bloor: Sige. Anyway, ipapasa ko ang bola kay Dez. Nais mo bang sumisid, Dez?

Dez Blanchfield: Ganap at nais kong manatili sa isang spreadsheet na bagay para sa isang sandali lamang dahil sa palagay ko ay nakuha nito ang tamang gist ng maraming pinag -uusapan natin. At gumawa ka ng isang puna, Robin, tungkol sa paglipat mula sa uri ng mga lumang spreadsheet sa kanilang pisikal na form sa electronic form. Nagkaroon kami ng isang kagiliw-giliw na bagay na maganap kung saan, alam mo, kapag ang mga spreadsheet ay orihinal na isang bagay na sila ay mga sheet lamang ng papel na may mga hilera at mga haligi at mano-mano nais mong isulat ang mga bagay, pagkatapos ay gusto mo ng kapangyarihan at kalkulahin ang mga ito, alinman sa pamamagitan ng paggawa off ito sa tuktok ng iyong ulo o sa ilang iba pang aparato. Ngunit mayroon pa rin tayong pagkakataon na magkaroon ng mga pagkakamali sa mga pagkakamali sa pagkakasulat o dislexia, at ngayon ay pinalitan namin ito ng mga typo. Ang panganib ay sa mga spreadsheet ang profile ng peligro ay mas mabilis at mas malaki, ngunit sa palagay ko ang mga tool tulad ng Statistica ay baligtarin ang peligro ng peligro.

Madalas kong iguhit ang larawang ito sa isang whiteboard ng isang tao na stick stick sa tuktok, bilang isang tao, at pagkatapos ay isang koleksyon ng mga ito sa ilalim, sabihin natin, isipin ang sampu sa mga ito sa ilalim ng whiteboard na iyon, at gumuhit ako ng pyramid kung saan ang punto ng pyramid's sa iisang tao at paanan ng pyramid ay ang koleksyon ng mga tao. At ginagamit ko ito upang mailarawan ang ideya na kung ang isang tao sa tuktok ay may pagkalat ng isang spreadsheet ay nagkakamali at ibinabahagi ito sa sampung tao, at ngayon nakuha namin ang sampung kopya ng error. Maging maingat sa iyong mga macros at maging maingat sa iyong Visual Basic kung ikaw ay lilipat diyan. Dahil kapag nagtatayo kami ng mga elektronikong tool tulad ng mga spreadsheet ito ay napakalakas, ngunit malakas din ito sa isang mabuti at isang masamang paraan.

Sa palagay ko ang mga tool tulad ng Statistica ay nagdadala tungkol sa kakayahang maiiwasang ang profile na peligro at iyon ay maaari mo na ngayong makarating sa puntong nakuha mo ang maraming mga tool na magagamit sa indibidwal na tao at habang sila ay pumunta mula sa maraming mga tool sa tuktok ng ang piramide at pagkatapos ay hanggang sa pinakadulo kung saan ang punto ng pyramid na ngayon ay invertid ay ang aktwal na tool, kung mayroon kaming isang pangkat ng mga tao na nagtatayo ng mga tool at mga algorithm na iyon. At ang data ng siyentipiko ay hindi kailangang maging isang dalubhasa sa pag-analisar ng rehistro sa kanilang data. Maaaring gamitin nila ang tool, ngunit maaari kang magkaroon ng lima o anim na istatistika at isang kumilos at isang scientist ng data at ilang mga matematiko na nagtatrabaho sa tool na iyon, module na iyon, algorithm na iyon, na plug-in at iba pa sa spreadsheet parlance, kaya isipin na ang bawat spreadsheet na nai-publish na maaari mong gamitin ay talagang isinulat ng mga espesyalista na sinubukan ang macros, sinubukan ang Visual Basic, siguraduhin na nagtrabaho ang mga algorithm, kaya kapag nakuha mo ito maaari ka lamang pop data sa ito ngunit hindi mo talaga masira ito at samakatuwid ay mas mahusay na makontrol.

Sa palagay ko maraming ginagawa ang mga tool sa analytics na iyon. Sa palagay ko darating ang punto na iyon, nakikita mo ba na sa larangan ngayon, nakikita mo ba ang paglipat mula sa mga spreadsheet na potensyal na maaaring magtulak ng mga pagkakamali at pagkakamali at peligro, hanggang sa kung saan ang mga tool na iyong itinatayo kasama ang iyong mga platform ngayon, sa pagtuklas ng data na tumpak sa totoong oras at ang mga taong nagtatayo ng mga module at algorithm ay inaalis o binabawasan ang profile na peligro? Nakikita ba ang serbisyo sa customer na sa isang tunay na diwa o sa palagay mo nangyayari lang ito at hindi nila ito napagtanto?

David Sweenor: Alam mo, sa palagay ko mayroong ilang mga paraan upang sagutin ito. Ngunit ang nakikita natin ay, alam mo, sa anumang samahan, at nabanggit ko na ang analytics na sa palagay ko ay marahil ay nahuli mula sa isang pananaw sa pamumuhunan sa korporasyon, uri ng ginawa namin sa warehousing ng data at CRM. Ngunit kung ano ang nakikita natin, kaya, nangangailangan ng maraming upang baguhin ang isang samahan, upang makuha ang pagkawalang-galaw sa samahan na iyon. Ngunit ang nakikita natin ay ang mga tao na kumukuha ng kanilang mga spreadsheet, kumukuha ng kanilang mga daloy ng trabaho, at binanggit ko ang seguridad at pamamahala, "Well, marahil mayroon akong isang spreadsheet, " "Well, maaari kong i-lock ito at maaari kong bersyon na kontrolin ito." marami kaming nakikita na mga samahan, siguro nagsisimula lang sila doon. At kung nabago ito, mayroong isang daloy ng trabaho at nagtatapos ako sa pagpunta, bilang isa bagaman, sino ang nagbago nito? Bakit nila ito binago. Kapag binago nila ito. At maaari rin akong mag-set up ng isang daloy ng trabaho na hindi ko ilalagay ang bagong spreadsheet na ito sa paggawa maliban kung ito ay napatunayan at napatunayan ng isa, dalawa, tatlo, gayunpaman maraming mga partido na nais mong tukuyin sa iyong daloy ng trabaho. Sa palagay ko ay nagsisimula na ang mga tao, at ang mga organisasyon ay nagsisimulang gumawa ng mga hakbang sa sanggol doon, ngunit marahil ay iminumungkahi kong mayroon kaming mahabang paraan.

Dez Blanchfield: Sa katunayan at sa palagay ko binibigyan ka ng parehong mga kontrol sa seguridad at pamamahala doon, kung gayon ang awtomatiko ay maaaring awtomatikong mapa na sa at lahat ng bagay hanggang sa punong opisyal ng peligro, na ngayon ay isang bagay. Maaari mong simulan upang makontrol kung paano naa-access ang mga tool at system at kung sino ang gumagawa ng kung ano sa kanila, kaya napakalakas. Sa palagay ko ang iba pang mga bagay na pumapasok sa ito ay ang mga uri ng mga tool na ibinibigay mo, para sa akin, ipahiram sa pag-uugali ng tao nang higit pa sa mga tradisyonal na mga spreadsheet na pinag-uusapan natin, kung mayroon akong silid na puno ng mga tao na may parehong dashboard at pag-access sa parehong data na maaari silang makakuha ng ibang view at, bilang isang resulta, makakuha ng bahagyang magkakaibang mga pananaw mula sa parehong impormasyon, na nababagay sa kanilang mga pangangailangan upang maaari silang makipagtulungan. Kami ay may higit pang pananaw at pakikipag-ugnayan ng tao sa negosyo at proseso ng paggawa ng desisyon, kumpara sa lahat ng pagpunta sa parehong pulong kasama ang parehong PowerPoint, at ang parehong mga spreadsheet na nakalimbag, lahat ng parehong nakapirming data.

Nakikita mo ba ang isang paglipat sa pag-uugali at kultura sa mga samahan na nag-uuri ng iyong mga tool ngayon kung saan nakikita nila na nagaganap, kung saan hindi tulad ng limang mga tao sa silid na tinitingnan ang parehong spreadsheet na sinusubukan lamang na pasalita ito at gumawa ng mga tala dito, ngunit ngayon sila ay talagang nakikipag-ugnay sa mga dashboard at mga tool sa real time, kasama ang visualization at analytics sa kanilang mga daliri at nakakakuha ng isang ganap na magkakaibang daloy sa pag-uusap at pakikipag-ugnayan, hindi lamang sa mga pagpupulong ngunit pangkalahatang pakikipagtulungan sa paligid ng samahan? Dahil magagawa nila ito ng totoong oras, dahil maaari silang magtanong ng mga katanungan at makakuha ng isang tunay na sagot. Iyon ba ang isang kalakaran na nakikita mo sa ngayon o hindi pa nangyari?

David Sweenor: Hindi, sa palagay ko siguradong nagsimula ito sa landas at sa palagay ko ang napaka-kagiliw-giliw na bagay ay, alam mo, kung kukuha tayo ng halimbawa ng isang pabrika, halimbawa. Marahil ang isang tao na nagmamay-ari ng isang partikular na sektor ng proseso sa loob ng pabrika na nais nilang tingnan at makihalubilo sa data na ito sa isang tiyak na paraan. At marahil sa akin, na tinatanaw ang lahat ng mga proseso, marahil ang isang ito sa ilalim, marahil nais kong tingnan ito sa lahat ng bagay. Sa palagay ko ang nakikita natin ay, numero uno, nagsisimula ang mga tao na gumamit ng isang pangkaraniwang hanay ng mga visualizations o karaniwang mga visualizations sa loob ng kanilang mga samahan, ngunit iniayon din sa papel na nasa kanila. Kung ako ay isang proseso ng engineer, marahil iyon ay isang kakaibang pananaw kaysa sa isang taong tumitingin mula sa isang pananaw sa supply chain, at sa palagay ko ay mahusay ito sapagkat kailangang itugma ito at kailangang tingnan ito sa mga lens na kailangan mong gawin ang iyong trabaho.

Dez Blanchfield: Sa palagay ko ay bumababa ang proseso ng desisyon, matalino at bilis, upang aktwal na gumawa ng matalino at tumpak na mga desisyon ay tumataas din nang mabilis, hindi ba? Dahil kung mayroon kang real-time na analytics, real-time na mga dashboard, kung nakuha mo ang mga tool sa Statistica sa iyong mga kamay hindi mo na kailangang tumakbo sa buong palapag upang magtanong at magtanong sa isang tao tungkol sa isang bagay, nakuha mo na sa hard copy. Maaari kang uri ng pakikipagtulungan, makipag-ugnay at talagang gumawa ng mga pagpapasya sa mabilisang at makuha agad ang kalalabasan. Na sa palagay ko ang ilan sa mga kumpanya ay hindi pa nakakaunawaan, ngunit kapag ginawa nila ito ay magiging Eureka sandali na, oo, maaari pa rin tayong manatili sa aming mga cubicle at magtrabaho sa bahay, ngunit maaari tayong makipag-ugnay at makipagtulungan at mga pagpapasyang iyon ginagawa namin habang nagtutulungan kaming maging mga resulta agad. Tingnan, sa palagay ko ito ay hindi kapani-paniwala na marinig kung ano ang sinabi mo hanggang ngayon at inaasahan kong inaasahan kung saan ito pupunta. At alam kong marami kaming mga katanungan sa Q&A, kaya babalik ako sa Rebecca upang maipasok ang ilan sa mga maaari upang makarating kami sa mga mabilis na magagawa mo. Maraming salamat.

Rebecca Jozwiak: Salamat Dez, at oo Dave, mayroon kaming kaunting mga katanungan mula sa madla. At salamat Dez at Robin sa iyong mga pananaw din. Alam ko na ang partikular na kalahok na ito ay kailangang bumagsak nang tama sa tuktok ng oras, ngunit mabait siyang magtanong, nakikita mo ba ang mga departamento ng impormasyon ng impormasyon ay uri ng paglalagay ng higit na priyoridad sa mga sopistikadong kontrol ng data sa halip na uri ng pagiging komportable sa pagbibigay ng mga tool sa ang mga manggagawa sa kaalaman? Ibig kong sabihin, iyon ba - sige.

David Sweenor: Oo, sa palagay ko nakasalalay ito sa samahan. Sa palagay ko ang isang bangko, isang kumpanya ng seguro, marahil ay mayroon silang iba't ibang mga priyoridad at paraan ng paggawa ng mga bagay, kumpara sa isang organisasyon sa marketing. Sa palagay ko ay sasabihin ko lamang na nakasalalay sa industriya at pag-andar na tinitingnan mo. Iba't ibang mga industriya ay may iba't ibang mga pagtuon at diin.

Rebecca Jozwiak: Okay mabuti, na may katuturan. At pagkatapos ay nais malaman ng isa pang dumalo, ano ang makina sa likod ng Statistica? Ito ba ay C ++ o ang iyong sariling mga bagay?

David Sweenor: Buweno, hindi ko alam kung makakakuha ako ng tiyak na kasama nito na ito ay sa loob ng 30 taon at ito ay binuo bago ang aking oras ngunit mayroong isang pangunahing aklatan ng mga analytic algorithm na ang mga Statistica algorithm na tatakbo. At nakita mo dito na maaari rin nating patakbuhin ang R, maaari nating patakbuhin ang Python, maaari tayong sumabog sa Azure, maaari tayong tumakbo sa Spark sa H2O, kaya't hulaan kong sasagutin ko ang tanong na iyon sa mga tuntunin ng, ito ay iba't ibang mga makina. At nakasalalay sa kung aling algorithm ang iyong pinili, kung ito ay isang Statistica na pinapatakbo nito tulad nito, kung pumili ka ng isa sa H2O at Spark, ginagamit nito iyon, at sa gayon ito ay iba't-ibang mga ito.

Rebecca Jozwiak: Okay mabuti. Ang isa pang dumalo na uri ng nagtanong partikular na tumuturo sa slide na ito, nais na malaman, uri ng, paano nalalaman ng data ng siyentipiko ng mamamayan kung aling magagamit ang mga template na gagamitin? At sa palagay ko ay gagawa ako ng isang mas malawak na tanong sa labas. Iyon, ano ang nakikita mo kapag pumapasok ang mga linya ng negosyo o mga analyst ng negosyo at nais nilang gamitin ang mga tool na ito, gaano kadali para sa kanila ang kunin at tumakbo?

David Sweenor: Sa palagay ko sasagutin ko iyon at kung maaari mong gamitin, kung pamilyar ka sa Windows, ito ay isang platform na nakabase sa Windows, kaya pinutol ko ang tuktok ng mga screenshot na ito, ngunit nakuha nito ang Windows ribbon. Ngunit paano nila nalalaman kung ano ang dapat gamitin sa daloy ng trabaho? Mukhang ang Windows Explorer, kaya mayroong isang istraktura ng puno at maaari mo itong mai-configure at itakda ito gayunpaman nais ng iyong samahan na i-set up ito. Ngunit maaari itong, magkakaroon ka lamang ng mga folder na ito at nais mong ilagay ang mga magagamit na template sa loob ng mga folder na ito. At sa palagay ko marahil ay may isang tatak ng pangalan ng iyong kumpanya ay maaaring magpatibay, sabihin dito ang "kalkulahin ang profile ng peligro, " narito ang "kumuha ng data mula sa mga mapagkukunang ito" at pangalanan mo sila kahit anong gusto mo. Ito ay isang libreng folder, i-drag mo lamang ang mga tala sa iyong canvas. Kaya, medyo madali.

Rebecca Jozwiak: Okay mabuti. Baka isang demo sa susunod. Pagkatapos ng isa pang dumalo na uri ng nagdadala, at ito ang pinag-uusapan mo at Robin at Dez hanggang sa mga kawastuhan, lalo na sa isang spreadsheet, ngunit ang basura sa / basura ay lumabas, at nakikita niya ito na mas kritikal pagdating sa sa analytics. Uri ng pagbanggit na, alam mo, ang maling paggamit ng data ay maaaring humantong sa ilang mga kapus-palad na desisyon. At nagtataka siya kung ano ang iyong mga pananaw sa pagbuo ng mas maraming mga hindi magagaling na mga algorithm, sa palagay ko para sa, gumagamit siya ng salita, "labis na labis" na paggamit ng mga analytics. Alam mo, ang isang tao ay pumapasok, natutuwa sila, nais nilang gawin ang mga advanced na analytics na ito, nais nilang patakbuhin ang mga advanced algorithm na ito, ngunit marahil hindi sila sigurado. Kaya ano ang gagawin mo upang uri ng pangalagaan laban doon?

David Sweenor: Oo, sa tingin ko sasagutin ko ito hangga't maaari, ngunit sa palagay ko ang lahat ay bumababa sa mga tao, proseso at teknolohiya. Mayroon kaming teknolohiya na makakatulong sa paganahin ng mga tao at tumutulong na paganahin ang anumang proseso na nais mong ilagay sa loob ng iyong samahan. Sa halimbawa ng pagpapadala ng isang kupon sa isang tao, marahil hindi iyan kritikal, at kung ito ay digital wala talagang gastos, marahil mayroong isang antas ng mga kontrol sa seguridad at baka hindi tayo nagmamalasakit. Kung hinuhulaan ko ang mga impeksyong kirurhiko sa site, marahil nais kong maging mas maingat tungkol doon. O kung hinuhulaan ko ang kalidad ng gamot at kaligtasan at mga bagay na ganyan, marahil nais kong maging mas maingat tungkol dito. Tama ka, basura sa / basura sa labas, kaya ang sinusubukan naming gawin ay magbigay ng isang platform na nagbibigay-daan sa iyo upang maiangkop ito sa anumang proseso na nais ng iyong samahan.

Rebecca Jozwiak: Okay mabuti. Mayroon akong ilang higit pang mga katanungan, ngunit alam kong medyo lumipas na ang oras namin at nais kong sabihin sa aming mga nagtatanghal, iyon ay kahanga-hanga. At nais naming pasalamatan ang maraming Dave Sweenor mula sa Dell Statistica. Siyempre, Dr. Robin Bloor at Dez Blanchfield, salamat sa pagiging analyst ngayon. Magkakaroon kami ng isa pang webcast sa susunod na buwan kasama si Dell Statistica. Alam kong si Dave uri ng hinted tungkol sa paksa. Ito ay tungkol sa analytics sa gilid, isa pang kamangha-manghang paksa, at alam ko na ang ilang mga napaka-nakakahimok na mga kaso ng paggamit ay tatalakayin sa webcast na iyon. Kung nagustuhan mo ang nakita mo ngayon, bumalik ka nang higit sa susunod na buwan. At doon, mga tao, nagpaalam ako sa iyo. Maraming salamat. Paalam.

I-embed ang analytics kahit saan: pagpapagana ng siyentipiko ng data ng mamamayan