Sa pamamagitan ng Techopedia Staff, Hunyo 8, 2016
Takeaway: Talakayin ni Host Eric Kavanaugh ang mga pagbabago sa teknolohiya ng database kasama ang mga eksperto na Dez Blanchfield, Robin Bloor at Bert Scalzo.
Kasalukuyan kang hindi naka-log in. Mangyaring mag-log in o mag-sign up upang makita ang video.
Eric Kavanagh: Mga kababaihan at mga ginoo, ito ay Miyerkules, sa apat na oras ng Silangan. Nasa New Orleans na ako, darating na ang tag-araw, nangangahulugang mainit! Panahon na para sa Hot Technologies, oo nga, oo nga. Ang pangalan ko ay Eric Kavanagh, ako ang magiging host mo. Pupunta ako sa sipa ng bola pabalik dito para sa Hot Technologies. Ang paksa ngayon ay "Forward Momentum: Paglilipat ng Relasyon Higit pa sa Tradisyonal." Mga Folks, mayroon kaming tatlong mga eksperto sa database sa telepono ngayon, kaya ang anumang mga katanungan mo, ipadala ang mga ito ng mahirap, huwag mahiya. Mayroon kaming isang bungkos ng mahusay na nilalaman na may linya para sa iyo ngayon. Mayroong lugar tungkol sa iyo ng tunay, sapat na tungkol sa akin. Siyempre, mainit ang taong ito. Pinag-uusapan namin ang lahat tungkol sa mga maiinit na teknolohiya sa palabas na ito, na kung saan ay isang pakikipagtulungan sa aming mga kaibigan mula sa Techopedia. At pupunta kaming lahat hanggang sa pundasyon ng pamamahala ng impormasyon ngayon, na syempre ang database. Pag-uusapan natin kung paano kami nakarating dito, kung ano ang nangyayari ngayon, at kung ano ang nangyayari. Maraming mga napaka-kagiliw-giliw na mga bagay-bagay na nangyayari.
Malinaw na mayroon kaming ilang mga seryosong pagbabago sa puwang ng database. Ito ay uri ng tahimik para sa isang habang; kung nakikipag-usap ka sa ilan sa mga analyst sa negosyo, sasabihin ko marahil mula sa taon tulad ng, 2005 hanggang 2009 o '10, hindi ito tila tulad ng napakaraming nangyayari sa mga tuntunin ng pagbabago. At lahat ng biglaang sumabog ito, tulad ng isang jailbreak o isang bagay, at ngayon mayroong lahat ng mga kagiliw-giliw na nangyayari. Ang isang pulutong ng mga ito ay dahil sa laki ng web, at lahat ng mga cool na mga katangian ng web na gumagawa ng iba't ibang mga kagiliw-giliw na bagay. Doon nagmula ang konsepto ng NoSQL. At nangangahulugan ito ng dalawang magkakaibang bagay: nangangahulugan ito na walang SQL, dahil sa hindi nito suportado ang SQL, nangangahulugan din ito na hindi lamang SQL. Mayroong isang salitang "NewSQL" na ginamit ng ilang mga tao. Ngunit malinaw naman, ang SQL's - ang Structured Query Language - talaga ang pundasyon, ito ang batayan ng pagtatanong.
At kagiliw-giliw na ang lahat ng mga makina ng NoSQL na ito, ano ang nangyari? Buweno, lumabas sila, nagkaroon ng maraming kaguluhan tungkol dito, at pagkatapos ng ilang taon, kung ano ang aming lahat ay nagsimulang marinig? Oh, SQL sa Hadoop. Sa totoo lang, sinimulan ng lahat ng mga kumpanyang ito ang pag-sampal ng mga interface ng SQL sa kanilang mga tool sa NoSQL, at ang sinumang nasa mundo ng programming ay nakakaalam na hahantong sa ilang mga hamon at ilang mga paghihirap, at ilang mga tumawid na mga wire at iba pa. Kaya't malaman namin ang tungkol sa maraming bagay na ngayon.
Mayroong aming tatlong nagtatanghal: nakuha namin ang Dez Blanchfield na tumatawag mula sa Sydney, ang aming sariling Robin Bloor na nasa Texas, at ganoon din si Bert Scalzo, nasa Texas rin siya. Kaya, una sa lahat maririnig natin mula sa Dez Blanchfield. Mga tao, mag-tweet kami sa hashtag ng #HotTech, kaya huwag mag-atubiling ipadala ang iyong mga puna, o ipadala ang iyong mga katanungan sa pamamagitan ng Q&A na bahagi ng webcast console, o kahit sa pamamagitan ng window ng chat. At kasama iyon, Dez Blanchfield, ilayo ito.
Dez Blanchfield: Salamat, Eric. Kumusta, lahat. Kaya susubukan ko at itakda ang eksena sa isang 30, 000 talampakan ng pagtingin ng uri ng nangyari sa huling dekada, at ang mga makabuluhang pagbago na nakita natin - o hindi bababa sa isang dekada at kalahati pa rin - ng mga sistema ng pamamahala ng database, at ang ilan sa mga epekto mula sa isang komersyal o isang teknikal na pananaw, at ang ilan sa mga uso na tinitiis namin huli na, at pinangungunahan kami sa pag-uusap na malapit na tayong magkaroon ngayon sa paligid ng paksa.
Ang aking imahe ng takip dito ay isang dune ng buhangin, at may hangin na humihip ng maliit na maliit na piraso ng buhangin mula sa tuktok nito. At bilang isang resulta nito, ang mangyayari ay ang dune ng buhangin ay dahan-dahang lumalakad mula sa isang puwang patungo sa isa pa. At ito ay isang kamangha-manghang kababalaghan, kung saan ang mga napakalaking 40- at 50-talampakan na mataas na bundok ng buhangin, na epektibo, aktwal na lumipat sila. At dahan-dahang lumipat sila, ngunit tiyak na lumipat sila, at habang lumilipat, binabago nila ang tanawin. At medyo mapapanood kung gumugol ka ng anumang oras sa lahat sa isang lugar kung saan ang mga buhangin ay isang likas na bagay. Dahil maaari mong tingnan ang window sa isang araw, at mapagtanto na ang napakalaking bundok ng buhangin na ito, ang maliit na maliliit na butil ay inilipat ang lahat, sa bisa, at na ang hangin ay dahan-dahang inilipat ito mula sa isang lugar patungo sa isa pa.
At sa tingin ko sa maraming mga paraan, na ang mundo ng mga sistema ng database sa loob ng kaunting oras. Hanggang sa tunay, kamakailan lamang, ang napakaliit na pagbabagong ito sa anyo ng mga butil ng buhangin na gumagalaw ng isang higanteng bundok ng buhangin sa anyo ng isang dune ng buhangin. Ang mga maliit na pagbabago ay nakarating sa mga platform ng database sa mga nakaraang taon, at ito ay naging isang medyo matatag at solidong kapaligiran sa paligid ng mga sistema ng database at platform, sa pamamagitan ng mainframe ng mid-range era. Ngunit sa huli, mayroon kaming ilang mga medyo makabuluhang bagay na nangyayari sa aming mga komersyal na pangangailangan at aming mga teknikal na driver. Pupunta ako sa amin sa pamamagitan ng mga iyon.
Mayroon akong pananaw na ang pangunahing konsepto ng isang database, tulad ng alam namin sa maraming, maraming taon, at tulad ng narinig mo sa pre-show na banter, ang aming dalawang dalubhasa na tumawag sa akin ngayon ay may buhay sa ang puwang na ito at medyo tama sila sa pagbabahagi ng mga karapatan ng pagiging naroroon kapag nagsimula ang lahat noong unang bahagi ng '80s. Ngunit nakita namin ang napakalaking pagbabagong ito sa huling dekada at medyo, at mabilis akong maglakad sa amin bago ko ito ibigay kay Dr. Robin Bloor.
Naranasan namin ang tinatawag na "mas malaki, mas mahusay, mas mabilis, mas mura" na karanasan. Tulad ng sinabi ko, ang kahulugan ng isang database ay nagbago. Ang tanawin kung saan ang mga platform sa database ay kailangang matugunan ang pagganap, at ang mga kinakailangan sa teknikal at komersyal ay nagbago din. Nakita namin ang pagtaas ng demand para sa mga solusyon upang harapin ang alinman sa mas kumplikadong komersyal, o mas kumplikadong mga kinakailangan sa teknikal. At ang isang napakabilis na pagtingin sa kung ano ang tunay na ibig sabihin, sa aking isip, ay kailangan nating pag-uri-uriin ang mga '90s, at nakita namin ang teknolohiya ng database na naapektuhan ng pagpapakilala ng internet, at uri ng tinatawag naming pabalik sa internet scale. Hindi lamang namin pinag-uusapan ang tungkol sa mga taong nakaupo sa harap ng mga terminal, orihinal na ang mga gusto ng mga teletype na mga terminal na may mga pisikal na printer na binuo sa kanila at 132 mga haligi ng teksto na lumalabas sa papel. Pagkatapos ang maagang mga terminal ng berdeng screen, sinuntok gamit ang mga keyboard.
Ngunit alam mo, ang aming mundo ay mga terminal at serial cables o network cable na nakikipag-usap sa mga computer sa loob ng mahabang panahon. Pagkatapos ay dumating ang internet, at ang paputok na paglago ng koneksyon, na hindi mo na kailangang mai-plug sa computer. Upang makapunta sa isang sistema ng database kailangan mo lamang ng isang web browser. Kaya ang teknolohiyang database ay kailangang magbago nang malaki, upang harapin ang sukat ng lahat mula sa mga pangunahing teknolohiya sa search engine na ginamit upang i-index ang mundo, at mag-imbak ng isang index ng impormasyon, sa halimbawa ng scale ng format ng database. At ang mga tao tulad ng Google at iba pa ay nagbigay ng isang platform upang gawin iyon. At lahat ng mga bagong uri ng imbakan ng database at pag-query at pag-index ay ginawa. At pagkatapos ay nagkaroon kami ng mga site ng musika at mga site ng pelikula.
At pagkatapos noong 2000s, nakita namin ang dot-com boom, at na gumawa ng isang mas dramatikong pagsabog sa bilang ng mga tao na gumagamit ng mga system na palaging pinapagana ng isang database ng ilang form. Ang yugtong ito, nakabatay pa rin ang mga database ng relational na karamihan sa pagkarga, inilalagay lamang namin ang mga ito sa mas malaking lata, at uri kami ay napunta sa pinakadulo, napaka, napakalaking mid-range system na nagpapatakbo ng mga platform ng Unix mula sa mga taong tulad ng IBM at Sun at iba pa . Ang dot-com boom ay gumawa lamang ng mga bagay na mas malaki at mas mabilis mula sa isang hardware, punto ng pagganap, at mayroong ilang mga makabuluhang pagbabago sa mga database ng database, ngunit para sa mas mahusay na bahagi, ito ay pa rin ang parehong bagay na nakita namin para sa isang matagal na panahon.
At pagkatapos ay nakuha namin ang panahon ng web 2.0, bilang tinutukoy namin ito. At ito ay isang napakalaking paglipat, dahil sa lahat ng biglaang kailangan namin ng mas simple na mga platform ng database, at kailangang magkaroon ng isang scale sa isang pahalang na form. At iyon ay isang makabuluhang paglilipat sa paraang lumapit kami sa ideya ng kung ano ang isang database. Nakaka-catch up talaga kami ngayon sa aking pananaw. At ngayon nakikipag-ugnayan kami sa buong quagmire na ito, at sinasabi ko na sa isang positibong pag-ikot, hindi isang negatibong konotasyon, ang quagmire na ito ay tinutukoy namin bilang malaking data, at isang napakalaking pagsabog, at ang ibig kong sabihin ay pagsabog. Ang nakapangingilabot na paglilipat na ito nang patayo sa graph ng bilang ng mga pagpipilian na mayroon tayo kapag pinag-uusapan natin ang tungkol sa isang database, at ilang paraan ng kakayahang mag-query sa pamanggit.
At kagiliw-giliw na sapat, ako mismo ang may pananaw na sa palagay ko na ang malaking data ay talagang dulo lamang ng iceberg. Kami ay may posibilidad na makakuha ng isang maliit na nasasabik tungkol sa kung ano ang epekto ng malaking data, at ang mga uri ng mga pagpipilian na magagamit namin ngayon. Mayroon kaming lahat mula sa mga makina ng NoSQL, mayroon kaming mga engine engine, nakuha namin ang lahat ng iba't ibang mga uri ng platform na maaari naming itapon ang data at gawin ang mga bagay dito. Kahit na kung saan sa katunayan, ang isa sa pinakaunang mga pakikipag-usap ko kay Eric Kavanagh, na kasama natin ngayon, ay nasa paligid ng isang pag-uusap na nauukol sa isang bagay na tinatawag na Apache Drill, na isang open-source na proyekto na nagbibigay-daan sa iyo upang mag-query data sa loob ng modelo ng iba't ibang mga uri ng data: lahat mula sa mga hilaw na file na CSE na nakaupo sa isang hard drive, hanggang sa mga file ng HDFS sa sukat ng petabyte. At alam mo, pinapayagan ka nitong gawin ang mga query na estilo ng SQL ng nakabalangkas at hindi nakabalangkas na data ng lahat ng mga uri ng mga kapana-panabik na halaman.
Malapit na nating makita ang "matalinong gusali" ay nagiging isang bagay, at nais naming isipin na mayroon kaming matalinong mga gusali ng seguridad at pamamahala ng init, ngunit pinag-uusapan ko ang tungkol sa mga matalinong gusali na alam ang tungkol sa kung sino ka at kung nasaan ka kapag naglalakad ka, at ginagawa ang lahat ng mga uri ng mga malinis na bagay sa antas na iyon, hanggang sa mga matalinong lungsod - buong ekosistema sa antas ng lungsod - alam kung paano gawin ang mga bagay nang may katalinuhan. At lampas doon, nakuha namin ang hindi kapani-paniwalang bagay na hindi ko iniisip na sinuman sa buong mundo na naiintindihan, at iyon ang porma ng Internet ng mga Bagay. Nagkaroon ng lahat ng mga iba't ibang mga pagbabagong ito sa nakaraang dekada at medyo, marahil dalawang dekada nang halos, kung ikot namin ito, na mayroong uri ng nakakaapekto lamang sa mundo ng kung ano ang itinuturing nating mga database, sa aking pananaw.
Nagkaroon ng isang pares ng mga makabuluhang bagay na nagawa nitong posible. Ang gastos ng mga hard drive ay bumagsak nang malaki, at sa maraming mga paraan na nagawa nitong magmaneho ng ilan sa mga sanggunian na sanggunian tulad ng modelo ng Hadoop, na kumuha kami ng maraming data at ikakalat ito sa maraming mga hard drive, at gawin ang mga matalinong bagay dito. At sa bisa, kung ano ang naging sharding, sa aking pagtingin, ng relational database o tradisyonal na modelo ng yunit ng DB. At ang RAM ay napakahusay, napaka-mura, at nagbigay sa amin ng isang bagong bagong pagkakataon upang i-play sa iba't ibang mga arkitektura ng sanggunian tulad ng nasa memorya, at gawin ang mga bagay tulad ng pagkahati talaga, napakalawak na mga bugal ng data.
At kaya ito ay nagbigay sa amin ng maliit na larawang ito na tinitingnan namin ngayon, na kung saan ay isang diagram na nagpapakita ng mga uri ng mga platform na magagamit kung ikaw ay nasa malaking tanawin ng data. At ito ay napakahirap, napakahirap basahin, at ang dahilan para sa, mayroong masyadong maraming impormasyon tungkol doon. Napakaraming gumawa, modelo at paggawa ng mga pagpipilian ng mga paraan upang maglagay ng data sa mga sistema ng database ng anumang form, at tatanungin ito, at gawin ang tradisyunal na pagbasa-magsusulat. At hindi sila lahat ay sumusunod, sa katunayan napakakaunting sa kanila kahit na sumunod sa anumang pangunahing pamantayan ng estilo, ngunit itinuturing pa rin nila ang kanilang sarili na isang database. At ipapakita ko sa iyo ang isang pares ng mga screen sa isang segundo upang mabigyan ka ng ilang konteksto sa paligid ng kung ano ang ibig kong sabihin sa pamamagitan ng paglipat mula sa '90s at sa scale ng internet, sa web 2.0, at pagkatapos ay ang buong paglaki sa pamamagitan ng malaking data. Kung sa tingin namin na ang malaking data ng teknolohiya ng data ng landscape ay kapana-panabik dahil mayroong maraming mga pagpipilian dito, tingnan lamang natin ang isang pangunahing patayo.
Tingnan natin ang teknolohiya sa marketing. Narito ang mga pagpipilian para sa mga sistema ng pamamahala ng database, o pamamahala ng data sa loob lamang ng puwang ng mar-tech, kaya ang teknolohiya na nauugnay sa marketing. Ngayon ito ay noong 2011, kaya ilang taon na ang nakalilipas; limang taon na ang nakalilipas, ito ang hitsura ng landscape. Kung babalik lang ako ng isang slide ng sandali, ganito ang hitsura ng data ngayon ng data sa iba't ibang mga tatak at handog na nakuha namin sa mga teknolohiya sa database. Ito ang hitsura ng isang patayo tulad ng limang taon na ang nakalilipas, sa teknolohiya lamang sa pagmemerkado.
Ngayon kung pupunta ako sa view ngayon, ganito ang hitsura, at ito ay ganap na hindi mapipigilan. Ito lamang ang pader ng mga tatak at mga pagpipilian, at libu-libo at libu-libong mga kumbinasyon ng software na isinasaalang-alang ang sarili na nasa klase ng database, na maaari itong makunan, lumikha o mag-imbak at makukuha ang data sa iba't ibang mga form. At sa palagay ko kami ay pumapasok sa isang napaka, napaka-kawili-wili at matapang na oras ngayon, kung saan sa sandaling makilala mo ang mga pangunahing tatak, malalaman mo ang lima o anim na magkakaibang mga platform mula sa Oracle at Informix, DB2 at iba pa, at maging halos isang dalubhasa sa lahat ng mga tatak na magagamit mga 20 taon na ang nakakaraan. Sampung taon na ang nakalilipas, medyo madali itong nakuha dahil ang ilan sa mga tatak ay nahulog, at hindi lahat ng mga tatak ay maaaring makaya sa laki ng dot-com boom, at ilang mga kumpanya lamang ang sumira.
Ngayon, ganap na imposible na maging isang dalubhasa sa lahat ng teknolohiya ng database na umiiral, maging ang mga database ng pamanggit, o karaniwang mga platform ng pamamahala ng database na alam natin sa huling ilang mga dekada. O malamang ang kaso, ang mas modernong mga makina tulad ng Neo4j at ang mga uri. At sa palagay ko ay pumapasok kami sa isang napaka-matapang na mundo kung saan magagamit ang maraming mga pagpipilian, at mayroon kaming mga platform na sukat sa isang pahalang na batayan, alinman sa memorya o sa disk ngayon. Ngunit sa palagay ko ito ay isang mapaghamong oras para sa mga gumagawa ng desisyon sa teknolohiya at negosyo, dahil kailangan nilang gumawa ng ilang napakalaking desisyon sa mga stacks ng teknolohiya, na sa ilang mga kaso ay halos mga buwan lamang. Labing walong buwan ang edad ay hindi isang nakakatakot na numero ngayon para sa ilan sa mga mas kapana-panabik at bagong platform ng open-source database. At nagsisimula silang pagsamahin ang mga platform at maging mas bago at mas kapana-panabik.
Sa palagay ko magkakaroon kami ng isang mahusay na pag-uusap ngayon tungkol sa kung paano ang lahat na ito ay nakaapekto sa tradisyonal na mga platform ng database at kung paano sila tumutugon dito, at ang mga uri ng mga teknolohiya na itinapon sa na. At sa pag-iisip, pupunta ako ngayon kay Dr. Robin Bloor, at makuha ang kanyang mga pananaw. Robin, sa iyo.
Robin Bloor: O sige, salamat para doon. Oo, ito ay napakalaking paraan ng isang paksa. Ibig kong sabihin, kung kumuha ka lang ng isa sa mga guhit na ipinakita sa iyo ni Dez, maaari kang magkaroon ng mahabang pag-uusap tungkol sa isa lamang sa mga slivers. Ngunit alam mo, maaari kang pumunta ng isang database - Tumitingin ako sa mga database, hindi ko alam, mula noong 1980s, at maaari kang tumingin sa database sa iba't ibang paraan. At ang isa sa mga bagay na naiisip ko na gagawin ko, ihulog lang sa pag-uusap ngayon, ay pag-usapan ang dahilan ng mga nakakagambalang bagay na nangyari sa antas ng hardware. At kailangan mong tandaan, ang isang kakila-kilabot na nakakagambalang bagay ay talagang nangyari sa antas ng software pati na rin, kaya hindi ito ang buong larawan ng anumang bagay, ito ay isang bagay na hardware lamang.
Hindi ako masyadong makipag-usap para sa partikular na mahaba, nais ko lang na bigyan ka ng larawan ng hardware. Ang isang database ay mga kakayahan sa pagkuha ng data na sumasaklaw sa CPU, memorya at disk, at kapansin-pansing nagbabago. At ang dahilan na sinabi ko na, ay natutunan kong maunawaan ang database mula sa pananaw ng kung ano talaga ang iyong ginawa. Alam mo, mayroong pagkakaiba sa latency sa pagitan ng data ng aktwal sa CPU, at ang data na nakuha sa CPU mula sa memorya, at ang data na nakuha mula sa disk papunta sa memorya, at sa pamamagitan ng CPU. At ang mga lumang arkitektura ng database ay sinusubukan lamang na balansehin iyon. Alam mo, sinasabi lang nila, "Well, ito ay napabagal, mai-cache namin ang data sa disk kaya nasa memorya ito. Susubukan at gagawin natin iyon sa isang talagang tumpak na paraan upang ang isang talagang mabuting bahagi ng data na hinihiling namin ay nasa memorya na. At magmartsa kami ng data papunta sa CPU nang mas mabilis hangga't maaari. "
At ang mga database ay isinulat sa mga lumang araw na machine ay isinulat para sa maliit na kumpol. At ngayon, para sa ignorante ng parallelism. Dahil kung makakakuha ka ng ilang pagganap sa labas ng isang kumpol, kailangan mong gawin ang iba't ibang mga bagay na kaayon. Ang pagkakapareho ay isang bahagi ng laro, walang katulad sa ngayon. Maglalakad lang ako sa nangyari.
Una sa lahat, disk. Tapos na ang disk, talaga. Medyo sobra sa mga database. Sa palagay ko mayroong isang bilang ng mga konteksto sa pag-archive ng data, at kahit na napakalaking lawa ng data na tumatakbo sa Hadoop, ang pinakamasamang pag-ikot ng disk ay marahil mabubuhay sa ngayon. Sa totoo lang, ang problema sa pag-ikot ng disk ay na ang mga bilis ng pagbasa ay hindi nagbabago lalo na. At kapag ang CPU ay umakyat sa bilis ng batas ng Moore, uri ng pagkakasunud-sunod ng lakas, mas mabilis tuwing anim na taon. At ang memorya ay uri ng pagsunod sa pagkagising nito, kung gayon ang dalawang iyon ay makatwirang sumasabay sa bawat isa, hindi ito ganap na makinis, ngunit ginawa nila.
Ngunit ang random na basahin sa isang disk kung saan ang ulo ay lilipad tungkol sa disk, ang ibig kong sabihin, bukod sa anupaman, ito ay isang pisikal na paggalaw. At kung gumagawa ka ng mga random na pagbabasa sa isang disk, ito ay hindi mapaniniwalaan o kapani-paniwala mabagal kumpara sa pagbabasa mula sa memorya, ito ay tulad ng 100, 000 beses na mas mabagal. At medyo kamakailan, ang karamihan sa mga arkitektura ng database na tinignan ko sa anumang lalim ay aktwal na lamang na serially pagbabasa mula sa mga disk. Gusto mo talaga, sa isang paraan o sa iba pa, cache lamang hangga't maaari mula sa disk, at hilahin ito sa mabagal na aparato at ilagay ito sa isang mabilis na aparato. At mayroong maraming mga matalinong bagay na maaari mong gawin sa, ngunit ito ay uri ng higit sa.
At ang mga solidong state disk, o flash drive, talaga, ay kung ano sila, ay napakabilis na pinapalitan ang spinning disk. At iyon ay muling nagbabago nang lubusan, dahil ang paraan na naayos ang data sa isang disk, ay naayos ito ayon sa paraan na gumagana ang disk. Talagang tungkol sa isang ulo na gumagalaw sa isang ibabaw na umiikot, talagang maraming mga ulo na gumagalaw sa maraming mga umiikot na ibabaw, at kunin ang data habang sila ay pumunta. Ang isang solidong state drive ay isang bloke lamang ng mga bagay na maaari mong basahin. Ibig kong sabihin, ang unang bagay ay ang lahat ng mga tradisyonal na database ay inhinyero para sa spinning disk, at ngayon ay muling inhinyero para sa SSD. Ang mga bagong database ay maaaring marahil - ang sinumang sumulat ng isang bagong database ngayon ay maaaring marahil huwag pansinin ang spinning disk, huwag isipin ang tungkol dito. Ngunit ang Samsung, ang pangunahing tagagawa ng SSDs, ay nagsasabi sa amin na ang mga SSD ay talagang nasa curve ng batas ng Moore.
Nauna na ako, sa palagay ko, mga tatlo o apat na beses nang mas mabilis kaysa sa pag-ikot ng disk, ngunit mas mabilis silang makakakuha ng mas mabilis bawat 18 buwan, talaga. Doble sa bilis, at 10 beses sa bilis hanggang sa anim na taon. Kung iyon lang iyon, gayunpaman, hindi iyon, tulad ng sasabihin ko sa iyo sa isang sandali. Ang Spinning disk ng kurso ay nagiging isang daluyan ng pag-archive.
Tungkol sa memorya. Unang bagay muna, RAM. Ang ratio ng CPU sa pagitan ng RAM bawat CPU ay tataas lamang sa lahat ng oras. At syempre, sa isang paraan, naghahatid ng isang napakalaking bilis, dahil ang mga ektarya ng memorya na maaari mong magkaroon ngayon ay maaaring mag-imbak ng marami pa. Ano ang tunay na ginagawa nito, ito ay uri ng pagbabawas ng presyon sa uri ng mga aplikasyon ng MLTP, o random na basahin ang mga aplikasyon, sapagkat mas madali itong magsilbi sa mga ito, dahil marami kang nakakuha ng memorya, at sa ganoong paraan, maaari kang maging cache ng anupaman malamang na basahin sa memorya. Ngunit nagpapatakbo ka sa mga problema sa isang mas malaking tambak ng data, kaya ang malaking data ay talagang hindi gaanong simple, talaga.
At pagkatapos ay mayroon kaming Intel na may 3D Xpoint, at ang IBM sa tinatawag nilang PCM, na memorya ng pagbabago ng phase, ay naghahatid ng isang bagay na pinaniniwalaan nila - well, ito ay hindi bababa sa 10 beses na mas mabilis kaysa sa kasalukuyang mga SSD, at naniniwala sila na makakakuha ito napakalapit sa pagiging pareho ng bilis ng RAM. At syempre mas mura ito. Kaya't dati, mayroon kang istraktura ng database na ito ng CPU, memorya at disk, at ngayon lumipat kami sa isang istraktura na nakuha ng apat na layer. Nakakuha ito ng CPU, memorya o RAM, at pagkatapos ay ang ganitong uri ng mas mabilis-kaysa-SSD na memorya, na talagang hindi pabagu-bago, at pagkatapos ay SSD. At ang mga bagong teknolohiya ay hindi pabagu-bago ng isip.
At mayroong memristor ng HP, na hindi pa, alam mo, dahil inihayag ito tungkol sa pitong taon na ang nakalilipas, ngunit hindi pa ito lumitaw. Ngunit ang mga alingawngaw na naririnig ko ay ang pagbabago ng HP nang kaunti sa isang memristor din, kaya mayroon ka lamang isang bagong sitwasyon sa memorya. Hindi ito tulad ng nakuha namin ng mas mabilis na bagay, ito ay tulad ng nakuha namin ang isang buong bagong layer. At pagkatapos ay nakuha namin ang katotohanan na ang pag-access sa SSD, maaari mong basahin ito nang magkatulad. Hindi mo mababasa ang pag-ikot ng disk na magkatulad, maliban sa pagkakaroon ng maraming iba't ibang mga disk sa pag-ikot. Ngunit isang bloke ng SSD, maaari mo talagang mabasa nang kahanay. At dahil maaari mong basahin na kahanay, mas mabilis itong lumalakad kaysa sa simpleng bilis ng pagbasa nito, kung aktwal kang nag-set up ng maraming mga proseso sa iba't ibang mga proseso sa isang solong CPU, at mayroon lamang sa SSD.
Tinatayang maaari kang makakuha ng halos hanggang sa bilis ng RAM sa pamamagitan ng paggawa nito. At ang lahat ng sinasabi nito ay, ang hinaharap ng arkitektura ng memorya ay hindi malinaw. Ibig kong sabihin, ang katotohanan ay ang iba't ibang mga nangingibabaw na nagtitinda, kung sino man ang kanilang ituring, marahil ay matukoy ang direksyon ng hardware. Ngunit walang nakakaalam kung saan ito pupunta sa puntong ito sa oras. Nakausap ko ang ilang mga inhinyero ng database na nagsasabing, "Hindi ako natatakot sa nangyayari, " ngunit hindi nila alam kung paano mai-optimize ito. At palagi kang uri ng ginawa, kaya kawili-wili iyon.
At pagkatapos ay mayroong ang CPU. Buweno, ang mga multicore na mga CPU ay hindi lamang mga multicore na mga CPU. Mayroon din kaming mga makabuluhang volume ng L1, L2 at L3 cache, lalo na ang L3, na hanggang sa, hindi ko alam, mga sampu-sampung megabytes. Maaari kang maglagay ng maraming doon, alam mo. At samakatuwid, maaari mong aktwal na gamitin ang chip bilang isang medium caching. Kaya nagbago ang laro. At tiyak, ang pagproseso ng vector at data compression, isang bilang ng mga nagtitinda ay aktwal na nagawa na, na-drag ang mga bagay na iyon sa CPU upang mas mabilis itong pumunta sa CPU. Pagkatapos makuha mo ang katotohanan na, well, ang mga CPU na may mga GPU ay talagang mahusay sa pabilis na analytics. At talagang mahusay sila sa ilang mga uri ng mga query, nakasalalay lamang ito sa kung ano ang iyong query.
Maaari kang lumikha ng mga board na may mga CPU at GPU, o habang ginagawa ngayon ang AMD, gumawa ka ng isang bagay na tinatawag na APU, na kung saan ay isang uri ng kasal ng isang CPU at isang GPU; nakuha nito ang parehong uri ng kakayahan sa ito. Kaya iyon ay isang iba't ibang uri ng processor. At pagkatapos ay ang kamakailang anunsyo ng Intel na sila ay maglagay ng FPGA sa maliit na tilad, na uri ng ginawa ng aking ulo. Iniisip ko, "Paano ito mangyayari sa mundo?" Dahil kung nakuha mo ang posibilidad ng CPU, GPU, at nakuha mo ang posibilidad ng CPU, FPGA - at sa pamamagitan ng paraan, kung nais mo talaga, sa parehong board maaari kang maglagay ng isang CPU, at isang GPU, at isang FPGA. Wala akong ideya kung paano mo talaga tatakbo ang anumang paraan, ngunit alam ko sa mga kumpanya na gumagawa ng mga bagay na tulad nito, at nakakakuha sila ng napakabilis na mga tugon sa query. Hindi ito isang bagay na hindi papansinin, ito ay isang bagay na gagamitin ng mga naitatag na vendor, at sa pamamagitan ng mga bagong nagtitinda, marahil. Ang mga DBMS ay palaging kahanay, ngunit ngayon ang mga magkakatulad na posibilidad ay sumabog na, sapagkat pinapayagan ka nitong i-parallelize ito kasama nito, kasama na, kasama iyon sa iba't ibang paraan.
Panghuli, upang masukat o masukat? Ang scaling up ay talagang pinakamahusay na solusyon, ngunit para sa isang bagay. Makakuha ka ng mas mahusay na pagganap ng node kung maaari mong ganap na mai-optimize ang pagganap ng CPU at ang memorya sa disk sa isang node. At gagamitin mo ang mas kaunting mga node, kaya ito ay magiging mas mura, di ba? At magiging madali itong pamahalaan. Sa kasamaang palad, ito ay isang disenyo na nakasalalay sa hardware, at habang nagbabago ang mga hardware, nagiging mas kaunti at hindi gaanong posible na gawin iyon, maliban kung ang iyong mga inhinyero ay magagawang tumakbo nang mabilis habang nagbabago ang hardware. At nakakakuha ka ng mga isyu sa workload, dahil kapag nag-scale ka, gumagawa ka ng iba't ibang mga pagpapalagay tungkol sa kung ano ang gagawin ng workload.
Kung nag-scale ka, iyon ay, kung ang iyong arkitektura ay binibigyang diin ang scale bago ang scale - talagang kailangan mong gawin ang mga ito pareho, bibigyan mo lang ito ng diin. Pagkatapos makakakuha ka ng mas mahusay na pagganap ng network, dahil haharapin ito ng arkitektura. Ito ay magiging mas mahal sa mga termino ng hardware dahil magkakaroon ng mas maraming mga node, ngunit magkakaroon ng mas kaunting mga isyu sa workload, at magkakaroon ng mas nababaluktot na disenyo.
At naisip ko lang na itatapon ko iyon, dahil kung sa tingin mo talaga ang lahat ng mga pagbabago sa hardware ay itinuro ko lang ang aking daliri, at pagkatapos ay naisip mo, paano ka mag-scale at magbawas sa bagay na iyon? Pagkatapos ay napagtanto mo na ang mga inhinyero ng database ay, sa aking opinyon kahit papaano, mahusay na hindi nagbabayad. Kaya kung pagninilayan mo lamang ang layer ng hardware, malinaw ang mga hamon sa database. Ngayon ipinapasa ko ito kay Bert, na gagawa tayong lahat na maging edukado.
Eric Kavanagh: Ito na! Bert?
Bert Scalzo: Maraming salamat. Hayaan mo lang akong dumiretso sa mga slide na ito. Marami akong mga slide na dapat dumaan, kaya sa ilan sa mga ito ay maaaring mabilis akong dumaan. Pag-uusapan natin ang tungkol sa "Pagpasa ng Momentum: Paglipat ng Relasyong Higit pa sa Tradisyonal." Hindi na ito database ng iyong ama. Nagbago ang mga bagay, at tulad ng sinabi ng isang naunang tagapagsalita, ang huling anim hanggang pitong taon, ang landscape ay nagbago nang radikal.
Sa aking sarili, gumagawa ako ng mga database mula noong kalagitnaan ng '80s. Nakasulat na ako ng mga libro sa Oracle, SQL Server, benchmarking at medyo ilan pang mga bagay. "Mabilis na nagbabago ang mundo. Malaki ang hindi tatalo sa maliit. Ito ay ang mabilis na matalo ng mabagal. "Idinagdag ko ang" upang umangkop. "Iyon ay mula kay Rupert Murdoch. Naniniwala talaga ako na magiging totoo ito. Hindi ka makakagawa ng mga bagay-bagay sa database sa ginawa mo 10, 15, 20 taon na ang nakakaraan. Kailangan mong gawin ito sa paraang nais ng negosyo ngayon.
Susubukan kong manatili ng isang maliit na pangkaraniwan sa kung ano ang ipinapakita ko, ngunit ang karamihan sa mga tampok na pinag-uusapan ko ay makikita mo sa Oracle, makikita mo sa SQL Server, MySQL, MariaDB at ilan sa iba pang malaki mga manlalaro. Ang rebolusyonaryong database ng rebolusyon, muli akong sumasang-ayon sa mga naunang nagsasalita. Kung tumingin ka mismo sa paligid ng 2010, nagpunta kami mula sa pulang karera ng kotse sa dilaw na kotse. Nagkaroon ng isang makabuluhang pagbabago, at dumating sa 2020, naniniwala ako na makakakita ka ng isa pang radikal na pagbabago. Nasa isang napaka-kagiliw-giliw na oras namin.
Ngayon, ang slide na ito ay susi, na ang dahilan kung bakit naglalagay ako ng isang susi doon. Nandiyan ang lahat ng pagbabagong ito, at sa kaliwa ay mayroon akong teknolohiya, at sa kanang bahagi ay mayroon akong negosyo. At ang tanong ay, alin ang sanhi ng alin, at alin ang sumusuporta sa alin? Mayroon kaming lahat ng mga pagbabagong ito ng hardware: bumababa ang mga disk, bumababa ang laki ng disk, mga bagong uri ng disk, kaya na nasaklaw ng mga naunang nagsasalita. Ang presyo ng pagbagsak ng memorya, lahat ng mga mas bagong bersyon ng mga database. Ngunit sa kanang bahagi, nakakuha kami ng proteksyon at pagsunod sa data, warehousing ng data, intelligence intelligence ng negosyo, analytics, pagpapanatili ng data. Ang magkabilang panig ng ekwasyon ay nagmamaneho, at ang magkabilang panig ng ekwasyon ay gagamitin ang lahat ng mga bagong tampok na ito.
Una sa lahat, nakuha namin ang aming karaniwang SAS spinning disk, hanggang sa 10 terabytes na sila ngayon. Kung hindi mo pa nakita, ang Western Digital, ang HGST ay tinatawag na kanilang helium drive, na umaabot hanggang sa 10 terabytes ngayon. Ang mga gastos sa pag-ikot ng disk ay nagiging mababa. Tulad ng nabanggit nang mas maaga, maaari kang makakuha ng mga solidong estado ng mga disk na umabot sa halos dalawang terabytes, ngunit ang Samsung ay may 20-terabyte unit na paparating. Ang mga gastos ay nagiging makatwiran. Ang isang bagay na sasabihin ko tungkol sa iba ay hindi, ang konsepto ng mga flash disk. Ang PCIe, iyon ang PCI Express, kumpara sa NVMe, marahil o hindi mo narinig ito, hindi pabagu-bago ng memorya ng memorya. Karaniwan, ang NVMe ay magiging kapalit para sa SAS at SATA, at talagang higit pa ito sa isang protocol sa komunikasyon kaysa sa anupaman. Ngunit ang mga disk na ito ay hanggang sa mga tatlong terabytes ngayon.
Maaari mo ring nakita na ang ilang mga drive ng SAS ay may kasamang U.2 na konektor, na kung saan ay uri ng ibang konektor kaysa sa isang SAS o SATA, na sumusuporta sa NVMe na may isang karaniwang disk - ang disk ay may susuportahan din ito, siyempre. At pagkatapos ay ang SATA na may mga M.2 konektor, at ang mga nagsisimula upang makakuha ng NVMe. Sa katunayan, may mga nagtitinda ng kuwaderno na ngayon ay nagbebenta ng mga notebook na mayroong isang NVMe flash disk sa loob nito, at ang mga bagay na iyon ay iiyak kumpara sa teknolohiyang ginamit mo dati.
Ang isang pulutong ng mga tao ay hindi alam kung ano ang lahat ng iba't ibang mga pagkislap na ito. Kung titingnan mo sa kanang sulok sa ibaba, iyon ang halimbawa ng isang M.2. Maaari mong sabihin, "Well gee, mukhang katulad ng drive ng mSATA sa kaliwa nito." Ngunit tulad ng nakikita mo, nakakuha ito ng dalawang gaps sa mga pin bilang kabaligtaran sa isa, at medyo malaki ito. At din, ang M.2 ay maaaring dumating sa tatlong magkakaibang laki.
At pagkatapos ay ang flash ng PCI Express, at ang flash ng NVMe. Ngayon, ang flash ng NVMe ay ang PCI Express, ngunit ang PCI Express ay karaniwang pa rin isang SAS- o SATA-type na magsusupil algorithm na isinulat para sa spinning disk, at ang NVMe ay ang mga algorithm o pamamaraan na partikular na isinulat para sa flash. At muli, makikita mo ang lahat ng ito.
Nag-aalok ang NVMe ng ilang mga bagay. Sa palagay ko ang dalawang pinakamalaking pagpapabuti ay, nasa itaas na kanang sulok, ang latency ay nabawasan ng halos 70 porsyento. Talagang nakita ko kahit na mas mataas kaysa doon. Bilang karagdagan, kung titingnan mo sa kanang sulok sa ibaba, kapag ang iyong operating system ay nakikipag-usap sa NVMe disk, dumadaan ito sa mas kaunting mga antas ng software. Karaniwan, dumadaan ka sa driver ng NVMe na kasama na ngayon sa operating system, at diretso itong nakikipag-usap sa media. Mayroong maraming mga kadahilanan kung bakit ang teknolohiyang ito ay magiging radikal na baguhin ang mundo ng database.
At maraming beses, sasabihin ng mga tao, "Well, gaano kabilis ang NVMe?" Alam mo, ang magagandang lumang araw, noong 2004 at bago, nasasabik kami kung mayroon kaming Ultra-320 SCSI, 300 megabytes bawat segundo. Ang bilis ngayon, marami sa iyo ay marahil sa hibla o InfiniBand, at mga uri ng tuktok. NVMe doon sa kanan, nagsisimula sa kung saan nagtatapos ang kasalukuyang teknolohiya. Ang nakukuha ko ay, ang PCI Express 3.0 na may walong linya na nagsisimula ay halos 8000, at aakyat ito habang nakakakuha tayo ng mga mas bagong bersyon ng PCI Express, mga bersyon ng apat at iba pa. Wala nang pupuntahan ang NVMe maliban sa pataas.
Ngayon, ano ang ilan sa mga bagay na nagbabago sa database? Ngayon sa kanang tuktok na sulok ng aking mga slide, inilalagay ko ang mga dahilan sa negosyo sa palagay ko na lumitaw ang teknolohiya. Sa kasong ito, dahil sa warehousing ng data at dahil sa mga dahilan ng regulasyon para sa pagpapanatili ng data, ang mga database ay nagsisimula na mag-alok ng compression sa kanila. Ngayon, ang ilang mga database ay nag-aalok ng compression bilang isang add-on, ang ilan ay nag-aalok ng ito bilang built-in sa pamantayan, sabihin natin ang edisyon ng enterprise ng kanilang database, at pa ang ilang mga database, tulad ng sa Oracle, ay maaaring magkaroon ng isang mas mahusay na bersyon ng compression na sa, sabihin, ang kanilang Exadata platform, kaya talagang nagtayo sila ng hardware na maaaring suportahan ang isang napaka-dalubhasang compression at ang isa sa Exadata, halimbawa, ay nakakakuha ng 40x na compression rate, at sa gayon ito ay napaka makabuluhan. At sa palagay ko ito ang ipinag-uutos na pagpapanatili ng data, ang mga tao ay nais lamang ng data na mas mahaba. Ang mga negosyo, upang gawin ang mga analytics at BI kailangan nila ang huling data ng 5, 10, 15 taong gulang.
Ngayon ang isa pang tampok na nagsimulang magpakita ng tama sa paligid noong 2008, 2009 na panahon ay pagkahati. Muli, makikita mo ito sa mga database tulad ng Oracle, SQL Server, at sa parehong mga kailangan mong bayaran ito. Sa Oracle kailangan mong bumili ng opsyon ng pagkahati at sa SQL Server kailangan mong maging sa edisyon ng data center. Ito ang iyong tradisyunal na diskarte sa paghati-hatiin at kung ano ang gagawin mo ay mayroon ka ng konsepto ng isang lohikal na malaking mesa sa tuktok doon at kapag naipasok ito sa disk, talagang nasira ito sa mga balde. At makikita mo na ang mga balde ay isinaayos ng ilang mga pamantayan para sa paghihiwalay, karaniwang isinangguni o tinawag ang iyong pag-andar sa pagkahati, at pagkatapos ay gayon din, maaari ka ring sub-pagkahati sa ilang mga platform ng database at maaari kang pumunta nang higit pa.
Muli, sa palagay ko ang parehong warehousing ng data at ang ipinag-uutos na pagpapanatili ng data ay nagtulak dito, at sa ilan sa mga database na maaari kang magkaroon ng hanggang sa 64, 000 partitions, at naniniwala ako sa ilang iba pang mga database kahit hanggang sa 64, 000 sub-partisyon. Pinapayagan ka nitong masira ang iyong data sa mga pinamamahalaang piraso. Bahagi ka rin ng pagkahati sa mga index; ito ay isang pagpipilian, hindi mo na kailangang, ngunit maaari mo ring mahati ang iyong mga index. Ang isa sa mga dahilan upang gawin ito ay maaaring magkaroon ka ng isang sliding window ng data. Nais mong mapanatili ang data ng 10 taon na halaga ngunit upang i-drop ang mga index upang patakbuhin ang pag-load ng batch ngayong gabi, hindi mo nais na ihulog ang mga index sa bawat solong hilera, lamang sa mga hilera na nasa kasalukuyang balde. Ang paghihiwalay ay talagang isang napakahusay na tool na pang-administratibo kahit na ang karamihan sa mga tao ay nag-iisip na ang malaking pakinabang nito ay ang pag-alis ng pagkahati sa pagkahati sa iyong mga plano at samakatuwid ay pabilis ang iyong mga query. Iyon ay talagang uri ng icing sa cake.
Ngayon marahil ay narinig mo ang tungkol sa sharding at baka isipin mo, "Well, bakit mo inilagay ang slide na ito dito?" Ito ay isa sa mga NoSQL - ito ay isa sa mga uri ng Hadoop na uri. Ang Oracle 12c ay naglabas ng dalawa, na kung saan ay hindi pa G8, ngunit kung saan ay ipinapakita o nai-preview na mayroon talagang sharding sa loob nito. Magkakaroon ka ng isang tradisyunal na sistema ng database tulad ng Oracle at magagawa mong maiyak tulad ng ginagawa mo sa modelo ng Hadoop, at sa gayon ay magkakaroon ka ng isa pang diskarte sa paghahati-at-mananakop na hahatiin ang iyong talahanayan ng talahanayan na matalino sa mga pagpangkat sa bawat node at ito ay magiging - tulad ng nakikita mo sa ilan sa iyong mga database ng NoSQL. At talagang MySQL, maaari mong talagang magawa ang gamit ng isa sa kanilang mga diskarte sa kumpol, ngunit darating ito sa isang tradisyunal na database at ang aking hula ay hindi nais ng Microsoft na maiiwan. Ang dalawang ito ay naglalaro ng palaka sa bawat isa sa bawat oras kaya inaasahan kong makita ang sharding sa marahil ang susunod na bersyon ng SQL Server.
Pamamahala ng buhay-ikot ng data, muling ipinag-uutos na pagpapanatili ng data, ngunit para din sa katalinuhan at analytics ng negosyo. Talagang, ito ay isang diskarte na split-and-lupigin, at karaniwang ginagawa ng mga DBA ito nang manu-mano, at iyon ay, "Pupunta ako sa data ng taong ito sa mga mabilis na disk, ang data ng nakaraang taon sa bahagyang mas mabagal na disk, siguro pupunta ako upang mapanatili ang huling dalawang taon bago iyon sa kahit na mas mabagal na mga disk, at pagkatapos ay magkakaroon ako ng ilang pamamaraan sa archival. "Karaniwang hindi na ito nai-tape, karaniwang - mayroon kang ilang uri ng imbakan na naka-kalakip sa network o ilang aparato na maraming ng imbakan at ay, alam mo, epektibo ang gastos ngunit umiikot pa rin ang disk.
At sa gayon maaari mo talagang - pareho sa Oracle at sa SQL Server - maaari kang bumili ng isang pagpipilian kung saan mo tukuyin ang mga patakaran at ito ay nangyayari nang awtomatiko sa background. Hindi mo na kailangang sumulat ng mga script, hindi mo na kailangang gawin. At kung nakita mo ang SQL Server 2016, na lumabas lamang noong Hunyo, mayroong isang bagong tampok na tinatawag na "Stretch Databases" na karaniwang hinahayaan kang gawin - sa kanang sulok doon - maaari kang maglipat mula sa maraming mga layer nang direkta sa ulap at muli ito ay isang tampok na itinayo sa database, sasabihin mo lang tulad ng, "Kung ang data ay higit sa 365 araw na gulang, mangyaring ilipat ito sa ulap at, alam mo, gawin itong awtomatiko para sa akin."
Ito ay magiging isang talagang cool na tampok, sa katunayan iniisip ko na maaaring ito ang makikita natin sa hinaharap, na kung saan ay magkakaroon ka ng mga hybrid na database kung saan pupunta ka upang mapanatili ang ilang lokal at ang ilan sa ulap. Bago ito, nag-iisip ang mga tao, "O, gagawin ko sa premise o gagawin ko sa ulap." Ngayon nakikita natin ang kasal ng dalawang teknolohiya sa ganitong mestiso. Sa palagay ko ito ay magiging medyo malaki at nakuha muna ng Microsoft doon.
Ang pagbabawas, ito ay dahil sa proteksyon at pagsunod sa data. Ngayon sa magandang araw na maaari nating masabi, "Uy, application developer, kapag ipinakita mo ito sa ulat, kapag ipinakita mo ito sa screen narito ang ilang mga bagay sa seguridad na dapat mong suriin at mangyaring, alam mo, ipakita lamang ang data dapat nilang makita o maskara o gawing muli ang data na hindi nila dapat makita. "Well, tulad ng dati, kapag itulak mo ito sa application na hindi ito nagawa sa isang lugar kaya nagagawa nang iba o nagawa ito. hindi ako tapos sa ilang mga lugar. At kaya ngayon nakuha mo na ang kakayahang ito sa iyong mga system sa database.
Ngayon sa SQL Server 2016, ang tampok na ito ay itinayo sa gayon hindi ito isang opsyonal na item sa gastos na nasa karagdagan sa data center, naniniwala ako; at sa Oracle 12 kailangan mong bilhin ang kanilang add-on sa pamamahala ng cycle ng buhay, ngunit ito ay isang bago at muli na ito ay hinihimok ng negosyo. At lalo na dahil pinapanatili mo ang maraming data ngayon, at ginagawa mo ang pagmimina ng data, kaya't ang BI at ang analytics, alam mo na kung sino ang nag-access sa kung ano ang data at tinitiyak na pinapayagan lamang silang makita kung ano pinapayagan silang makita.
Gayundin, tingnan muli, proteksyon at pagsunod sa data. Malalaman mo na ang maraming mga sistema ng database ngayon ay bumubuo ng compression, o paumanhin, nag-encrypt nang direkta sa database at kung ano ang mahalaga tungkol sa encryption na ito, kung titingnan mo ang down arrow at ang pataas na arrow sa diagram na isinusulat nito pababa sa disk na naka-encrypt at pagkatapos ay binabasa ito pabalik sa memorya at i-decrypts ito. Iyon talaga ang isang modelo, mayroong isa pang modelo na, alam mo, talagang ginagawa lamang ito kapag ipinaalam nito ang data sa buong network sa aktwal na aplikasyon ng kliyente.
Sa kasong iyon, kahit na nasa database server pa rin ito sa memorya maaari itong mai-encrypt at naka-decrypted lamang kapag ipinadala ito sa aplikasyon ng kliyente. Mayroong dalawang magkakaibang mga modelo dito at makikita mo ang mga ito sa mga database, at sa katunayan ang isa sa mga database na idinagdag nito kamakailan ay ang MariaDB sa kanilang bersyon 10.X; Naniniwala ako na nasa 10.1 o 10.2 na sila ngayon. At talagang ginawa ko ang ilang benchmarking sa encryption na ito, at upang makuha ang encryption na ito, naranasan ko lamang ang tungkol sa isang 8 porsyento na pagbaba sa throughput o bilis. Sa isang benchmarking test, ang pag-encrypt ay hindi naging sanhi ng marami at sa gayon ito ay isang napaka-kapaki-pakinabang na tampok.
Ngayon, nabanggit namin nang mas maaga tungkol sa flash memory at SSDs at mga bagay na katulad nito. Ang isa sa mga tampok na mayroon ka sa Oracle at SQL Server na hindi napagtanto ng maraming tao ay maaari kang kumuha ng isang flash o SSD na nasa iyong database server at maaari mong sabihin sa database, "Gamitin ito na parang sila ay memorya. Ituring ang RAM bilang kagustuhan, ngunit magpanggap tulad nito ay mabagal na memorya at gamitin iyon bilang isang pinalawig na cache. "Ngayon sa SQL Server 2014 lumabas ito at tinawag na" Buffer Pool Extension, "libre ito. Sa Oracle, lumabas ito sa 11g R2 at tinawag itong "Database Flash Cache" at libre din ito.
Gayunman, ang payo ko ay subukang maingat na subaybayan ang tampok na ito. Sa tuwing gagawin mo ang cache na mas malaki kapag nagpupunta ka upang maghanap, mas matagal. Kung naglagay ka ng isang three-terabyte flash card at sabihin sa database, "Idagdag mo iyon sa iyong memorya, " maaari mo talagang makita na ang isang bagay ay pinabagal dahil sa oras upang tumingin at makita ito sa flash, ito ay isang marumi o malinis? Mayroong isang punto ng pagbabawas ng pagbabalik. Ang payo ko ay muling subukan ang pagsubok na ito, tingnan kung ano ang gumagana para sa iyo, ngunit muli, nasa iyong database at kung sakaling ang Oracle, sa parehong SQL Server at Oracle, naroroon nang ilang taon na.
At pagkatapos ay nagdadala kami sa granddaddy na kung saan ay ang mga memorya ng mga database at iyon ay dahil bumaba ang mga presyo ng database. Ang iba pang kadahilanan na marahil ay akalain mong naganap na ito ay maraming analytics ay nangangailangan ng pagkakaroon ng data na napakabilis maa-access, at sa gayon kailangan itong maging nasa memorya. Alalahanin na ang mga algorithm na ginagamit ng mga database upang ma-access ang data na ito, upang i-compress ito, i-encrypt ito, upang maiimbak ito, alam mo sa ilang mga kaso ang ilang mga database ay maaaring magpatuloy na mag-imbak ng memorya bilang isang hilera.
Sa ilang mga kaso, ang ilang mga database ay maaaring masira ito sa isang haligi na nakatuon at ang dahilan na ginagawa nila ay nakakakuha sila ng isang mas mataas na antas ng compression, sa isang lugar sa paligid ng 11 hanggang 12X sa pamamagitan ng pag-iimbak nito sa hanay ng hanay kumpara sa pagkakasunud-sunod ng hilera. Una itong nagpakita sa SQL Server 2014, tinawag itong "Hekaton." Ito ay radikal na nadagdagan sa SQL Server 2016, makikita nila ito na isinangguni ng ilang magkakaibang mga pangalan at lumabas ito sa Oracle 12c; Sinasabi ko ang pangalawang paglabas dito, hindi R2. Mayroong dalawang magkakaibang paglabas ng Oracle 12c, ang 12.1.0.1 at ang 12.1.0.2. Ito ang pangalawang paglabas ng R1 bersyon ng database.
At ang paraan na iyong tukuyin, ang bagay na nasa-memorya ay pareho sa parehong mga database. Dito maaari mong makita sa kanang tuktok na sulok, lumilikha ako ng isang SQL Server at maaari mong makita ito sabi na may memorya na na-optimize at tibay na pagiging schema lamang. Hindi ako pupunta sa lahat ng mga kahulugan ng syntax na ito, at sa Oracle na ito ay kahit na mas simple, pinapabago mo lang ang isang mesa at nagsabi ng memorya o hindi at maaari mong baguhin iyon. Masasabi ko ngayon na ito ay nasa memorya at bukas ay hindi ito at sa gayon ito ay napaka-kakayahang umangkop.
Gumawa ako ng ilang mga pagsubok sa Oracle na may mga talahanayan ng mga memorya, mayroon akong ilang mga pagsubok na tumagal ng halos 40 minuto upang tumakbo, hanggang doon sa tuktok na hilera. Ngayon ang mahalaga ay sa oras na nakarating ako sa ilalim ng dalawang hilera, nadagdagan ko ang runtime o nabawasan ito, dapat kong sabihin, sa limang minuto humigit-kumulang, at nang tiningnan ko ang kadahilanan ng compression, ang data na nasa memorya ay talagang 3.6 sa 4.6 beses na mas maliit. Mahalaga iyon dahil sa kasong ito gumagamit ako ng format na naka-orient sa haligi at ito ay compression. At kaya hulaan kung ano? Talagang umaangkop ako halos apat hanggang limang beses ng mas maraming data sa aking memorya. Hindi lamang ako nakakakuha ng bentahe ng in-memorya, ang bentahe ng oriented na haligi, ngunit din ang bentahe ng mas maraming data - hanggang sa limang beses na mas maraming data sa cache ng memorya, kaya ito ay isang medyo malakas na pamamaraan. Muli ang Oracle at SQL Server, nais mong tingnan ang mga ito, talagang cool na mga tampok. At kasama iyon, sa palagay ko buksan ko ito sa mga katanungan.
Eric Kavanagh: Well Bert, una sa lahat hindi ka naging selfless sa lahat ng kamangha-manghang edukasyon na ito. Maaari mo bang makipag-usap sa isang minuto lamang tungkol sa kung ano ang ginagawa mo? Dahil nakakuha ka ng ilang mga nagbibigay-daan sa teknolohiya na maaaring mapadali ang iyong pinag-uusapan. Makipag-usap lamang sa isang minuto tungkol sa kung ano ang ginagawa mo at pagkatapos ay kunin sina Dez at Robin sa ekwasyon dito.
Bert Scalzo: Oo, nagtatrabaho ako para sa isang kumpanya na tinatawag na IDERA. Nasa Texas kami, headquarter kami sa Houston, at talagang nakaupo ako sa Austin ngayon ngunit nakabase ako sa Dallas. Gumagawa kami ng mga tool sa database at gumawa kami ng mga tool sa database upang matulungan kang malutas ang mga problema. Ang problemang iyon ay maaaring maging isang bagay na kasing simple ng pagiging produktibo kung saan mayroon kaming isang tool na tinatawag na DBArtisan na hinahayaan mong gawin ang iyong mga gawain sa administratibong database at ito ay isang tool upang hayaan kang pamahalaan ang 12 iba't ibang mga platform sa database. Maaari kong pamahalaan ang SQL Server, maaari kong pamahalaan ang Oracle, maaari kong pamahalaan ang MySQL, DB2, Postgres, at gumagamit ako ng isang tool, isang maipapatupad, isang disenyo ng GUI at isang pare-pareho na hanay ng mga workflows. Gumagawa din kami ng mga tool upang gawin ang pagsunod, mayroon kaming isang tool na tinatawag na SQL Compliance Manager upang matulungan kang matugunan ang iyong mga pangangailangan sa pagsunod. Ang isa pang tool na tinatawag na SQL Security, kaya sinubukan naming gawin ang mga tool na makakatulong sa iyo na maging epektibo at mahusay, at kung ano ang talagang maganda kung pupunta ka sa aming website, mayroon kaming isang buong bungkos ng freeware out doon, kaya kung wala pa, go download - Sa palagay ko nagustuhan namin ang 20 o 25 freewares. Mayroong ilang mga talagang mahusay na freeware na bagay sa labas tulad ng isang SQL Server at isang Windows Help Check na talaga titingnan kung ano ang nakuha mo at sasabihin sa iyo kung mayroon ka bang mga isyu o mga bagay at ito ay libre.
Eric Kavanagh: At talagang mabait ka-
Bert Scalzo: Tiyak na ang unang bagay -
Eric Kavanagh: Nakikipag -usap ka sa heterogeneity sa palengke ngayon, dati ay naging uri ng isang sukat na sukat-lahat ng equation na sa katunayan naaalala ko ang pakikipanayam kay Dr. Michael Stonebraker pabalik noong noong 2005, habang nagpapatuloy siya isang malaking pagtulak sa pakikipag-usap tungkol sa hatol sa kilusang database na nakatuon sa haligi at pinag-uusapan niya ang lahat tungkol sa kung paano pinangungunahan ang isang laki-laki-lahat ng modelo ng pamamagitang para sa maraming taon, at hinuhulaan niya na ang lahat ay magbabago, at ang batang lalaki ay tama siya tungkol sa na. Ngayon mayroon kaming talagang magkakaibang at kagiliw-giliw na kapaligiran na may maraming iba't ibang mga pagpipilian at pagkakataon, ngunit kailangan mo ng isang tao upang pamahalaan ang lahat ng iyon at tila sa akin na ang iyong kumpanya ay nakatuon nang lubos sa paglutas ng mga problema sa matematika, sa gayon pagiging isang enabler ng header ng heterogeneity, di ba?
Bert Scalzo: Ganap. Ibig kong sabihin ay palaging magiging mga DBA na nagsasabing, "Ayokong gumamit ng isang tool ng GUI, ginagawa ko ang lahat ng mga script, " alam mo? Sa palagay nila ang mga ito ang superman type ng DBA at maayos iyon ngunit para sa karamihan sa atin ang mga tao, nais naming magawa ang trabaho at - alam mo, gumagamit ako ng Microsoft Word upang isulat ang aking mga dokumento. Ginagamit ko ang Microsoft Outlook upang gawin ang aking email. Ibig kong sabihin, mayroon akong mga tool para sa paggawa ng mga gawain. Kami ay nagtatayo ng parehong uri ng konsepto, nagtatayo kami ng mga tool para sa mga tagapangasiwa ng database at mga developer upang matulungan silang tumuon sa nais nilang gawin at hindi kung paano nila ito gagawin.
Eric Kavanagh: Makatuwiran iyon, ngunit hayaan mong ibalik kita sa aming mga dalubhasa, at ang mga tao ay malaya na sumisid. Mayroon kaming ilang mga komento na nagmula sa madla. Siguro, si Dez, isang pares ng mga katanungan at Robin ng ilang mga katanungan?
Dez Blanchfield: Oo naman. Isa sa mga unang katanungan na nais kong ihagis sa iyo, binigyan ng napakalaking span ng karanasan na nakuha mo, nakakita ka ba ng isang punto sa oras na malapit na ang alinman sa mga ito ay babagal? O sa palagay mo ba talaga kami sa entry point ng patuloy na paglago ng linya ng pagbabago? Sa palagay ko ang isa sa mga pinakadakilang isyu na kinakaharap ng mga kumpanya, at pagkatapos ay walang tigil ang mga tao na nagsisikap na suportahan ang teknolohiya na ipinagkaloob sa mga kumpanyang iyon upang patakbuhin ang kanilang mga negosyo, ay na ang rate ng pagbabago ay napakapangit na hindi lamang nila napapanatili ang lahat ang iba't ibang mga tampok, at software, at mga system, at mga balangkas, at arkitektura, at bagong code na darating, at pagkatapos ay ang hardware sa ilalim nito, nakikita mo ba ang kasalukuyang rate ng pagbabago na nagpapabagal kaagad? Ibig kong sabihin, nakikipag-ugnayan ka sa tulad ng isang malawak na hanay ng mga platform na may buong IDERA suite, papabagal ba tayo sa lalong madaling panahon o nag-uuri ba tayo sa nakatutuwang kargada ng kargamento ng tren sa loob ng mahabang panahon?
Bert Scalzo: Sa palagay ko nasa una kami ng 20 porsyento ng curve ng paglaki na iyon at mayroon kaming mahabang paraan upang pumunta at may dalawang bagay na nagtutulak dito. Ang teknolohiya ay patuloy na umuusbong. Nabanggit mo ang ilan sa mga bagong uri ng memorya na lalabas, magiging kamangha-manghang iyon. Ang Samsung ay magkakaroon ng 20-terabyte flash drive dito real sa lalong madaling panahon. Na magbabago ng mga bagay. Nakuha namin ang lahat ng mga database ng NoSQL at cloud, ito ay magpapatuloy lamang sa pagpunta. Ang isang bagay na uri ng nakakatawa, gayunpaman, ay kapag tiningnan ko ang mga database tulad ng Oracle at SQL Server at ilan sa iba pa, hindi na talaga sila nakakabit ng mga database. Maaari kong ilagay ang hindi naka-istrukturang data sa Oracle at pinapanatili pa rin ang pagsunod sa ACID. Kung sinabi mo sa akin na 20 taon na ang nakalilipas, sinabi ko lang na nasa droga ka.
Dez Blanchfield: Oo, oo, cool sila. Well kahit na ngayon ang mga makina na nakakuha ng napakagandang mga angkop na niche na tulad ng GIS, mas mahusay kaysa sa katutubong kakayahan ngayon. Gumawa ka ng maraming magagandang puna tungkol sa mga hamon na kinakaharap ng mga DBA at sa iba't ibang oras ng mga DBA na inaasahan naming makita sa paligid ng lugar, ngunit ano ang hitsura ng mundo sa uri ng layer na iyon ng negosyo na iyong kinakaharap? Ibig kong sabihin, ito ang mga tao na gumagamit ng iba't ibang mga platform mula sa iyong diagnostic manager, hanggang sa mga tool ng imbentaryo, at sa lahat ng paraan hanggang sa pag-bighing sa nakagagalit, paano ang mga DBA na nakaya sa pagbabagong ito at kung paano sila nakakasunod - alam mo, ano ang ginagawa nila sa iyong mga tool upang uri ng pakikitungo sa makabuluhang pagbabagong ito sa kanilang landscape?
Bert Scalzo: Well, babalik ako halos 20 taon na ang nakalilipas, pagkatapos sasabihin ko na ang mga DBA ay naglutas ng isang napaka-tiyak na papel sa isang samahan. Karaniwan silang nakikipagtulungan sa isang database platform, marahil dalawa, at pinamamahalaan nila ang isang medyo maliit na bilang ng mga database. Ngayon ay pasulong na ngayon at ang tagapangasiwa ng database, aktwal na niyang malalaman ang 10 mga platform sa database. Siya ang namamahala, at hindi ito biro, sa ilang mga kaso libu-libong mga database; iyan ay higit pa sa mundo ng SQL Server o sa MySQL mundo. Ngunit nasa mundo ng Oracle maaari silang pamamahala ng daan-daang mga database. At sa gayon nakuha nila ang lahat ng mga bagong tampok na ito, lumabas na ang lahat ng mga bagong platform na ito, at nakuha nila ang lahat ng mga database na kanilang responsable. Naghahanap sila ng mga tool upang paganahin ang kanilang pagiging produktibo at upang matulungan silang malaman ang ilang mga bagay.
At bibigyan kita ng isang halimbawa - kung nais kong kunin ang isang talahanayan ito ay isang medyo malabo syntax, at kung nais kong sub-pagkahati ito, ang syntax ay makakakuha ng mas mahirap. Alam ko ang gusto kong gawin, nais kong lumikha ng mga balde. Kung mayroon akong isang tool tulad ng DBArtisan na nagsasabing, "Hoy, narito ang isang magandang screen na nagbibigay-daan sa iyo na tumutok sa kung ano ang sinusubukan mong gawin kaysa sa kung paano mo sinusubukan itong gawin, at oh sa pamamagitan ng paraan, itulak ang Ipakita ang pindutan ng SQL kapag tapos ka na at ipapakita namin sa iyo kung ano ang SQL upang maaari mong simulan upang talagang matuto at makabisado ito. "
Hinahanap ng mga DBA na ang mga tool na makakatulong sa kanila na makapagtapos ng trabaho ngunit makakatulong din na ituro sa kanila ang lahat ng mga bagong bagay na kanilang ginagamit at pareho ang magiging totoo - sabihin natin na ako ay isang Oracle na tao at pumunta ako sa MySQL at sabihin, "Okay, lumikha ng isang database, DBArtisan. Ngayon ipakita sa akin ang SQL dahil nagtataka ako kung ano ang kagaya ng paglikha ng isang database sa MySQL at natutunan ko lang ang syntax. "At sa gayon hindi lamang namin tinutulungan silang magtrabaho sa buong database, din namin turuan ang mga ito sa buong database.
Dez Blanchfield: Ito ay nakakakuha ng mas kawili-wiling kapag lumabas ka sa ilan sa mga mas moderno - o hindi mas moderno, hindi iyon isang makatarungang bagay - ngunit sa sandaling ang isang database ng isang database ay isang database. Sa mga araw na ito nakikita ko ang lahat ng iyong pinag-uusapan doon kasama ang idinagdag na hamon na ang mga stacks ng teknolohiya na tradisyonal naming nakikita mula sa mga vendor at pinag-uusapan mo ang bukas na mapagkukunan dito at mahusay din sila. Hindi lamang makitungo sa mga makina ng database at mga wika ng query, ngunit nakitungo din sila sa mga uri ng data, ang nakabalangkas at hindi nakabalangkas, alam mo, ang hamon ng pagkakaroon upang harapin ang lahat mula sa malayong dulo ng spectrum ng isang multi-petabyte HDFS kapaligiran sa maliit na maliliit na lalagyan, at mga file ng packet at iba't ibang mga format ng log file.
At sa palagay ko ay may isang bagay na ngayon na nakikita natin kung saan walang tao, kahit gaano pa ang isang superman, superwoman, anuman ang iniisip nila na sila, sila ay pisikal, hindi nila maisip ang isip sa rate ng pagbabago at ang laki ng mga pagkakaiba-iba. Sa palagay ko, ang suite ng mga tool na iyong inaalok ngayon ay makakarating sa isang punto kung saan halos mapupunta sila sa isang default na hanay ng maraming mga paraan upang hindi namin mapatakbo ang mga kapaligiran ng database na nakuha namin nang wala sila dahil sa pisikal lamang hindi maaaring itapon na maraming mga katawan sa kanila. Natuwa talaga ako sa iyong presentasyon. Pupunta ako kay Dr. Robin Bloor, sigurado akong marami siyang mga katanungan na ihahatid sa iyo.
Robin Bloor: Okay. Well tiyak na mayroon akong mga katanungan. Bert, hindi ko alam kung saan ka pupunta - nagkaroon ako ng isang tunay na kagiliw-giliw na pag-uusap ng ilang araw na ang nakaraan kung saan sinimulan ng isang tao na sabihin sa akin ang tungkol sa pinakabagong proteksyon ng data ng DU, at tila sa akin mula sa kung ano ang sinasabi nila na ito ay hindi mapaniniwalaan o kapani-paniwala draconian sa mga tuntunin ng mga bagay na iginiit nila. Naisip ko kung talagang titingnan mo iyon; ito ba ay isang bagay na pamilyar ka?
Bert Scalzo: Ganap. Oo.
Robin Bloor: 2016, Okay, sabihin sa amin ang tungkol dito.
Bert Scalzo: At talagang -
Robin Bloor: Malalim na kawili-wili.
Bert Scalzo: Talagang nagtrabaho ako para sa isang habang para sa isang flash vendor, sa kanilang lugar ng database na tumutulong sa kanila na bumuo ng mga produkto ng flash para sa mga database, at masasabi ko sa iyo na ang draconian ay bumababa. Ang ibig kong sabihin ay, kung naalala mo ang aking isang slide, sinabi ko sa ilang mga database na gagawin nito ang pag-encrypt ngunit inilalagay ito sa memorya ng server at sa ilang mga database ng encryption - naka-encrypt pa rin ito sa memorya ng server, ito ay makakakuha ng decrypted kapag mapapadala ito sa kliyente. Kung ano ang makikita mo rin ang ilan sa mga pamantayang ito ng gobyerno, lalo na ang Kagawaran ng Depensa o militar dito sa US, dinadaanan din nila ang antas ng flash at nais nilang malaman hindi lamang na sinusuportahan mo ang pag-encrypt at decryption sa ang iyong hardware, ngunit kung ang isang tao ay nagnanakaw ng mga chips na - alam mo, hinila ang mga ito sa bagay, sa labas ng iyong server, na kung ano ang mayroong naka-encrypt at kaya kahit na nakuha nila ang imbakan ay hindi maaaring ito at gagawin nila lahat ng mga paraan hanggang sa aktwal - hindi sa flash bahagi mismo ngunit hanggang sa mga indibidwal na chips. Nais nilang malaman na ang chip sa pamamagitan ng chip, lahat ay naka-encrypt.
Robin Bloor: Wow. Ibig kong sabihin ay may maraming mga bagay na - alam mo, sa palagay ko ay isa o dalawang slide lamang na iyong dinala tungkol dito, ngunit ito ay isang bagay, isang senaryo na sa palagay ko ay talagang kawili-wili. Halimbawa, ang muling pagsasaayos ng impormasyon, kailangang maging isang maliit na matalino kaysa sa pag-mask ng iba't ibang mga patlang sapagkat lalo na sa pag-aaral ng makina sa kasalukuyan, maaari kang gumawa ng mga bagay na nakalaan na nagbibigay-daan sa iyo upang maipakita ang impormasyon na hindi mo maaaring lumawak.
Kung sinusubukan mong protektahan, sabihin natin ang impormasyong pangkalusugan, pagkatapos iyon ay isang napaka, napaka tuntunin ng draconian sa US na may kaugnayan sa impormasyong pangkalusugan, ngunit maaari mo talagang, gamit ang iba't ibang mga diskarte sa pag-aaral ng makina, maaari mong madalas na mag-ehersisyo kung sino ang impormasyon sa medikal ng isang tao talaga. Naisip ko lang kung mayroon kang anumang bagay na sasabihin tungkol sa iyon dahil sa palagay nila lahat ay isang kagiliw-giliw na lugar.
Bert Scalzo: Oo, talagang, at ginagamit ko lang ito bilang halimbawa, hindi ko sinusubukan na sabihin ang isang database ay mas mahusay kaysa sa isa pa, ngunit ito ay isang napakahusay na halimbawa para sa iyong hiniling. Sa Oracle, kung hindi ako pinapayagan na makakita ng isang hilera ng data halimbawa, tulad ng hindi ako pinapayagan na makita ang talaang medikal ng John Smith. Sa Oracle kung sasabihin ko, "Piliin ang talaang iyon, " mai-block ako o papayagan akong makita kung ano ang pinahihintulutan kong makita at ito ay muling isasagawa. At kung sasabihin ko, "Pumili ng star ng account mula sa talahanayan kung saan katumbas ng John Smith, " Kukuha ako ng zero.
Sa SQL Server, magagawa nito ang redaction ngunit mayroon itong ilang mga butas. Kung sasabihin ko, "Pumili ng star ng account mula sa talahanayan kung saan katumbas ito ng John Smith, " Babalik ako sa isa, kaya alam kong mayroong isang John Smith. Ang isa ay mas ligtas kaysa sa isa pa. Ngayon inaasahan kong ayusin nila iyon, palagi silang naglalaro ng palaka ng palaka sa bawat isa. At muli, hindi ko sinusubukang pag-iba-ibahin ang pagitan ng mga database maliban sa upang ipakita ang isang halimbawa ng - tingnan kung ano ang pinag-uusapan natin ngayon, isang bagay na kasing simple ng piling account ay dapat din i-cut ng redaction, kahit na, technically nagsasalita, wala namang nababago maliban sa pagkakaroon ng hilera.
Robin Bloor: Oo, tama. Iyon ay uri ng kawili-wili. Ibig kong sabihin, isa pang pangkalahatang tanong dahil hindi ako nakakuha ng maraming oras, ay talagang tungkol sa mga pagpapabuti. Ibig kong sabihin na napunta ka sa isa kung saan alam ko na ipinakita mo sa amin ang mga halimbawa ng iba't ibang mga resulta ng pagsubok na iyong pinatatakbo - sa palagay mo ba na ang tradisyonal na mga database, tawagan natin silang mga nangingibabaw na database, SQL Server at Oracle, gawin mo isipin na sila ay mananatiling maaga sa pagtatapos? O sa palagay mo ay talagang mahuli sila ng isa o iba pang iba't ibang uri ng pagkagambala sa palengke na talagang tatakbo para sa kanila? Ano ang iyong opinyon?
Bert Scalzo: Mayroon akong isang opinyon at ito ay - alam mo, muli kong sasabihin na ito ang aking opinyon - Microsoft halimbawa, sa panahon ng post-Ballmer ay pinapabilib lamang ang buhay na impiyerno na wala sa akin. Ibig kong sabihin na ito ang database ng kahabaan ng pagkuha ng SQL Server sa Linux, pagkuha ng. NET sa Linux, pagkuha ng PowerShell sa Linux; Hindi ko akalain na ang mga tradisyunal na nagtitinda ng database ay maiiwan. Sa palagay ko napagpasyahan nila, "Hoy, hayaan ang mga bagong lalaki, ang mga startup ay tumutukoy ng isang bagay. Ipaalam sa kanila kung ano ang sharding at kung paano ito dapat gawing perpekto, at sa sandaling nagawa na nila ang lahat ng pananaliksik at pag-unlad, alam natin nang eksakto kung ano ang nais ng mga gumagamit, ngayon dagdagan natin ang sharding sa Oracle. "Sa palagay ko sila ay nakakakuha ng matalino at nagsasabing, "Hoy, ang pangalawa o pangatlo ay hindi masama kapag ikaw ang nangingibabaw na manlalaro dahil kung gayon hindi ka lilipat ng mga tao sa iyo."
Robin Bloor: Oo, ang ibig kong sabihin ay isang diskarte na ginamit. Ibig kong sabihin ay ginamit ito ng IBM at ang kabuuan ng - para sa kabuuan ng kanilang mga saklaw ng produkto at nag-rate ito nang makatwiran nang maayos hanggang sa may isang tao na may isang bagay na ganap lamang sa pader na naisip ng sinuman, ngunit hindi mo maaaring planuhin laban pa rin.
Mga tanong mula sa madla, Eric?
Eric Kavanagh: Oo, ngunit mayroon kang oras na iniisip ko para lamang sa isa marahil at alam kong tatakbo si Bert. Mayroong isang bagay sa dito tungkol sa - okay, ang sharding architecture sa Oracle 12c ay isang indikasyon ng - o kung ano ang isang indikasyon ng iyong opinyon, ano sa palagay mo ang nangyayari doon?
Bert Scalzo: Well, ang Oracle ay sumisipsip o / at nag-aalok ng lahat na lahat ng iba pang mga nagtitinda ng database. Halimbawa, maaaring maglagay ako ng hindi naka-istrukturang data sa Oracle. Hindi ko alam kung paano mo mailalagay ang hindi naka-istraktura na data at pagkatapos ay tawagan itong isang relational database, kaya hindi ito magkakaroon ng kahulugan, ngunit maaari mong. At ngayon si Oracle ay nagdaragdag ng sharding, kaya sinasabi ni Oracle, "Alam mo kung ano? Anuman ang nais ng merkado, gagawin namin ang aming alok ng database dahil gusto ng merkado kung ano ang nais ng merkado at nais naming maihatid ang solusyon, nais namin na manatili sila sa amin. "
Sa palagay ko makakakita ka ng mga karagdagang item. Hindi ako magulat na makita ang pag-kumpol ng tulad ng Hadoop ng mga database node hindi sa isang Oracle rack o tunay na kumpol ng aplikasyon, ngunit talaga sa higit sa isang tradisyunal na kumpol na Hadoop na uri na ginagawa ang shering na iyon. At sa palagay ko magagawa mong mag-deploy ng isang database tulad ng Oracle na gusto mo ng isang Hadoop, at magpapatuloy ang mga uri ng mga uso na ito. Ang mga malalaking database vendor, gumawa sila ng bilyun-bilyong dolyar at hindi nila nais na mawala ang kanilang merkado, kaya handa silang umangkop sa anuman o magpatibay ng anuman.
Eric Kavanagh: Well, alam mo, nakakatawa dahil sinunod ko ang mga open-source na mga nagtitinda sa loob ng kaunting oras at nagtaka ako sa lahat ng iyon habang gaano kalaki ang epekto nito sa tradisyunal na teknolohiyang closed-door, at pansamantala sigurado na nadama tulad ng mga bukas na mapagkukunan ay gumagawa ng ilang mga seryosong daanan, at ngayon habang tinitingnan ko ang palengke nakikita ko ang uri ng iyong sinasabi, na ang mga malalaking tao ay nagawa ang kanilang matematika, pinasan ang kanilang mga lapis at naisip nila kung paano maaari silang maghabi ng maraming bagay na iyon sa kanilang mga arkitektura. Kung ito man ay IBM, o Oracle, o SAP - Nasa loob lang ako ng SapphireNow Conference noong nakaraang buwan at si Steve Lucas, na pinuno ng kalahati ng kumpanya na iyon, ipinagmamalaki na isinasama ngayon ng SAP sa kanilang platform ng HANA cloud, mas bukas na mapagkukunan na bahagi kaysa sa alinman sa kanilang mga katunggali. Kung gagawin mo ang matematika sa na, ito ay isang medyo kahanga-hangang pahayag at sinabi nito sa akin ang mga malalaking tao ay hindi pupunta saanman anumang oras sa lalong madaling panahon.
Bert Scalzo: Hindi, gugustuhin kong pareho ang aking pera. Ibig kong sabihin kung titingnan mo, ang stock ng Microsoft kamakailan ay halos $ 50 at, alam mo, ilang taon na ang nakalilipas ay nasa 25. Hindi mo na doble ang iyong presyo ng stock sa isang maikling panahon maliban kung gumagawa ka ng mabubuting bagay at, ikaw alam, mula sa paggawa ng lahat mula sa Windows 10 na libre para sa unang taon sa lahat ng iba pang mga matalinong bagay na ginagawa nila, ang tampok na ito ng database na nasa palagay ko ay kahanga-hanga lamang. Sa palagay ko kung ano ang mangyayari ay maraming tao ang magtatapos sa Azure, hindi direkta, hindi tulad ng sinabi nila, "Ilipat natin ang aking database patungo sa Azure." Ito ay pagpunta sa paglipat doon doon magically dahil pupunta itong mai-archive doon sa paggamit ng bagong tampok na database ng kahabaan na ito at sa gayon ang pag-aampon ng Azure ay pupunta lamang sa skyrocket.
Eric Kavanagh: Well iyon ang isa sa mga uso sa merkado na kahit na nakikita ko, kahit sa iyong Mac. Sa pagpasok mo sa iyong Mac upang makatipid ng ilang mga dokumento, sila ngayon - at ang mga mas bagong mga Mac ay sinusunod lamang sa ulap, di ba? Ibig kong sabihin, mayroong maraming kahulugan sa diskarte na iyon at tinitingnan ko rin ito at pumunta, "O sige guys, sinusubukan mong akitin ako ng piraso sa iyong kalangitan, at pagkatapos ay balang araw kapag nais kong manood ng ilang pelikula kung ang aking credit card ay nag-expire na ako ay magkakaroon ng problema. "
Bert Scalzo: Oo, ngunit ginagawa mo ito sa Facebook.
Eric Kavanagh: Oo. Totoo yan.
Bert Scalzo: Inilagay mo ang lahat sa Facebook.
Eric Kavanagh: Well, hindi masyadong lahat.
Bert Scalzo: Hindi, ibig sabihin ko-
Eric Kavanagh: Oo, sige.
Bert Scalzo: Ang mga panlipunang uso na ito ay umaabot sa mga negosyo. Ngayon ang mga negosyo ay mayroon pa ring maraming iba pang mga bagay na kailangan nilang gawin, ngunit nakikita nila ang mga uso na ito at ginagawa nila ang parehong uri ng mga bagay. Hindi ko nakikita ang alinman sa Oracle o Microsoft na umalis. Sa katunayan, bibibili ako ng stock sa parehong oras tuwing may sumawsaw.
Eric Kavanagh: Oo, talaga. Well mga tao, pumunta sa idera.com, IDERA dot com. Tulad ng sinabi ni Bert, mayroon silang isang buong grupo ng mga libreng bagay-bagay doon at isa ito sa mga bagong uso sa palengke - bigyan ka ng ilang mga libreng bagay upang i-play sa paligid, kumuha ka ng baluktot, at pagkatapos ay pupunta kang bumili ng totoong bagay.
Mga pulutong, ito ay isa pang Hot Technology. Salamat sa iyong oras ngayon, Bert, Dez siyempre, at si Robin na rin. Makikipag-usap kami sa iyo sa susunod na linggo, mga tao, maraming mga bagay na nangyayari. Kung mayroon kang anumang mga ideya, huwag mag-atubiling mag-email sa iyo ng tunay na. Makikipag-usap kami sa iyo sa susunod na mga tao, mag-ingat. Paalam.