Talaan ng mga Nilalaman:
Ang SQL sa Hadoop ay isang pangkat ng mga tool ng analitikal na application na pinagsasama ang SQL-style querying at pagproseso ng data sa pinakabagong mga elemento ng data ng balangkas ng Hadoop. Ang paglitaw ng SQL sa Hadoop ay isang mahalagang pag-unlad para sa malaking pagproseso ng data dahil pinapayagan nito ang mas malawak na mga grupo ng mga tao na matagumpay na gumana sa balangkas ng pagpoproseso ng data ng Hadoop sa pamamagitan ng pagpapatakbo ng mga query ng SQL sa napakalaking dami ng malaking data na mga proseso ng Hadoop. Malinaw na, ang balangkas ng Hadoop ay dati nang hindi naa-access sa mga tao, lalo na sa mga tuntunin ng mga kakayahan sa pagtatanong nito. Batay sa pag-unlad, maraming mga tool ang nasa mga gawa na nangangako upang mapagbuti ang pagiging produktibo ng mga negosyo pagdating sa pagproseso at pagsusuri ng malaking data na may kalidad at bilis. Hindi rin kinakailangan na mamuhunan ng maraming sa pag-aaral ng tool, tulad ng dapat gawin ng tradisyonal na kaalaman ng SQL.
Kahulugan ng SQL sa Hadoop
Ang SQL sa Hadoop ay isang pangkat ng mga application na nagbibigay-daan sa iyo upang patakbuhin ang mga query sa estilo ng SQL sa malaking data na naka-host sa pamamagitan ng balangkas ng pagpoproseso ng data ng Hadoop. Malinaw, ang data querying, pagkuha at pagsusuri ay naging mas madali sa pagdaragdag ng SQL sa Hadoop. Dahil ang SQL ay orihinal na dinisenyo para sa mga relational database, kailangang baguhin ito ayon sa modelo ng Hadoop 1 na binubuo ng MapReduce at ang Hadoop na ipinamamahaging File System (HDFS), at ang modelo ng Hadoop 2 na walang MapReduce at HDFS.
Ang isa sa mga pinakaunang pagsisikap na pagsamahin ang SQL sa Hadoop na nagresulta sa paglikha ng bodega ng data ng Hive kasama ang software ng HiveQL na maaaring isalin ang mga query ng estilo ng SQL sa mga trabaho sa MapReduce. Pagkatapos nito, maraming mga aplikasyon ay binuo na maaaring gumawa ng mga katulad na trabaho. Kilala sa mga kasunod na kasangkapan ay ang Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark), at Tez (Hive on Tez).