Talaan ng mga Nilalaman:
Kahulugan - Ano ang ibig sabihin ng Apache Kudu?
Si Apache Kudu ay isang miyembro ng open-source na Apache Hadoop ecosystem. Ito ay isang bukas na mapagkukunan ng imbakan ng engine na inilaan para sa nakabalangkas na data na sumusuporta sa mababang latency random na pag-access kasama ang mahusay na mga pattern ng pag-access sa pag-access. Ito ay dinisenyo at ipinatupad upang tulay ang agwat sa pagitan ng malawak na ginagamit na Hadoop na ipinamamahaging File System (HDFS) at HBase NoSQL Database. Bagaman maaaring patunayan pa rin ang mga sistemang ito, ang Apache Kudu ay maaaring magsilbi sa maraming mga karaniwang mga pag-ehersisyo dahil maaari itong kapansin-pansing gawing simple ang kanilang arkitektura.
Ipinapaliwanag ng Techopedia si Apache Kudu
Pangunahing binuo si Apache Kudu bilang isang proyekto sa Cloudera. Karamihan sa mga kontribusyon hanggang sa ngayon ay sa pamamagitan ng mga developer na pinagtatrabahuhan ni Cloudera. Sa panahon ng pagpapalaya nito, ang mga binaries lamang ng kaginhawaan ay kasama sa mga repositori ng Cloudera, gayunpaman pinagtibay nito ang proseso ng paglabas ng mapagkukunan ng Apache Software Foundation (ASF) nang sumali sa incubator. Ito ay partikular na idinisenyo para sa mga kaso ng paggamit na nangangailangan ng mabilis na analytics sa mabilis na data. Ito ay ininhinyero upang samantalahin ang susunod na henerasyon na hardware at pagproseso ng memorya. Ito ay nagpapababa ng query sa latency ng makabuluhang para sa Apache Impala at Apache Spark. Ito ay namamahagi ng data sa pamamagitan ng pag-iimbak ng kolum ng haligi o sa pamamagitan ng pahalang na pagkahati, pagkatapos ay tumutulad sa bawat pagkahati gamit ang Raft consensus sa gayon ay nagbibigay ng mababang kahulugan ng oras-sa-pagbawi at mababang mga haba ng buntot.
Kahit na Ang Kudu ay isang produkto na idinisenyo sa loob ng konteksto ng ecosystem ng Apache Hadoop, sinusuportahan din nito ang pagsasama sa iba pang mga proyekto ng mga analytics ng data kapwa sa loob at labas ng ASF.
Ang Apache Kudu ay nagpapatunay na maging mahusay dahil maaari nitong iproseso ang mga real-time na mga analyt na workload sa buong isang nag-iimbak na layer, kaya nagbibigay ng kakayahang umangkop sa mga arkitekto upang matugunan ang isang mas malawak na iba't ibang mga kaso ng paggamit nang walang mga kakaibang workarounds.