Talaan ng mga Nilalaman:
Malaking data, ang nakamamanghang pangalan para sa napakalaking dami ng nakabalangkas, hindi nakabalangkas o semi-nakabalangkas na data, ay kilalang-kilala mahirap makuha, mag-imbak, pamahalaan, magbahagi, mag-aralan at maglarawan, kahit na gamit ang tradisyonal na database at software application. Iyon ang dahilan kung bakit ang malaking teknolohiya ng data ay may potensyal na pamahalaan at maproseso ang napakalaking dami ng data nang epektibo at mahusay. At ito ay Apache Hadoop na nagbibigay ng balangkas at mga nauugnay na teknolohiya upang maproseso ang malalaking set ng data sa mga kumpol ng mga computer sa isang ipinamamahagi na paraan. Kaya, upang maunawaan ang malaking data, kailangan mong maunawaan nang kaunti tungkol sa Hadoop. Narito, tingnan natin ang mga nangungunang termino na maririnig mo patungkol sa Hadoop - at kung ano ang ibig sabihin.
Webinar: Big Iron, Kilalanin ang Big Data: Liberating Mainframe Data with Hadoop & Spark Magrehistro dito |
Ngunit Una, Tingnan ang Paano Gumagana ang Hadoop
Bago pumasok sa Hadoop eco-system, kailangan mong maunawaan nang malinaw ang dalawang pangunahing mga bagay. Ang una ay kung paano naka-imbak ang isang file sa Hadoop; ang pangalawa ay kung paano naproseso ang naka-imbak na data. Ang lahat ng mga teknolohiya na nauugnay sa Hadoop higit sa lahat ay gumagana sa dalawang lugar na ito at gawin itong mas madaling gamitin. (Kunin ang mga pangunahing kaalaman kung paano gumagana ang Hadoop sa Paano Nakakatulong ang Hadoop na Malutas ang Malaking Problema sa Data.)
Ngayon, sa mga termino.