Hadoop TeraSort tanlovida g‘olib chiqdi 2008 yilda
ma’lumotlarni so‘rash va tahlil qilish uchun Apache Hadoop- ning tepasida qurilgan ma’lumotlar ombori dasturining loyihasi yaratildi 2010 yilda
HTFT Hadoop taqsimlangan fayl tizimi Hadoop taqsimlangan fayl tizimi HTFT
bu xaritani yozish va qisqartirish funksiyalaridan iborat dasturiy model MapReduce
MapReduce bu xaritani yozish va qisqartirish funksiyalaridan iborat dasturiy model
Hive - bu Hadoop Distributed File System (HDFS) ustida ishlab chiqilgan ETL va ma’lumotlarni saqlash vositasi Hadoop Distributed File System (HDFS) ustida ishlab chiqilgan ETL va ma’lumotlarni saqlash vositasi Hive
Hive da avval jadvallar va ma’lumotlar bazalari yaratiladi, so‘ngra ma’lumotlar ushbu jadvallarga yuklanadi.
Hive ma’lumotlar ombori sifatida jadvallarda saqlanadigan ma’lumotlarni boshqarish va so‘rov hosil qilish uchun mo‘ljallangan.
Jadval tasnifi DECRIBE
;
Comments (only Hue and Scripts) Using “–“
Hive funksiyalarini ko‘rsatish SHOW FUNCTIONS;
Funksiya tasnifi DESCRIBE FUNCTION ;
Jadvalni o‘chirish DROP TABLE
MapReduce algoritmi …. muhim vazifani o‘z ichiga oladi 2
…. ma’lumotlar to‘plamini oladi va ularni boshqa ma’lumotlar to‘plamiga o‘zgartiradi, bu yerda alohida yelementlar katakchalarga bo‘linadi (kalit / qiymat juftlari) Map
…. dan chiqishni kirish sifatida qabul qiladigan va ma’lumotlar katakchalarini kichikroq katakchalarga birlashtirish vazifani bajaradi Map
…..vazifasi har doim xarita ishidan keyin bajariladi kamaytirish (Reduce)