AMALIY MASHG‘ULOT – 1 Mavzu:Big data va Hadoop ga kirish Ishning maqsadi: Katta ma’lumotlar va ma'lumotlarning turi va tabiati. Bu uni tahlil qiladigan odamlarga olingan tushunchadan samarali foydalanish.
BIG DATA Katta ma'lumotlar - bu juda katta yoki murakkab ma'lumotlar to'plamlari uchun atama bo'lib, ma'lumotlarni qayta ishlashning an'anaviy dasturiy ta'minoti ular bilan ishlash uchun нetarli emas.
Xususiyatlari hajmi -Yaratilgan va saqlangan ma'lumotlarning miqdori. Ma'lumotlarning o'lchami qiymat va potentsial tushunchani aniqlaydi va uni aslida katta ma'lumotlar deb hisoblash mumkinmi yoki yo'qmi.
– Turli xillik Ma'lumotlarning turi va tabiati. Bu uni tahlil qiladigan odamlarga olingan tushunchadan samarali foydalanishga yordam beradi.
– Tezlik Shu nuqtai nazardan, o'sish va rivojlanish yo'lida yotgan talab va muammolarni qondirish uchun ma'lumotlarni yaratish va qayta ishlash tezligi.
O'zgaruvchanlik
Ma'lumotlar to'plamining nomuvofiqligi uni boshqarish va boshqarish jarayonlariga to'sqinlik qilishi mumkin.
Haqiqat
Olingan ma'lumotlarning sifati juda farq qilishi mumkin, bu aniq tahlilga ta'sir qiladi.
Google fayl tizimi Google fayl tizimi (GFS yoki GoogleFS) — yirik tovar apparat klasterlari yordamida maʼlumotlarga samarali va ishonchli kirishni taʼminlash uchun Google tomonidan ishlab chiqilgan xususiy taqsimlangan fayl tizimi.
HADOOP Apache Hadoop - bu MapReduce dasturlash modelidan foydalangan holda katta ma'lumotlar to'plamlarini taqsimlash va qayta ishlash uchun ishlatiladigan ochiq kodli dasturiy ta'minot.U tovar uskunasidan qurilgan kompyuter klasterlaridan iborat. Hadoop-dagi barcha modullar apparatdagi nosozliklar tez-tez uchrab turadigan va avtomatik ravishda ramka tomonidan hal qilinishi kerak degan asosiy taxmin bilan ishlab chiqilgan.