Academic Research in Educational Sciences Volume 4 | Issue 3 | 2023 ISSN: 2181-1385 ISI: 0,967 | Cite-Factor: 0,89 | SIS: 1,9 | ASI: 1,3 | SJIF: 5,771 | UIF: 6,1 526 March, 2023 https://t.me/ares_uz Multidisciplinary Scientific Journal Ikkinchi metodimiz katta hajmli ma‟lumotni taqsimlangan saqlash tizimiga
saqlab, uni parallel hisoblash yordamida qayta ishlashga asoslanadi. Biz buning
uchun Apache litsenziyasi asosida ishlovchi Hadoop HDFS va Hadoop MapReduce
dan foydalandik. Apache Hadoop - bu katta hajmdagi ma'lumotlar va hisoblash bilan
bog'liq muammolarni hal qilish uchun ko'plab kompyuterlar tarmog'idan
foydalanishni osonlashtiradigan ochiq manbali dasturiy ta'minot vositalari to'plami. U
MapReduce dasturlash modelidan foydalangan holda katta ma'lumotlarni
taqsimlangan saqlash va qayta ishlash uchun dasturiy ta'minot tizimini taqdim etadi.
Apache Hadoop yadrosi Hadoop Distributed File System (HDFS) deb nomlanuvchi
saqlash qismi va MapReduce dasturlash modeli bo'lgan ishlov berish qismidan iborat.
Hadoop fayllarni katta bloklarga ajratadi va ularni klasterdagi tugunlar bo'ylab
tarqatadi. Keyin ma'lumotlarni parallel ravishda qayta ishlash uchun paketlangan
kodni tugunlarga o'tkazadi. Asosiy Apache Hadoop fremvorki quyidagi modullardan
iborat:
Hadoop Common - boshqa Hadoop modullari uchun zarur bo'lgan
kutubxonalar va yordamchi dasturlarni o'z ichiga oladi;
Hadoop Distributed File System (HDFS) - klaster bo'ylab juda yuqori
agregat o'tkazish qobiliyatini ta'minlovchi tovar mashinalarida ma'lumotlarni
saqlaydigan taqsimlangan fayl tizimi;
Hadoop YARN – (2012-yilda taqdim etilgan) klasterlardagi hisoblash
resurslarini boshqarish va ulardan foydalanuvchilarning ilovalarini rejalashtirishda
foydalanish uchun mas‟ul platforma;
Hadoop MapReduce - keng ko'lamli ma'lumotlarni qayta ishlash uchun
MapReduce dasturlash modelini amalga oshirish.
Hadoop Ozone - (2020 yilda taqdim etilgan) Hadoop uchun ob'ektlar
do'koni.