Page 34
sarlavhalarga asoslangan ko'plab maqolalarni o'chirib tashladilar va 51 ta maqola
qoldirdi. Shundan so'ng mualliflar har bir maqolaning konspekti va xulosasini o'qib
chiqdilar. Natijada, tadqiqot doirasidan tashqarida bo'lgan ba'zi maqolalar chiqarib
tashlandi. Katta ma'lumotlarni qayta ishlash uchun ishlatiladigan mashinani o'rganish
bilan bog'liq adabiyotlarda tavsiflangan jihatlarni batafsil ko'rib chiqish amalga
oshirildi.
Ushbu bo'lim katta ma'lumotlarni qayta ishlash uchun mashinani o'rganish
yondashuvlarining eng muhim muammolarini ko'rib chiqadi.
1-rasmda katta ma'lumotlar uchun mashinani o'rganish texnikasi bilan bog'liq
muammolarni bir necha tomondan ko'rib chiqishni o'z ichiga olgan batafsil stsenariyni
beramiz . U (i) keng miqyosli ma'lumotlar uchun o'rganish, (ii) turli tuzilgan
ma'lumotlar uchun o'rganish, (iii) yuqori tezlikdagi oqimli ma'lumotlar uchun o'rganish,
(iv) noaniq va to'liq bo'lmagan ma'lumotlar uchun o'rganish va (v) past qiymatli
ma'lumotlarni o'rganishni o'z ichiga oladi. zichlik ma'lumotlari.
1-rasm: Katta ma'lumotlarni o'rganish usullari
Texnologik taraqqiyot tufayli biz bilan shug'ullanadigan ma'lumotlar miqdori
kundan-kunga o'sib bormoqda. 2017-yil noyabr oyida Google har kuni taxminan 25
petabayt maʼlumotni qayta ishlashi aniqlandi va bu oxir-oqibatda maʼlumotlarning
oʻzaro oʻzaro bogʻliqligini tasdiqlaydi .Maʼlumotlar hajmi katta maʼlumotlarning aniq
asosiy atributidir, bu esa muhim muammo tugʻdiradi. Ushbu qiyinchilikni hal qilish
uchun taqsimlangan va parallel ramkalar hisoblash afzal bo'lishi kerak.
Hozirgi vaqtda juda ko'p turli xil ma'lumotlar mavjud. Heterojen, chiziqli
bo'lmagan va yuqori h o'lchovli ma'lumotlarga olib kelishi mumkin bo'lgan uchta
turdagi ma'lumotlar tuzilgan, tuzilmagan va yarim tizimli ma'lumotlardir. Ushbu katta
ma'lumotlar to'plamidan o'rganish juda katta muammo bo'lib, ma'lumotlarning
murakkabligini oshirishga olib keladi. Natijada, ushbu to'siqni bartaraf etish uchun
ma'lumotlar integratsiyasi talab qilinadi .
Muayyan vaqt oralig'ida ishni yakunlash kerak bo'lgan turli xil tadbirlar mavjud.
Katta ma'lumotlarning tezligi uning eng muhim xususiyatlaridan biridir. Agar ish
ma'lum bir vaqt ichida tugallanmasa, ishlov berish natijalari o'z qiymatini o'zgartirishi
mumkin, agar foydasiz bo'lsa .Masalan, fond bozori prognozi, zilzilani bashorat qilish