Katta malumotlarni qayta ishlash texnologiyalari



Yüklə 111,17 Kb.
Pdf görüntüsü
səhifə4/5
tarix13.12.2023
ölçüsü111,17 Kb.
#175176
1   2   3   4   5
KATTA MALUMOTLARNI QAYTA ISHLASH TEXNOLOGIYALARI

1-rasm: 
Katta ma'lumotlarni o'rganish usullari
Texnologik taraqqiyot tufayli biz bilan shug'ullanadigan ma'lumotlar miqdori 
kundan-kunga o'sib bormoqda. 2017-yil noyabr oyida Google har kuni taxminan 25 
petabayt maʼlumotni qayta ishlashi aniqlandi va bu oxir-oqibatda maʼlumotlarning oʻzaro 
oʻzaro bogʻliqligini tasdiqlaydi .Maʼlumotlar hajmi katta maʼlumotlarning aniq asosiy 


atributidir, bu esa muhim muammo tugʻdiradi. Ushbu qiyinchilikni hal qilish uchun 
taqsimlangan va parallel ramkalar hisoblash afzal bo'lishi kerak.
Hozirgi vaqtda juda ko'p turli xil ma'lumotlar mavjud. Heterojen, chiziqli bo'lmagan 
va yuqori h o'lchovli ma'lumotlarga olib kelishi mumkin bo'lgan uchta turdagi 
ma'lumotlar tuzilgan, tuzilmagan va yarim tizimli ma'lumotlardir. Ushbu katta 
ma'lumotlar to'plamidan o'rganish juda katta muammo bo'lib, ma'lumotlarning 
murakkabligini oshirishga olib keladi. Natijada, ushbu to'siqni bartaraf etish uchun 
ma'lumotlar integratsiyasi talab qilinadi .
Muayyan vaqt oralig'ida ishni yakunlash kerak bo'lgan turli xil tadbirlar mavjud. 
Katta ma'lumotlarning tezligi uning eng muhim xususiyatlaridan biridir. Agar ish ma'lum 
bir vaqt ichida tugallanmasa, ishlov berish natijalari o'z qiymatini o'zgartirishi mumkin, 
agar foydasiz bo'lsa .Masalan, fond bozori prognozi, zilzilani bashorat qilish va hokazo. 
Natijada, katta hajmdagi ma'lumotlarni o'z vaqtida qayta ishlash juda muhim va qiyin 
vazifadir. Qiyinchiliklarni bartaraf etish uchun onlayn ta'lim strategiyasidan foydalanish 
kerak .
Ilgari ma'lumotlar aniqroq bo'lgan mashinani o'rganish algoritmlariga etkazilgan. 
Chunki o'sha paytda natijalar to'g'ri bo'lgan. Biroq, bugungi kun ma'lumotlari turli xil 
manbalardan olinganligi sababli noaniq va to'liq emas. Natijada, katta ma'lumotlar 
tahlilida qorong'ulik mashinani o'rganish uchun muhim masaladir. Ma'lumotlar sifatining 
noaniqligi va to'liqsizligini hal qilish va boshqarish muhimligini ta'kidlash uchun biz katta 
ma'lumotlar bilan o'rganish uchun to'rtinchi asosiy muammo sifatida haqiqatni sanab 
o'tamiz. Masalan, simsiz tarmoqlarda noaniq ma'lumotlar shovqin, so'nish, soya va 
boshqa omillar natijasida yaratilgan ma'lumotlardir. Bu qiyinchilikni yengish uchun 
tarqatishga asoslangan usuldan foydalanish kerak .
Mashinani o'rganish asosan katta ma'lumotlar tahlilida tijorat maqsadlarida katta 
hajmdagi 
ma'lumotlardan 
mazmunli 
ma'lumotlarni 
olish 
uchun 
ishlatiladi. 
Ma'lumotlarning qiymati uning eng muhim xususiyatlaridan biridir. Qiymat zichligi past 
bo'lgan katta hajmdagi ma'lumotlardan mazmunli qiymatni topish juda qiyin. Shunday 
qilib, bu katta ma'lumotlar tahlilida mashinani o'rganish uchun katta muammodir. Ushbu 


qiyinchilikni hal qilish uchun ma'lumotlarni qazib olish vositalari va ma'lumotlar bazasi 
bilimlarini kashf qilishdan foydalanish kerak. Ushbu texnologiyalar katta hajmdagi 
ma'lumotlardan muhim ma'lumotlarni olish uchun istiqbolli echimlarni taqdim etishi 
sababli o'ynaydi. Mualliflari ma'lumotlarni qazib olish texnikasi bo'yicha tadqiqotlarni 
ko'rib chiqdilar.
Machine Learning-ning katta ma'lumotlar tahlilidagi turli muammolarini 
ehtiyotkorlik bilan hal qilish kerak. Bozorda mashinani o'rganish bo'yicha ko'plab 
echimlar mavjudligi sababli, ularning barchasi o'qitish uchun juda ko'p ma'lumotlarni 
talab qiladi. Mashinani o'rganish modellari aniq bo'lishi uchun tuzilgan, tegishli va aniq 
tarixiy ma'lumotlarni o'rganishni talab qiladi. Boshqa qiyinchiliklar ham bo'lishi mumkin, 
ammo bu imkonsiz emas.

Yüklə 111,17 Kb.

Dostları ilə paylaş:
1   2   3   4   5




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin