Bosh muharrir: Sharipov Qo‘ng‘irotboy Avezimbetovich Bosh muharrir o‘rinbosari: Karimov Norboy G‘aniyevich



Yüklə 16,35 Mb.
Pdf görüntüsü
səhifə152/292
tarix16.09.2023
ölçüsü16,35 Mb.
#144053
1   ...   148   149   150   151   152   153   154   155   ...   292
YaIT jurnali 7-son.

Data Mining
– bu “ishlov berilmagan” ma’lumotlar ichidan kerakli, ilgari taniqli bo‘lmagan, amaliy jihatdan 
foydali va interpritatsiyaga loyiq bilimlarni topish jarayoni hisoblanadi. Bu bilimlar inson hayotining turli yunal-
ishlarida qaror qabul qilish jarayonida muhim rol o‘ynaydi. 
[1]
Data Mining metodlarini qo‘llash orqali aniqlangan axborotlar ilgari notrivial va notanish bo‘lishi kerak, 
masalan, o‘rtacha sotish bunga misol bo‘la olmaydi. Bilimlar xossalari orasida yangi bog‘liqliklarni aniqlanishi, 
biri ikkinchisining hossalarini oldindan aniqlashi va hakozalar. Aniqlangan bilimlar yangi ma’lumotlarda ayrim 
ishonchlilik darajasi bilan qo‘llanilishi kerak.
Har bir bilim ayrim yunalishda qo‘llanilish orqali foyda keltirishi kerak. Bu bilimlar matematik bo‘lmagan 
foydalanuvchi uchun tushunarli va sodda ko‘rishga ega bo‘lishi kerak. Masalan inson tomonidan yengil qa-
bul qilinadigan logik-konstruksiyalar orkali “agar… u holda…”. Bundan tashqari ushbu qoidalar har xil MBBT 
uchun SQL-so‘rovlari orqali qo‘llanilishi mumkin. Mabodo olingan ma’lumotlar tushunarli bo‘lmasa, foydalanuv-
chi uchun ma’lumotlarni tushunarli darajaga olib keladigan kayta ishlash metodlari mavjud bo‘lishi kerak. Data 
Miningda qo‘llaniladigan algoritmlar ko‘p sonli hisoblashni talab kiladi. Ilgari bu fakt Data Mining uchun qiyin 
masala sifatida ko‘rilar edi, biroq hozirgi paytda zamonaviy protsessorlarning rivojlanishi bu masalani ahami-
yatini susaytirdi. 
[2]
Masalalarni yechishda Data Mining ning turli algoritm va metodlari qo‘llaniladi. Ular orasida keng qo‘llanil-
adiganlari bu: neyron tarmoqlari, shajaraviy yechimlar, klasterizatsiya algoritmlari, shu jumladan masshtablan-
adigan, hodisalar orasidagi assotsiativ aloqalarni va xakozolarni aniklaydigan algoritmlar.
Ma’lumotlar ombori kundan kunga kengayishi sababli assotsiativ koidalarni topish uchun samarali 
masshtablanadigan algoritmlar talab qilinadi. Bu qoidalar masalalarni qisqa vaqt ichida yechish imkonini beradi.
Bilimlarni aniqlash metodlari orasida keng qo‘llaniladigani bu assotsiativ qoidalarni topish algoritmi. AIS 
deb ataluvchi birinchi assotsiativ koidalarni topish usuli 1993 yil, IBM Almaden tadqiqot markazi xodimlari to-
monidan ishlab chiqilgan. Shundan sung bu yualishga katta e’tiborkaratilgan. 90-yilar o‘rtasi shu yo‘nalishdagi 
ochilishlarning yuqori davri hisoblanadi. Bugungi kunda assotsiativ koidalarni aniqlash uchun asosan Aprioiri 
algoritmi qo‘llaniladi. Uning muallifi Rakesh Agravaldir (Rakesh Agrawal). 
[3]
Assotsiativ qoidalar xodisalar orasidagi muntazamlikni aniklashda qo‘llaniladi. Bunga misol tariqasida kuy-
idagi tasdiqni keltirish mumkin: non sotib olmoqchi bulgan ist’emolchi sut ham sotib olishi mumkinligining exti-
moli 75%ni tashkil qiladi. 
[4]
Bozor savatchalarini tahlil qilish (market basket analysis) ─ bu supermarketlarda eng tipik, shablonli 
xaridlarni qidirish (tasavvurli qoidalarni qidirish)dir. Bozor savatchalarini tahlil qilish bir-biriga bog‘liq bo‘lgan 
tovarlar kombinatsiyalarini aniqlash maqsadida ma’lumotlar bazasini tahlil qilish yo‘li orqali amalga oshiriladi. 
Boshqacha qilib aytganda, bunda “juftli tovarlar” aniqlanadi. Ushbu juft tovarlarning biri kalitli, u bilan xarid qilin-
adigan tovar esa – xamroh bo‘ladigan tovar hisoblanadi. Mazkur tahlil juftli tovarlarni xarid qilish tezligini hamda 
hamroh bo‘luvchi tovar kalitli tovarlar bilan xarid qilinishi ehtimolini aniqlashga yordam beradi. 
TA D Q I Q O T M A V Z U S I B O ‘ Y I C H A A D A B I Y O T L A R TA H L I L I
Assotsiativ qoidalar va bozor savatlarinining tahlili bo‘yicha chet ellik olimlarning, jumladan R. Agrawal, 
T. Imielinski, A. Swami, R. Srikant. A. Savasere, E. Omiecinski, and S. Navathe, J. S. Park, M.-S. Chen, and 
S. Y. Philip, J. Hipp, U. Guntzer, and G. Nakaeizadeh. ishlarida ko‘plab natijalar keltirilgan.
Effektiv algoritmlardan biri sifatida Apriora va Genetik algoritmlar ko‘rsatilgan. 
TA D Q I Q O T M E T O D O L O G I YA S I
Qo‘yilgan masalani yechish uchun ma’lumotlarni tahlili qilishdagi assotsiativ qoidalar va algoritmlardan 
hamda Cell protsessorlar bazasidagi hisoblash tizimi uchun moslashtirilgan bozor savatlarini tahlil qilishning 
parallel algoritmidan foydalanilgan. 
TA D Q I Q O T M A Q S A D I VA VA Z I FA L A R I
Tanlangan metod va algoritmlar asosida bozor savatchalarini tahlili qilishning optimallashtirish. Ushbu ma-
qsadga erishish uchun quyidagi masalalar yechildi:

Assotsiativ qoidalar o‘rganish va mavjud adabiyotlardan nazariy ma’lumotlarni to‘plash;

Apriora – assotsiativ qoidasining algoritmini va unga oid nazariy ma’lumotlarni tahlil qilish;


207
YA S H I L I Q T I S O D I Y O T VA TA R A Q Q I Y O T
https://yashil-iqtisodiyot-taraqqiyot.uz
2023-yil, iyul.

7-son.
T
ARA
QQIY
O
T
ПР
ОГРЕС
С
PR
OGRESS

Bozor savatchalarining tahlil kilish masalalarini yechishning Genetik algoritmi tahlil qilish;

Bozor savatchalarining tahlil kilish masalalarini yechishning parallel algoritmi tahlil qilish;

O‘rganilgan algoritmlar asosida qilingan hisoblashlarni tahlil qilish;

Algoritm va metodlarni yaxshilash bo‘yicha asosli taklif va tavsiyalar ishlab chiqish.
TA D Q I Q O T N A T I J A L A R I 
Tadqiqotning nazariy ahamiyati, bozor savatlarini tahlili qilish masalalarini yechish uchun assotsiativ qoi-
dalarni izlash va algoritmlarni ishlab chiqishdan iborat.
Dissertatsiyani amaliy ahamiyati, assotsiativ qoidalar asosida ishlab chiqilgan parallel algoritm yaratish va 
ushbu algoritm ma’lumotlar tahlilini Cell protsessorlar bazasila hisoblashlarni amalga oshirish.
Ishlab chiqilgan algoritm samaradorligini baholash uchun biz uch seriyadagi hisoblash tajribalarini o‘tkaz-
dik. Tajribalarning tashqi ma’lumotlari sifatida Data Mining algoritm samaradorligini baholash uchun foydalanil-
gan msnbc.com veb sayti sahifalariga tashrif buyurishlar to‘g‘risidagi standart test to‘plam ma’lumotlari olindi 
. B to‘plam test vazifasi sayt sahifalariga tashrif buyurish bo‘yicha qaydlarni aks ettiradi. Har bir qayd qanday 
mazmuniy toifaga tegishliligi to‘g‘risidagi belgidan iborat. Tajribalarda tez-tez tashrif buyuriladigan sahifalarning 
qiduruv to‘plamlari amalga oshirildi.
Tajribalarning birinchi seriyasida biz hisoblash yadrosiga bog‘liq holda ish vaqti va algoritm tezlanishini 
aniqladik. Izchil algoritmlarning qabul qilingan unumdorlik birligi uchun tezlanishni hisoblashda bugungi kunda 
bozor savatini tahlil vazifalarini yechishning eng yaxshi algoritmlaridan biri sanaladi. Tajribalar shuni ko‘rsatdiki, 
DDCapriori algoritmi chiziqliga yaqin tezlanishni namoyon qildi..
a) tezlanish
b) vaqt bo‘ychida tahlil
1-rasm:
DDCapriori algoritmining ishlash kuchi
Bundan tashqari biz ishlab chiqilgan algoritm va Count Distribution dlya Cell uchun Count Distribution 
algoritmini o‘lchamlarini taqqosladik. Taqqoslash shuni ko‘rsatdiki ishlab chiqilgan algoritm bir qancha yaxshi 
o‘lchamlarga ega
2-rasm:
DataDistribution va CountDistribution mastshtablashni taqqoslash.


T
ARA
QQIY
O
T
ПР
ОГРЕС
С
PR
OGRESS
208
YA S H I L I Q T I S O D I Y O T VA TA R A Q Q I Y O T
https://yashil-iqtisodiyot-taraqqiyot.uz
2023-yil, iyul.

7-son.
Tajribalarning ikkinchi seriyasida biz nomzod uzunligi va savatga bog‘liq holda savatga nomzodning kirishi-
ni tekshirishda skalyar bilan birga vektor operatsiyalarini qo‘llashdan yutuqni taqqosladik. Tajribalar natijalari 
shuni ko‘rsatdiki, vektor operatsiyalaridan keladigan yutuq nomzod va savat uzunligiga to‘g‘ri proporsional..
a) vaqt bo‘yicha tekshirish
b) vektorli orqali tekshirish
3-rasm:
Kandidatning korzinaga kirishini vektorli funksiya orqali tekshirish.
Tajribalarning uchinchi seriyasi Cell va Intel platformasidagi ishlab chiqilgan algoritmni unumdorligini 
taqqoslashga yo‘naltirilgan. Bu tajribalarni o‘tkazish uchun biz Intel protsessoriga mo‘ljallangan DDCapriori al-
goritmni ishlab chiqdik. SPE-tizimi bilan birga buni amalga oshirishda POSIX- tizimidan foydalaniladi va vektor 
funksiyalari ishlatilmaydi. Tajribalar natijalari 4-rasmda keltirilgan.
4-rasm:
Cell va Intel protsessorlarini ishlash jarayonini taqqoslash
Tajribalar shuni ko‘rsatdiki, Cell protsessorlaridagi algoritm Intel protsessorlaridagi algoritmga qaraganda 
bir qancha yaxshi tezlanishlarni namoyon qildi. Ammo Intel protsessorlari Cell protsessorlariga qaraganda an-
cha yuqori tezkor faoliyatni ta’minlaydi.
X U L O S A
Ushbu tadqiqotda ishlov berilmagan ma’lumotlar orasida bilimlar tuzilishiga olib keladi. Bu bilimlar qaror 
qabul qilishda qo‘llanilishi mumkin. Shu sababli so‘nggi yillarda “ma’lumotlar bazasidan bilim olish” (knowledge 
discovery in databases) yo‘nalishi keskin suratlarda rivojlanib borayotnanini yaqol misol sifatida ko‘rishimiz 
mumkin. 
Data Mining – bu “ishlov berilmagan” ma’lumotlar ichidan kerakli, ilgari taniqli bo‘lmagan, amaliy jihatdan 
foydali va interpritatsiyaga loyiq bilimlarni topish jarayoni hisoblanadi. Bu bilimlar inson hayotining turli yunal-
ishlarida qaror kabul kilish jarayonida muhim rol uynaydi. 
Xususan, bozor savatchasining asosiy tushunchalari izohlangan, katta hajmdagi ma’lumotlar qayta ishlash 
va zarur axborotni samarali topishga imkon beruvchi Data Mining dastaklaridan biri sifatida assotsiativ qoidalar 
ko‘rib chiqilgan. Yuqorida ta’kidlaganidek, assotsiativ qoidalarni izlash masalasi dastlab bozor savatchasini 
tahlil qilish uchun taqdim etilgan. 


209
YA S H I L I Q T I S O D I Y O T VA TA R A Q Q I Y O T
https://yashil-iqtisodiyot-taraqqiyot.uz
2023-yil, iyul.

7-son.
T
ARA
QQIY
O
T
ПР
ОГРЕС
С
PR
OGRESS
Assotsiativ qoidalar xaridlar, mijozlarning xohishlarini tahlil qilish, supermarketlarda tovarlarni joylashtirishni 
rejalashtirish, kross-marketing, manzilli jo‘natishda xaridorlarning hatti-harakatlari bo‘yicha segmentlashtirishda 
samarali qo‘llanilmoqda. Biroq, ushbu algoritmlarning qo‘llanilish sohasi faqatgina savdo bilan cheklanmaydi. 
Tadqiqot natijalaridan kelib chiqqan ma’lumotlar yordamida parallelashtirishning umumiy usuli yaratildi. 
Yuqorida ko‘rsatilgan algoritmlarni ta’riflash uchun asosiy tushunchalari ifodalangan.
Bozor savatlarining yo‘nalishlaridan amaliy misollar keltirilgan.
Cell va Intel protsessorlar bazasidagi hisoblash tizimi uchun moslashtirilgan bozor savatlarini tahlil qilish 
vazifalarini yechishning parallel algoritmi keltirilgan. Parallel algoritmlar to‘plamni guruhlarga bo‘lishi va hisob-
lash yadrolari bo‘yicha bu guruhlarni tarqatish yo‘li bilan erishilgan. Bunda savat to‘plami har bir hisoblash 
yadrosiga uzatiladi. 
Taklif qilingan algoritm samaradorligini ko‘rsatuvchi hisoblash tajribalari natijalari keltirilgan.
Keltirilgan algoritm va model yordamida ko‘pgina tajribalar o‘tqazildi va tajriba natijalar asosida yakuniy 
xulosalar chiqarildi.

Yüklə 16,35 Mb.

Dostları ilə paylaş:
1   ...   148   149   150   151   152   153   154   155   ...   292




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin