Ma’ruza – 1: Kirish. Ma'lumotlar intellektual taxlili tushunchasi, fanning yaratilish tarixi Ma’lumotlarni intellektual tahlil qilish ko'p tarmoqli soha bo'lib, amaliy statistika, naqshni aniqlash, sun'iy intellekt, ma'lumotlar bazasi nazariyasi va boshqalar kabi fanlar asosida paydo bo'lgan va rivojlanmoqda, 8-rasmga qarang. bitta.
Statistika - bu o'rganilayotgan hodisaga xos bo'lgan qonuniyatlarni aniqlash uchun ma'lumotlarni yig'ish, ularni qayta ishlash va tahlil qilish usullari haqidagi fan.
Statistika - bu tajribani rejalashtirish, ma'lumotlarni yig'ish, ularni taqdim etish va umumlashtirish, shuningdek, ushbu ma'lumotlar asosida tahlil qilish va xulosalar chiqarish usullari to'plami.
Statistika kuzatishlar natijasida olingan ma'lumotlar asosida ishlaydi.
yoki tajribalar.
Mashinani o'rganishni dastur orqali yangi bilimlarni olish jarayoni sifatida ta'riflash mumkin. Mashinani o'rganish algoritmiga misol neyron tarmoqlardir.
Sun'iy intellekt - bu ilmiy yo'nalish bo'lib, uning doirasida an'anaviy ravishda intellektual deb hisoblanadigan inson faoliyatini apparat yoki dasturiy modellashtirish vazifalari qo'yiladi va hal qilinadi.
Sun'iy intellekt - an'anaviy ravishda insonning vakolati deb hisoblangan ijodiy funktsiyalarni bajarish uchun aqlli tizimlarning mulki.
Ma’lumotlarni intellektual tahlil qilish- bu ma'lumotlardagi yashirin naqshlarni topishga asoslangan qarorlarni qo'llab-quvvatlash jarayoni.
Ma’lumotlarni intellektual tahlil qilish texnologiyasi - ilgari noma'lum bo'lgan, ahamiyatsiz bo'lmagan, amaliy jihatdan foydali va inson faoliyatining turli sohalarida qarorlar qabul qilish uchun zarur bo'lgan bilimlarni izohlash uchun ochiq bo'lgan ma'lumotlarni topish jarayoni.
Data Mining texnologiyasi katta hajmdagi ma'lumotlarda noaniq, ob'ektiv va amaliy naqshlarni izlash uchun mo'ljallangan.
Aniq bo'lmagan - bu topilgan naqshlar ma'lumotlarni qayta ishlashning standart usullari yoki mutaxassislar tomonidan aniqlanmaganligini anglatadi.
Ob'ektiv - bu har doim sub'ektiv bo'lgan ekspert fikridan farqli o'laroq, kashf etilgan naqshlar haqiqatga to'liq mos kelishini anglatadi.
Amaliy foydali - bu xulosalar amaliyotda qo'llanilishi mumkin bo'lgan o'ziga xos ma'noga ega ekanligini anglatadi.
Data Mining texnologiyasi shablonlar (naqshlar) kontseptsiyasiga asoslanadi, ular ma'lumotlarning kichik namunalariga xos bo'lgan, insonga tushunarli shaklda ifodalanishi mumkin bo'lgan naqshlardir.
Naqshlarni qidirishning maqsadi ma'lumotlarni kerakli jarayonlarni aks ettiruvchi shaklda taqdim etishdir. Bashoratli modellarni yaratish ham naqshlarni topishning maqsadi hisoblanadi.
Ma'lumotlarni qidirish vositalari, statistik vositalardan farqli o'laroq, retrospektiv ma'lumotlarning qat'iy belgilangan miqdorini talab qilmaydi. Bu xususiyat ishonchsiz, noto'g'ri modellarni aniqlashga va natijada ular asosida noto'g'ri qarorlar qabul qilishga olib kelishi mumkin. Olingan bilimlarning statistik ahamiyatini nazorat qilish zarur.
Ma'lumotlar Keng ma'noda ma'lumotlar faktlar, matnlar, grafikalar, rasmlar, tovushlar, analog yoki raqamli video segmentlaridir. Ma'lumotlar o'lchovlar, tajribalar, arifmetik va mantiqiy operatsiyalar natijasida olinishi mumkin.
Ma'lumotlar saqlash, uzatish va qayta ishlash uchun mos shaklda taqdim etilishi kerak. Boshqacha qilib aytganda, ma'lumotlar ma'lumotlar provayderlari tomonidan taqdim etilgan va ma'lumotlardan ma'lumotlarni shakllantirish uchun iste'molchilar tomonidan foydalaniladigan xom ashyo hisoblanadi.
Ma'lumotlar to'plami va uning atributlari 2-rasmda ma'lumotlar to'plami bo'lgan ikki o'lchovli jadval ko'rsatilgan. Ob'ektning atributlari yoki uning xususiyatlari jadvalda gorizontal joylashgan. Vertikal jadvallar - ob'ektlar.
Ob'ekt atributlar to'plami sifatida tavsiflanadi. Ob'ekt bo'lishi mumkin
jadval qatori sifatida ifodalanadi.
Atribut - ob'ektni tavsiflovchi xususiyatdir. Atribut o'zgaruvchi, o'lchov, belgi deb ham ataladi. U jadval maydoni sifatida taqdim etilishi mumkin.
Umumiy toifalardan o'ziga xos qiymatlarga o'tish (tushunchalarni operativlashtirish) natijasida o'rganilayotgan tushunchaning o'zgaruvchilari to'plami olinadi.
O'zgaruvchan - o'rganilayotgan barcha ob'ektlar uchun umumiy xususiyat yoki xususiyat, ularning namoyon bo'lishi ob'ektdan ob'ektga farq qilishi mumkin.
Rasm - 2 Ikki o'lchovli jadval "ob'ekt-atribut"
O'zgaruvchining qiymati xususiyatning ko'rinishidir.
Ma'lumotlarni tahlil qilishda, qoida tariqasida, barcha ob'ektlar to'plamini ko'rib chiqish mumkin emas. Juda katta hajmdagi ma'lumotlarni o'rganish qimmat, vaqt talab qiladi va muqarrar ravishda inson xatosiga olib keladi.
Butun aholining bir qismini, ya'ni namunani ko'rib chiqish va unga asoslangan qiziqarli ma'lumotlarni olish kifoya.
Biroq, namuna hajmi umumiy populyatsiyada ifodalangan ob'ektlarning xilma-xilligiga bog'liq bo'lishi kerak. Namuna umumiy populyatsiyaning turli kombinatsiyalari va elementlarini ifodalashi kerak.
Umumiy aholi (aholi) - tadqiqotchini qiziqtiradigan o'rganilayotgan ob'ektlarning butun majmuasi.
Namuna (namuna) - umumiy populyatsiyaning xossalari va xususiyatlari to'g'risida tadqiqot qilish va xulosalar olish uchun ma'lum usulda tanlangan umumiy aholining bir qismi.