Paklin N. B., Gorishkov V. I. Biznes tahlili: ma'lumotlardan bilimgacha (SD). - Sankt-Peterburg. : Ko'rinish. Piter, 2009. - 624 p.
Dyuk V., Samoylenko O. Ma'lumotni qazib olish: boshlang'ich kursi (CD). - Sankt-Peterburg. : Ko'rinish. Piter, 2001. - 368 p.
Juravlov Yu.I. , Ryazanov V.V., Senko O.V. TANISH. Matematik usullar. Dasturiy ta'minot tizimlari. Amaliy zastosuvannya. - M .: Ko'rish. "Faza", 2006. - 176 b. - ISBN 5-7036-0108-8
Zinov'ev A. Yu. Boy ma'lumotlarning vizualizatsiyasi. - Krasnoyarsk: Ko'rinish. Krasnoyarsk davlat texnika universiteti, 2000. - 180 p.
Chubukova I. LEKIN. Ma'lumotni qazib olish: dastlabki yordam. - M.: Internet axborot texnologiyalari universiteti: BINOM: Bilimlar laboratoriyasi, 2006. - 382 b. - ISBN 5-9556-0064-7
Ian H. Witten, Eibe Frank va Mark A. Hall Ma'lumotlarni qazib olish: amaliy o'rganish vositalari va usullari. - 3-nashr. – Morgan Kaufmann, 2011. – P. 664. – ISBN 9780123748560
Posilannya
Ma'lumotlarni qazib olish uchun dasturiy ta'minot Catalozi Posilan Open Directory loyihasida (dmoz).
Ma'lumotlarni qazib olish va mashinani o'rganish
Weka GNU R KNIME Rapid Miner Gretl PSPP
Xususiy
Deduktor Statistikasi SPSS
Wikimedia fondi. 2010 yil. OLAP-tizimlari analitikaga ma'lumotlarni tahlil qilishda gipotezalarni qayta ko'rib chiqish imkoniyatini beradi, shuning uchun analitikaning asosiy vazifasi sizning bilimingiz va dalillaringizga asoslangan gipotezalarni yaratishdir. . Bunday bilimlar ma'lumotga bo'lgan ulug'vor obsesyon tufayli yo'qoladi, chunki odam mustaqil ravishda erisha olmaydi. Cim bilan bog'liq gipotezalarni o'tkazib yuborish imkoniyati mavjud, chunki ular sezilarli foyda keltirishi mumkin.
"Biriktirilgan" bilimlarni aniqlash uchun avtomatik tahlilning maxsus usullari ishlab chiqiladi, ulardan amaliy ravishda ma'lumotni "to'sib qo'yish" dan bilim olish mumkin. Buning ortida "ma'lumotlar qazib olish (Data Mining)" yoki "intellektual ma'lumotlarni tahlil qilish" atamasi bevosita o'rnatilgan.
U DataMining-ning shaxsiy maqsadiga asoslanadi, chunki u bir-birini to'ldiradi. Harakat o'qi ulardan.
DataMining - bu ma'lumotlar bazalarida ahamiyatsiz va amaliy naqshlarni aniqlash jarayoni. (asosiy guruh)
DataMining - bu biznes mukammalligiga erishish usuli bilan noma'lum tuzilmalarni (patterslarni) aniqlash uchun ajoyib ma'lumotlar ulanishlarini ko'rish, keyinchalik modellashtirish va modellashtirish jarayoni (SAS instituti)
DataMining - butun jarayon, buning metasi - tushunchalarni tanib olishning turli usullaridan saqlangan ma'lumotlarga katta sodiqlik natijasida yangi muhim korrelyatsiyalar, tendentsiyalar belgilarini aniqlash, shuningdek, statistik va matematikani ishlab chiqish. usullar (GartnerGroup)
Ma'lumotni qazib olish - bu "mashina" (algoritmlar, qismli razvedka) tomonidan ushbu ma'lumotlardan olingan bilimlarning namoyon bo'lishining natijasidir.Raqamlar ilgari ma'lum bo'lmagan, ahamiyatsiz, amaliy, jo'shqin, talqin qilish mumkin ediodamlar. (A. Bargesyan "Ma'lumotlarni tahlil qilish texnologiyalari")
DataMining - bu biznes haqidagi asosiy bilimlarni ochib berish jarayoni.
Dominion ular paydo bo'lishini biladi
Keling, rasmiylar nima ko'rsatayotganini bilib olaylik.
Bilim yangi, ilgari noma'lum bo'lishi mumkin. Vitracheni zusillya vydkrittya bilim, yaky vzhe vídomí koristuvacheví, to'lamang. Shuning uchun, yangi, ilgari noma'lum bilimga aylanishning qiymati.
Bilim ahamiyatsiz bo'lishi mumkin. Tahlil natijalari noaniq, nomuvofiq ko'rinishi mumkinma'lumotlarning muntazamligi, bilimni tan olish deb ataladigan narsaga aylanish. Natijalar, garchi ularni oddiyroq usullar bilan (masalan, vizual ko'rib chiqish) olib tashlash mumkin bo'lsa-da, DataMining-ning mashaqqatli usullari bilan haqiqatan ham qo'lga tushmaydi.
Bilim mayut buti amalda jigarrang. Ma'lum bo'lgan bilim zastosovny, zokrema va yangi ma'lumotlar, ishonchliligi yuqori bo'lishi mumkin. Maydonning egriligi shundaki, bu bilim ular to'xtab qolganda qo'shiq kuylashi mumkin.
Aqlli odam aybdorligini bilishi mumkin. Ma'lum naqshlarni mantiqan tushunish mumkin, aks holda hidning vipadkovymi bo'lishi ehtimoli bor. Bundan tashqari, aybdorlik bilimi oshkor bo'ldi, lekin u qaraydigan odam uchun oqilona odamga taqdim etildi.
DataMining-da bilimlarning namoyishi namuna sifatida xizmat qiladi. Modellarning yaratilish yo'llarida yotganini ko'ring. Eng kengaytirilganlari: qoidalar, qarorlar daraxtlari, klasterlar va matematik funktsiyalar.
DataMining rahbari
Faraz qilaylik, qonun bo'lgan shablon tushunchasi DataMining texnologiyasining asosi hisoblanadi. Urush orqali, tsikhning paydo bo'lishi, prihovaniya vyd uzluksiz ko'z qonuniyatlari, DataMining vazifalari buzilmoqda. Shaklda namoyon bo'lishi mumkin bo'lgan har xil turdagi qonuniyatlar, aqlli odamlar DataMining asosiy vazifalarini ifodalaydi.
DataMining-ni qanday kuzatish haqida yagona fikr yo'q. Ko'pgina nufuzli dzherellar shunday ta'mirlanadi: tasnifi,
klasterlash, prognozlash, assotsiatsiya, vizualizatsiya, tahlil va namoyon bo'lish
ko'rib chiqish, baholash, qo'ng'iroqlarni tahlil qilish, xulosalarni qayta ishlash.
Quyida keltirilgan meta tavsifi DataMining vazifalari haqida ko'proq ma'lumot berish, ularni taqqoslash, shuningdek, ushbu vazifalar buzilgan usullarni taqdim etishdir. DataMining-ning eng keng qamrovli vazifasi tasniflash, klasterlashtirish, assotsiatsiya, prognozlash va vizualizatsiyadir. Ushbu darajada vazifa vibratsiyalangan ma'lumotlar turlari, DataMining vazifalarining eng muhim tasnifi bilan belgilanadi.
Tasniflash
Shaxssiz narsalarni sindirish vazifasi guruhlarning, sinflarning darajalarining apriori topshiriqlari bilan qo'riqlanadi, bunday hidlardan terining o'rtasi birma-bir o'xshash bo'lib, ular taxminan bir xil kuch va belgilar bo'lishi mumkin. Asosan tashqariga chiqishga qaror qilganingizda tahlil atribut qiymati (belgi).
Tasniflash eng muhim vazifalardan biri sifatida ma'lumotlar qazib olish . Von zastosovuetsya ichida marketing tayinlangan talabnoma beruvchilarning kreditga layoqatliligini baholashda mijozlarning sadoqati, tasvirlarni tan olish , tibbiy diagnostika va boshqa boy qo'shimchalar. Teri sinfi ob'ektlarining kuchi bo'yicha tahlilchi sifatida, agar birinchi sinfga yangi ogohlantirish kiritilsa, kuch qiymatlari avtomatik ravishda yangisiga o'tadi.
Sinflar soni ikkita bilan cheklanganligi sababli, bo'lishi mumkinikkilik tasnifi Ular boy katlanmış binolar bo'lishi mumkin darajada. Masalan, kredit xavfining "Yuqori", "O'rta" yoki "Past" kabi bosqichlarini tayinlash bo'yicha o'rinbosari, siz faqat ikkitasini yutib olishingiz mumkin - "Ko'rish" yoki "Past".
DataMining-da tasniflash uchun anonim modellar tanlanadi: neyron tarmoqlari, yechim daraxtlari , qo'llab-quvvatlash vektor mashinalari, k-yaqin yig'indilar usuli, qoplash va in algoritmlari.o'zgarish(sinfni belgilang ) Terini parvarish qilish uchun tayinlangan. Rasmiy ravishda tasniflash bo'linish asosida amalga oshiriladiochiq joy belgisi sohada, terining oraliq joylaridaboy vektorlar ular bir xilga o'xshaydi. Boshqacha qilib aytadigan bo'lsak, qo'shiqchilik sinfi bilan bog'liq bo'lgan hududda juda ko'p joy egallagan ob'ekt sifatida vinolar yangigacha yotadi.
Klasterlash
Qisqa Tasvir. G'oyalarni mantiqiy davom ettirish uchun klasterlash
tasnifi. Vazifa murakkabroq, klasterlashning o'ziga xos xususiyati shundaki, boshning orqa qismidagi narsalarni tasniflaydiganlar aqlli emaslar. Klasterlash natijasi ob'ektlarni guruhlarga bo'lishdir.
Klasterlash vazifalarini ishlab chiqish usuliga misol: "o'qituvchisiz" o'rgatish maxsus turdagi neyron tarmoqlar - Kohonenning o'z-o'zini tashkil etuvchi xaritalari.
Uyushmalar
Qisqa Tasvir. Assotsiativ qoidalarni izlash natijasida ma'lumotlar to'plamining bir-biriga mos keladigan podiaslari o'rtasida qonuniyatlar mavjud.
Vídminníst sotsíatsíí víd dvíd dvíh priedníní vdan DataMining: qonuniyatlarni izlash tahlil qilinadigan ob'ektning kuchiga emas, balki bir vaqtning o'zida sodir bo'ladigan ko'p sonli bo'linmalarga asoslanadi. Assotsiativ qoidalarga asoslangan masalalarni yechishning eng katta algoritmi Apriori algoritmidir.
Ketma-ket yoki ketma-ket assotsiatsiya
Qisqa Tasvir. Ketma-ketlik sizga tranzaktsiyalar orasidagi soat naqshlarini bilish imkonini beradi. Vorislik vazifasi assotsiatsiyaga o'xshaydi, lekin men bir vaqtning o'zida oldinga siljishlar o'rtasida emas, balki soatda paydo bo'ladigan podia o'rtasida (soatda kuylash oralig'ida sodir bo'ladigan tobto) qonuniyatlarni o'rnatish usulidan foydalanaman. Boshqacha qilib aytganda, ketma-ketlik kunning soatiga bog'langan lansetning yuqori imovirnistyu bilan ifodalanadi. Aslida, assotsiatsiya nolga teng bo'lgan vaqt oralig'i bilan bosqichma-bosqich ketma-ketlik deb ataladi. DataMining vazifalari ketma-ket naqsh vazifalari deb ataladi.
Ketma-ketlik qoidasi: X oxirgi soatga tushgandan keyin Y paydo bo'ladi.
dumba. Aholining 60 foizi kvartira sotib olgach, ikki kunga muzlatgich, 50 foizi esa ikki oyga televizor sotib oladi. Vazifaning yakuniy maqsadi marketing va menejmentda keng ko'rinadi, masalan, mijozlarga xizmat ko'rsatish siklini boshqarish (CustomerLifecycleManagement).
Regressiya, prognozlash (prognozlash)
Qisqa Tasvir. Natijada, tarixiy ma'lumotlarning o'ziga xos xususiyatlari asosida bashorat qilish vazifasining farqi asosiy raqamli ko'rsatkichlarning qoldirilishi yoki mumkin bo'lgan qiymatlari bilan baholanadi.
Bunday vazifalarni hal qilish uchun usullar va matematik statistika, nerv o'lchovlari va boshqa usullar keng qo'llaniladi.
Qo'shimcha vazifa