13.3.3. Fan va muhandislik sohasida ma'lumotlar intellektual tahlil qilish
Ilgari ko'plab ilmiy ma'lumotlarni tahlil qilish vazifalari nisbatan kichik va bir hil ma'lumotlar to'plamlarini boshqarishga moyil edi. Bunday ma'lumotlar odatda "gipotezani shakllantirish, modelni yaratish va natijalarni baholash" paradigmasi yordamida tahlil qilindi. Bunday hollarda, odatda, ularni tahlil qilish uchun statistik usullar qo'llaniladi (13.2.1-bo'limga qarang). Ommaviy ma'lumotlarni yig'ish va saqlash texnologiyalari yaqinda ilmiy ma'lumotlarni tahlil qilish manzarasini o'zgartirdi. Bugungi kunda ilmiy ma'lumotlarni ancha yuqori tezlikda va arzonroq xarajatlar bilan to'plash mumkin. Bu katta hajmdagi yuqori o'lchamli ma'lumotlar, oqim ma'lumotlari va boy fazoviy va vaqtinchalik ma'lumotlarni o'z ichiga olgan heterojen ma'lumotlarning to'planishiga olib keldi. Tadqiqotchilarning fikriga ko'ra, ilmiy ilovalar "gipoteza yaratish va sinovdan o'tkazish" paradigmasidan "ma'lumotlarni to'plash va saqlash, yangi gipotezalar uchun meniki, ma'lumotlar yoki tajribalar bilan tasdiqlash" jarayoniga o'tmoqda. Ushbu siljish ma'lumotlarni intellektual tahlil qilish uchun yangi muammolarni keltirib chiqaradi.
Ilmiy sohalardan (jumladan, geofanlar, astronomiya, meteorologiya, geologiya va biologiya fanlari) murakkab ma'lumotlardan foydalangan holda katta hajmdagi ma'lumotlar to'plangan.
teleskoplar, ko'p spektrli yuqori aniqlikdagi masofaviy sun'iy yo'ldosh sensorlari, global joylashishni aniqlash tizimlari va biologik ma'lumotlarni yig'ish va tahlil qilish texnologiyalarining yangi avlodlari. Iqlim va ekotizimlarni modellashtirish, kimyo muhandisligi, suyuqliklar dinamikasi va strukturaviy mexanika kabi turli sohalarda tezkor raqamli simulyatsiyalar tufayli katta maʼlumotlar toʻplamlari ham yaratilmoqda. Bu erda biz ma'lumotlar intellektual tahlil qilishning yangi ilmiy qo'llanilishi natijasida yuzaga kelgan ba'zi muammolarni ko'rib chiqamiz.
■ Ma'lumotlar omborlari va ma'lumotlarni oldindan qayta ishlash: Ma'lumotlarni oldindan qayta ishlash va ma'lumotlar omborlari axborot almashinuvi va ma'lumotlarni intellektual tahlil qilish uchun juda muhimdir. Omborni yaratish ko'pincha bir nechta muhitda va turli vaqt oralig'ida to'plangan nomuvofiq yoki mos kelmaydigan ma'lumotlarni hal qilish uchun vositalarni topishni talab qiladi. Bu semantikani, havola tizimlarini, geometriyani, o'lchovlarni, aniqlik va aniqlikni muvofiqlashtirishni talab qiladi. Turli xil manbalardan olingan ma'lumotlarni birlashtirish va hodisalarni aniqlash uchun usullar kerak.
Misol uchun, iqlim va ekotizim ma'lumotlarini ko'rib chiqing, ular fazoviy va vaqtinchalik bo'lib, geofazoviy ma'lumotlarga o'zaro bog'lanishni talab qiladi. Bunday ma'lumotlarni tahlil qilishning asosiy jihati shundaki, fazoviy domenda juda ko'p hodisalar mavjud, ammo vaqtinchalik domenda juda oz. Misol uchun, El Nino hodisalari har to'rt-etti yilda sodir bo'ladi va ular haqidagi oldingi ma'lumotlar bugungidek tizimli ravishda to'planmagan bo'lishi mumkin. Murakkab fazoviy agregatlarni samarali hisoblash va fazo bilan bog'liq ma'lumotlar oqimlari bilan ishlash uchun usullar ham zarur.
■ Ma'lumotlarning murakkab turlarini intellektual tahlil qilish: Ilmiy ma'lumotlar to'plamlari tabiatan heterojendir. Ular, odatda, multimediya ma'lumotlari va georeferentsiyalangan oqim ma'lumotlari kabi yarim tuzilgan va tuzilmagan ma'lumotlarni, shuningdek, murakkab, chuqur yashirin semantikaga ega ma'lumotlarni (masalan, genomik va proteomik ma'lumotlar) o'z ichiga oladi. Fazoviy vaqt ma'lumotlari, biologik ma'lumotlar, tegishli kontseptsiya ierarxiyasi va murakkab semantik munosabatlar bilan ishlash uchun ishonchli va maxsus tahlil usullari kerak. Masalan, bioinformatikada tadqiqot muammosi genlarga tartibga soluvchi ta'sirlarni aniqlashdan iborat. Gen regulyatsiyasi hujayra funktsiyalarini aniqlash uchun hujayradagi genlarning qanday yoqilganligini (yoki o'chirilganligini) anglatadi. Turli xil biologik jarayonlar aniq tartibga solingan naqshlarda birgalikda harakat qiladigan turli xil genlar to'plamini o'z ichiga oladi. Shunday qilib, biologik jarayonni tushunish uchun biz ishtirok etuvchi genlar va ularning regulyatorlarini aniqlashimiz kerak. Bu ma'lum genlarga tartibga soluvchi ta'sirlar to'g'risidagi maslahatlar uchun katta biologik ma'lumotlar to'plamini tahlil qilish uchun, bunday ta'sirga vositachilik qiluvchi DNK segmentlarini ("tartibga solish ketma-ketliklari") topish uchun murakkab ma'lumotlarni qidirish usullarini ishlab chiqishni talab qiladi.
■ Grafik va tarmoq asosida intellektual tahlil qilish: Mavjud modellashtirish yondashuvlarining cheklanganligi sababli bir nechta jismoniy hodisalar va jarayonlarni modellashtirish ko'pincha qiyin yoki imkonsizdir. Shu bilan bir qatorda, ilmiy ma'lumotlar to'plamlarida mavjud bo'lgan ko'plab fazoviy, topologik, geometrik, biologik va boshqa aloqador xususiyatlarni olish uchun etiketli grafiklar va tarmoqlardan foydalanish mumkin. Grafik yoki tarmoqni modellashtirishda qazib olinadigan har bir ob'ekt grafikdagi cho'qqi bilan ifodalanadi va cho'qqilar orasidagi qirralar ob'ektlar orasidagi munosabatlarni ifodalaydi. Misol uchun, grafiklar kimyoviy tuzilmalarni, biologik yo'llarni va raqamli simulyatsiyalar tomonidan yaratilgan ma'lumotlarni modellashtirish uchun ishlatilishi mumkin, masalan, suyuqlik oqimi simulyatsiyasi. Grafik yoki tarmoqni modellashtirishning muvaffaqiyati tasniflash, tez-tez naqsh intellektual tahlil qilish va klasterlash kabi ko'plab grafiklarga asoslangan ma'lumotlarni intellektual tahlil qilish vazifalarining miqyosliligi va samaradorligini yaxshilashga bog'liq.
■ Vizualizatsiya vositalari va domenga xos bilimlar: Ilmiy ma'lumotlarni qidirish tizimlari uchun yuqori darajadagi grafik foydalanuvchi interfeyslari va vizualizatsiya vositalari talab qilinadi. Ular tadqiqotchilar va umumiy foydalanuvchilarga naqshlarni izlashda, kashf etilgan naqshlarni sharhlash va vizualizatsiya qilishda va qaror qabul qilishda kashf etilgan bilimlardan foydalanishda rahbarlik qilish uchun mavjud domenga xos ma'lumotlar va axborot tizimlari bilan birlashtirilishi kerak.
Muhandislik sohasida ma'lumotlar intellektual tahlil qilish fandagi ma'lumotlarni intellektual tahlil qilish bilan juda ko'p o'xshashliklarga ega. Ikkala amaliyot ham ko'pincha katta hajmdagi ma'lumotlarni to'playdi va ma'lumotlarni oldindan qayta ishlashni, ma'lumotlarni saqlashni va murakkab turdagi ma'lumotlarni kengaytiriladigan intellektual tahlil qilishni talab qiladi. Ikkalasi ham odatda vizualizatsiyadan foydalanadi va grafiklar va tarmoqlardan yaxshi foydalanadi.
Bundan tashqari, ko'plab muhandislik jarayonlari real vaqtda javoblarga muhtoj va shuning uchun real vaqtda ma'lumotlar oqimini intellektual tahlil qilish ko'pincha muhim komponentga aylanadi.
Bizning kundalik hayotimizga insoniy aloqa ma'lumotlarining katta miqdori kiradi. Bunday muloqot ko'plab shakllarda mavjud, jumladan yangiliklar, bloglar, maqolalar, veb-sahifalar, onlayn muhokamalar, mahsulot sharhlari, twitterlar, xabarlar, reklamalar va aloqalar, ham Internetda, ham turli xil ijtimoiy tarmoqlarda. Shunday qilib, ijtimoiy fanlar va ijtimoiy tadqiqotlar bo'yicha ma'lumotlarni ishlab chiqish tobora ommalashib bormoqda. Bundan tashqari, mahsulot, nutq va maqolalar bo'yicha foydalanuvchi yoki o'quvchilarning fikr-mulohazalarini tahlil qilish orqali jamiyatdagilarning qarashlari haqida umumiy fikr va his-tuyg'ularni aniqlash mumkin. Natijalarni tahlil qilish tendentsiyalarni bashorat qilish, ishni yaxshilash va qaror qabul qilishda yordam berish uchun ishlatilishi mumkin.
Kompyuter fanlari noyob ma'lumotlar turlarini yaratadi. Masalan, kompyuter dasturlari uzoq bo'lishi mumkin va ularning bajarilishi ko'pincha katta hajmdagi izlarni keltirib chiqaradi. Kompyuter tarmoqlari murakkab tuzilmalarga ega bo'lishi mumkin va tarmoq oqimlari dinamik va massiv bo'lishi mumkin. Sensor tarmoqlari ishonchliligi turlicha bo'lgan katta hajmdagi ma'lumotlarni yaratishi mumkin. Kompyuter tizimlari va ma'lumotlar bazalari turli xil hujumlardan aziyat chekishi mumkin va ularning tizimi/ma'lumotlariga kirish xavfsizlik va maxfiylik bilan bog'liq muammolarni keltirib chiqarishi mumkin. Ushbu noyob ma'lumotlar turlari ma'lumotlarni intellektual tahlil qilish uchun unumdor erlarni ta'minlaydi.
Informatika fanida ma'lumotlarni qidirish tizim holatini kuzatish, tizim ish faoliyatini yaxshilash, dasturiy ta'minotdagi xatolarni ajratish, dasturiy plagiatni aniqlash, kompyuter tizimidagi nosozliklarni tahlil qilish, tarmoq tajovuzlarini aniqlash va tizim nosozliklarini aniqlash uchun ishlatilishi mumkin. Dasturiy ta'minot va tizim muhandisligi uchun ma'lumotlarni intellektual tahlil qilish tizimi postanaliz uchun izlarni oldindan tashlab yuborishi yoki onlayn ma'lumotlarni qayta ishlash uchun real vaqt rejimida reaksiyaga kirishishiga qarab statik yoki dinamik (ya'ni oqimga asoslangan) ma'lumotlarda ishlashi mumkin.
Ushbu sohada turli usullar ishlab chiqilgan bo'lib, ular mashinani o'rganish, ma'lumotlarni intellektual tahlil qilish, dasturiy ta'minot/tizim muhandisligi, naqshni aniqlash va statistika usullarini birlashtiradigan va kengaytiradi. Informatika fanida ma'lumotlarni intellektual tahlil qilish o'ziga xos qiyinchiliklari tufayli ma'lumotlar konchilari uchun faol va boy domendir. Bu murakkab, kengaytiriladigan va real vaqt rejimida ma'lumotlarni qidirish va dasturiy ta'minot/tizim muhandisligi usullarini yanada rivojlantirishni talab qiladi.
Dostları ilə paylaş: |