Olimlar e’tirofiga asosan Mashinali o‘qitish fanining otasi kim deb yuritiladi?
Ma'lumotlar to'plami(dataset)da yetishmayotgan yoki buzilgan ma'lumotlarni qanday boshqarish mumkin? 1-usul qatorlar yoki ustunlarni o'chirishdir. Bo'sh hujayralar haqida gap ketganda, biz odatda bu usuldan foydalanamiz.
Misol uchun, agar ustun yoki satr uchun ma'lumotlarimizning aksariyati etishmayotgan bo'lsa, biz ularni shunchaki o'chirib tashlashimiz mumkin.
2-usul etishmayotgan ma'lumotlarni yig'ilgan qiymatlar bilan almashtirishdir. Bunday holda, biz ustunda mavjud bo'lgan qolgan qiymatlar asosida yig'ilgan qiymatni hisoblashimiz va olingan raqamni bo'sh joyga qo'yishimiz mumkin.
3-usul noma'lum kategoriya yaratmoqda. Kategorik xususiyatlar bir qator mumkin bo'lgan qiymatlarga ega, bu bizga etishmayotgan qiymatlar uchun yana bitta toifani yaratish imkoniyatini beradi. Shunday qilib, biz ma'lumotlarga yangi ma'lumotlarni qo'shish orqali farqni kamaytiramiz. Bu asl ma'lumot etishmayotgan yoki tushunib bo'lmaydigan hollarda foydalanish mumkin,
4-usul etishmayotgan qiymatlarni bashorat qilishdir. Agar bizda etishmayotgan qiymatlar bo'lmasa, biz etishmayotgan qiymatlarni bashorat qilish uchun statistik yoki mashinani o'rganish algoritmini o'rgatishimiz mumkin. Ushbu trening o'tkaziladigan namunalar orasida etishmayotgan qiymatlar mavjud bo'lganligi sababli, ularni dastlab bo'shliqlarni tiklashning eng oddiy usullaridan biri yordamida almashtirish kerak. Bu yo'l bizga yaxshi ishlash imkonini beradi, agar, albatta, etishmayotgan qiymat katta farqga ega bo'lmasa. Har doimgidek, misol. Bu erda Madan bilan bizda tajriba ustuni uchun hech qanday raqam yo'q. Agar bizda kattaroq jadval mavjud bo'lsa, unda o'xshash ma'lumotlarga ega bo'lgan ko'proq odamlar - bir xil mamlakat, kasb va ta'lim - etishmayotgan xususiyat uchun eng mumkin bo'lgan natijani to'g'ri hisoblash mumkin. Bu holatda, biz mutlaqo to'g'ri taxmin qilmagan bo'lsak ham