Ma'lumotlarni qayta ishlash – bu “xom” ma'lumotni tushunarli formatga aylantirish va aniq ma'lumotlarga ruxsatlilikni ta'minlash uchun amalga oshiriladigan muhim jarayondir.
Ma'lumotlarni qayta ishlash (Data Preprocessing)
Ma'lumotlarni qayta ishlash bir necha bosqichlarni o'z ichiga oladi:
Ma'lumotlar integratsiyasi – bu foydalanuvchilarga (end users) ma'lumotlarning yagona ko'rinishini taqdim etish uchun turli manbalardan olingan ma'lumotlarni birlashtirishni o'z ichiga oladi.
Ma'lumotlarni tozalash (Data Cleaning)
Ma'lumotni tozalash jarayoni yetishmayotgan qiymatlarni to'ldiradi, xatolar va nomuvofiqliklarni tuzatadi va ma'lumotlar sifatini yaxshilash uchun ma'lumotlardagi ortiqcha narsalarni olib tashlaydi.
Ma'lumotlarni qisqartirish (Data Reduction)
Katta hajmdagi ma'lumotlarni qayta ishlash uzoq vaqt talab qilishi mumkin, bu esa ma'lumotlarni tahlil qilishni imkonsiz yoki amaliy tadbiq etish mumkinmas holatga olib kelishi mumkin. Ma'lumotlarni qisqartirish – bu ma'lumotlar hajmini kamaytirish yoki atributlar sonini kamaytirish tushunchasi.
Ma'lumotlarni o‘zgartirish (Data Transformation)
Ma'lumotlarni o'zgartirish ma'lumotlarni tegishli formatga aylantirish yoki birlashtirish va ularni ma'lumotlarni boshqarish va tahlil qilish uchun mantiqiy va mazmunli ma'lumotlarga aylantirishni anglatadi.
Katta ma’lumotlarni vizuallashtirish – katta ma'lumotlarning hayot siklining yakunlaydi va foydalanuvchilarga ma'lumotlardan tushuna olishga yordam beradi.