8. Ekstraktsiya (Extraction) Informatsion ekstratsiya (Information Extraction IE) - bu mashinalarni o'qitishning yana bir qo'llanmasi. Bu struktura qilinmagan ma'lumotlardan tarkibiy ma'lumotlarni olish jarayoni. Masalan veb-sahifalar, maqolalar, bloglar, biznes hisobotlari va elektron pochta xabarlari. Nisbatan ma'lumotlar bazasi ma'lumot olish natijasida hosil bo'lgan ma'lumotlarni saqlab turadi. Ekstraksiya jarayoni hujjatlar to'plami sifatida kiritishni talab qiladi va tarkibiy ma'lumotlarni ishlab chiqaradi. Ushbu natija relelatsion ma'lumotlar bazasidagi Excel jadvali va jadval kabi umumlashtirilgan shaklda mavjud. Hozirgi vaqtda ekstraktsiya katta ma'lumot sanoatida muhim kalitga aylanmoqda. Ma'lumki, katta hajmdagi ma'lumotlar ishlab chiqarilmoqda, ularning aksariyati struktura qilinmagan. Birinchi muhim vazifa - bu tuzilmagan ma'lumotlarga ishlov berish. Endilikda RDBMS-da saqlanishi mumkin bo'lgan tuzilishga ega bo'lmagan ma'lumotlarni ma'lum bir naqsh asosida tuzilgan shaklga o'tkazish.Bundan tashqari, hozirgi kunlarda ma'lumotlarni yig'ish mexanizmi ham o'zgarmoqda. Ilgari biz ma'lumotni End-of-Day (EOD) kabi to'plamlarda yig'ardik, ammo endi biznes ma'lumotni u yaratilishi bilanoq, ya'ni real vaqtda istaydi.
9. Regresiya (Regression) Mashinasozlikni o'rganishni regressiyaga ham qo'llashimiz mumkin. Faraz qilaylik, x = x1, x2, x3, ... xn kirish o'zgaruvchisi, y esa natija o'zgaruvchisi. Bunday holda, kirish parametrlari (x) asosida mahsulotni (y) ishlab chiqarish uchun biz mashinaviy o’qitish texnologiyasidan foydalanishimiz mumkin. Quyidagi kabi turli xil parametrlar o'rtasidagi munosabatni ifodalash uchun siz modeldan foydalanishingiz mumkin:
Y = g (x) bu erda g - modelning o'ziga xos xususiyatlariga bog'liq bo'lgan funktsiya.
Regressiyada biz parametrlarni optimallashtirish uchun mashinaviy o’qitish printsipidan foydalanishimiz mumkin. Taxminiy xatoni qisqartirish va eng yaqin natijani hisoblash uchun.
Shuningdek, biz funktsiyani optimallashtirish uchun Machine learning-dan foydalanishimiz mumkin. Biz yaxshiroq modelga ega bo'lish uchun kirishlarni o'zgartirishni tanlashimiz mumkin. Bu yangi va takomillashtirilgan model bilan ishlashga imkon beradi. Bu javob sirtining dizayni sifatida tanilgan.