8-2 Mavzu: MAShINALARNI O'QISH USULLARI VA REGULIRIZATSIYALASH
Agar siz mashinaga nimani o'rgatmoqchi ekaningizni bilsangiz, bu usul maqbuldir. Siz kompyuterni ulkan o'quv ma'lumotlar bazasi bilan tanishtirishingiz va kutilgan natijalarga erishguningizcha parametrlarni o'zgartirishingiz mumkin. Keyin kompyuter hali duch kelmagan benchmark ma'lumotlari natijasini bashorat qilish orqali mashina o'rgangan narsalarini yaxshilay olasiz.
Ko'pincha boshqariladigan ta'lim tasniflash va bashorat qilish vazifalari uchun ishlatiladi. O'tgan moliyaviy faoliyat to'g'risidagi ma'lumotlarga asoslanib, jismoniy shaxslar va tashkilotlarning moliyaviy xavf-xatarini aniqlash uchun boshqariladigan ta'limdan foydalanish mumkin; avvalgi shakllarni hisobga olgan holda, sotib olish xatti-harakatlarini yaxshi taxmin qilish mumkin.
Nazorat qilinmagan o'rganish usuli.
Nazorat qilinmagan o'rganishda mashina ma'lumotlar bazasini tekshiradi va turli xil o'zgaruvchilar o'rtasidagi yashirin korrelyatsiyalarni aniqlaydi. Ushbu usul yordamida ma'lumotlarni faqat ularning statistik xususiyatlariga qarab klasterlarga guruhlash mumkin.
Nazorat qilinmagan ta'limdan yaxshi foydalanish bu yozuvlarni ehtimollik bilan birlashtirish uchun ishlatiladigan klaster algoritmi. Ma'lumotlar elementlari o'rtasidagi munosabatlar aniqlanadi va shu munosabatlar asosida jismoniy yoki virtual olamdagi odamlar va tashkilotlar o'rtasidagi munosabatlar aniqlanadi.
Ushbu parametr, masalan, mijozlarning umumiy rasmini yaratish uchun, masalan, turli manbalardan yoki turli xil biznes bo'limlaridan olingan ma'lumotlarni birlashtirishga muhtoj bo'lgan kompaniyalar uchun foydalidir.
Nazorat qilinmagan o'rganish, shuningdek, ularning ijtimoiy tarmoqlardagi xabarlari, elektron pochta xabarlari va boshqa yozuvlari asosida odamlarning hissiy holatini aniqlash uchun bayonotlarni tahlil qilish uchun ishlatilishi mumkin. Bugungi kunda, ayniqsa moliyaviy xizmat ko'rsatuvchi kompaniyalarda, nazoratsiz o'rganish mijozlar ehtiyojini qondirish uchun tobora ko'proq foydalanilmoqda.
Yarim nazorat ostida o'rganish usuli.
Bu o'qituvchi bilan va o'qituvchisiz o'rganish gibrididir. Ma'lumotlarning kichik qismini belgilab, o'qituvchi mashinaga qolganlarni qanday klaster qilishini tushunishga imkon beradi.
Ushbu usul boshqalarni taqlid qilishga urinishlar bilan firibgarlikni aniqlash uchun ishlatilishi mumkin. Oddiy faoliyat sharoitida firibgarlikni anomaliya deb tasniflash mumkin. Bunday anormalliklarni tan oladigan modellarni yaratish uchun o'qituvchilarning qismlarini o'qitish texnikasidan foydalanish mumkin. Ushbu tizimlar ko'pincha onlayn operatsiyalarda firibgarlikka urinishlarni aniqlash uchun ishlatiladi.
O'qituvchilarni qisman o'qitish, shuningdek, yirik korxonalar uchun xos bo'lgan qisman etiketlangan ma'lumotlarning tayyor to'plamlari mavjud bo'lgan hollarda ham qo'llanilishi mumkin. Masalan, Amazon AI algoritmlarini yorliqli va yorliqsiz ma'lumotlarning kombinatsiyasi bo'yicha o'qitish orqali raqamli yordamchi Alexa-ning tabiiy tilni tushunishini yaxshiladi. Bu Alexa javoblarining aniqligini oshirdi.
Kuchaytirishni o'rganish usuli.
Kuchaytirishni o'rganishda mashina atrof-muhit bilan o'zaro aloqada bo'lishiga ruxsat beriladi (masalan, yig'ish chizig'idan nuqsonli mahsulotlarni savatga tashlash) va vazifani to'g'ri bajarayotganda "mukofotlanadi". Mukofotlarni hisoblashni avtomatlashtirish orqali siz mashinani o'z-o'zidan o'rganishga imkon berishingiz mumkin.
Chakana savdo do'konlarida narsalarni saralashni kuchaytirishni o'rganish usullaridan biri. Ba'zi chakana savdo korxonalari kiyim-kechak, poyabzal va aksessuarlar uchun robotlarni saralash tizimlarini sinab ko'rishmoqda. Robotlar, Reinforcing Learning va Deep Learning-dan foydalanib, ob'ektni ushlab turish qanchalik qiyinligini va eng yaxshi ushlash nima ekanligini aniqlaydilar.
Ushbu usulning o'zgarishi, chuqur mustahkamlashni o'rganish, nazorat ostida va nazoratsiz o'qish imkoniyatlari etarli bo'lmagan holatlarda avtonom qaror qabul qilish uchun juda mos keladi.
Chuqur o'rganish usuli.
Chuqur o'rganish o'qituvchisiz yoki mustahkamlashsiz amalga oshirilishi mumkin. Chuqur o'rganish odamlarni o'rganish tamoyillarini qisman taqlid qiladi - ma'lumotlar tizimining xususiyatlarini tobora batafsilroq takomillashtirish uchun neyron tarmoqlaridan foydalanish.
Chuqur neyron tarmoqlari, xususan, giyohvand moddalarni qidirishda katta hajmdagi ma'lumotlarni tekshirishni tezlashtirish uchun ishlatiladi. Bunday neyron tarmoqlar qisqa vaqt ichida ko'plab rasmlarni qayta ishlashga va model oxir-oqibat eslab qoladigan ko'proq xususiyatlarni chiqarishga qodir.
Ushbu usul firibgarlikka qarshi kurashishda ham keng qo'llaniladi, chunki u avtomatlashtirish orqali tanib olish aniqligini oshiradi.
Ta'mirlash va profilaktika ishlarini bajarishda chuqur o'rganish avtomobilsozlik sohasida qo'llanilishi mumkin.
Kuyida regressiya uchun dasturni kurib utamiz:
def generate_wave_set(n_support=1000, n_train=25, std=0.3):
data = {}
# выберем некоторое количество точек из промежутка от 0 до 2*pi
data['support'] = np.linspace(0, 2*np.pi, num=n_support)
# для каждой посчитаем значение sin(x) + 1
# это будет ground truth
data['values'] = np.sin(data['support']) + 1
# из support посемплируем некоторое количество точек с возвратом, это будут признаки
data['x_train'] = np.sort(np.random.choice(data['support'], size=n_train, replace=True))
# опять посчитаем sin(x) + 1 и добавим шум, получим целевую переменную
data['y_train'] = np.sin(data['x_train']) + 1 + np.random.normal(0, std, size=data['x_train'].shape[0])
return data
data = generate_wave_set(1000, 250)
А теперь реализуем алгоритм обучения, используя магию NumPy:
# добавим колонку единиц к единственному столбцу признаков
X = np.array([np.ones(data['x_train'].shape[0]), data['x_train']]).T
# перепишем, полученную выше формулу, используя numpy
# шаг обучения - в этом шаге мы ищем лучшую гипотезу h
w = np.dot(np.dot(np.linalg.inv(np.dot(X.T, X)), X.T), data['y_train'])
# шаг применения: посчитаем прогноз
y_hat = np.dot(w, X.T)
Dostları ilə paylaş: |