Chiziqli klassifikatsiyaning umumiy tenglama quyidagicha ko'rinishga ega:
Chiziqli klassifikatsiyaning umumiy tenglama quyidagicha ko'rinishga ega:
Bu yerda:
𝑦 klassifikatsiya natijasini ifodalaydi.
𝑓() klassifikatsiya funksiyasini ifodalaydi. Bu funksiya odatda sigmoid, softmax yoki identik funksiyalar bo'lishi mumkin.
𝜔⃗ vektori, u "𝑥" vektori bilan dot ko'paytmasi. Bu vektor chiziqli klassifikatsiya modelining o'zini tuzishda foydalanilgan vazifaning asosiy qismidir.
𝜔₀ skalyar (o'zida bitta qiymat) bo'lgan va u chiziqli klassifikatsiyaning moslashtirilishi o'rniga ishlatiladi.
𝑥⃗ vektori, chiziqli klassifikatsiya uchun kirish ma'lumotlarini ifodalaydi. Bu ma'lumotlar asosida obyektlar klassifikatsiyalanadi.
Bu yerda 𝑓() funksiyaya oddiy to'g'ri funksiya (threshold function) bo'ladi, bir sinfga tegishli obyektlarni boshqa sinfga ajratadi, yoki biror qarorning ehtimoli bo'lishi ma'noga ega bo'ladi.
Scikit-learn kutubxonasi liniyal sinflandirish modellari bilan ishlash imkonini beruvchi linear_model klassini o'z ichiga oladi.
Scikit-learn kutubxonasi liniyal sinflandirish modellari bilan ishlash imkonini beruvchi linear_model klassini o'z ichiga oladi.
Bu klass quyidagi chiziqli klassifikatsiya metodlarini qo'llab-quvvatlaydi:
а) Logistik regressiya usuli (linear_model.LogisticRegression); б) Logistik regressiya usuli bilan integratsiyalangan cross-validation imkoniyati (linear_model.LogisticRegressionCV); в) Ridge regressiya usuli (linear_model.RidgeClassifier); г) Ridge regressiya usuli bilan integratsiyalangan cross-validation imkoniyati (linear_model.RidgeClassifierCV); д) Stokastik gradiyentni ishlatgan regulyarizatsiyalangan emprik xatolarni minimallashtirish usuli (linear_model.SGDClassifier). е) Perseptron usuli (linear_model.Perceptron); ж) Passiv-agressiv klassifikatsiya algoritmlarini ishlatgan usul (linear_model.PassiveAggressiveClassifier).
Bu sinflarni Scikit-learn kutubxonasidan chaqirib o'zgaruvchilarini to'g'ri qilib sozlay olasiz. Ularning har birining o'zining xususiyatlari va parametrlari mavjud bo'lishi mumkin. Bu usullardan foydalanib modelni o'rgatishingiz va klassifikatsiyani amalga oshirishingiz mumkin.
Logistik regressiya - bu asosan ikkilik vazifalarni hal qilish uchun ishlatiladigan asosiy klassifikatsiya usuli bo'ladi.
U chiziqli klassifikatorlar guruhiga tegishli bo'lib, polinomial va chiziqli regressiyaga o'xshashdir.
Logistik regressiya tezkor amalga oshiriladi, nisbatan murakkab emas va natijalarni tushuntirish uchun qulaydir.
Logistik regressiyadan foydalanish uchun ma'lumotlar to'plami katta bo'lishi talab etiladi.
Logistik regressiya ma'lumotlar to'plamini sinflarga bo'lish uchun ishlatiladi. Uning asosiy maqsadi, sinflarni ajratuvchi bir logistik funksiya orqali obyektlarni sinflarga bo'lishdir. Logistik regressiya natijasi 0 va 1 orasida bo'lgan bir sinf tanlash uchun foydalaniladi, masalan, "ha" va "yo'q" yoki "pozitiv" va "negativ" sinflarni ajratish uchun.
Logistik regressiya shu sababli ma'lumotlar analizida keng qo'llaniladi, masalan marketingda mijozlar tomonidan mahsulot sotib olishga qaror qilishni bashorat qilish, kasalliklarni aniqlash va boshqalar kabi jarayonlarda. Uning boshqa afzalliklari shu bo'lib, interpretatsiya qilish osonligi, sodda qo'llanilishi va ishlov berishga qulay bo'lishidir.