Antract ushbu mavzuni Internetda uzilishda katta harakat, mualliflar tabiiy tildan foydalanadilar ma'lumotlar to'plami



Yüklə 0,65 Mb.
Pdf görüntüsü
səhifə5/9
tarix20.03.2023
ölçüsü0,65 Mb.
#88876
1   2   3   4   5   6   7   8   9
[2]Network Outage Analysis and Real-Time Prediction (1)

3.2 Algoritm tanlash
tilni qayta ishlash va ma'lumotlarni qayta qidirish. Ushbu modelda matn quyidagicha ifodalanadi
o'rganishning aniqligini oshirish.
nazoratsiz o'rganishdan ko'ra nazorat ostidagi ta'limdan foydalanish yaxshiroqdir. Biroq, tufayli
ko'plik. Hujjatlarni tasniflash muammosida ko'pincha "so'z sumkasi" modeli qo'llaniladi.
“Asosiy kelishuv” [8] hisoblanadi. Ushbu ishonchni hisobga olgan holda, biz ulardan foydalanamiz
Agar biz ko'p tasniflash usulidan foydalansak, qiyinchilik sezilarli darajada oshadi, chunki
yorliqlanmagan ma'lumotlarning qolgan katta miqdori (taxminan 85%) etiketlanganlarni o'qitishga yordam beradi
noaniqlik bilan. Keyinchalik, ma'lumotlar to'plamidagi ma'lumotlarning katta miqdori tufayli, har biri
ko'plab aniq so'zlarni o'z ichiga olgan pochta matnlari, biz ma'lumotlar to'plamlarimizni bir sumka sifatida tahlil qilishimiz mumkin
taqsimot 5-rasmda ko'rsatilgan
Machine Translated by Google


umuman yangi va etiketlanmagan ma'lumotlarni bashorat qilish.
Biz nazorat ostidagi o'rganishga yordam beradigan etiketlanmagan ma'lumotlardan foydalanish uchun EM algoritmidan foydalanamiz.
nazorat ostida o'quv qismi, SVM yaxshi tasniflagich, nazoratsiz o'rganish qismida,
klassifikator umumiy holatni ko'rib chiqishi mumkin, ammo ekstremal holatlarni emas. Biroq, bu biz uchun etarli
klassifikatorning aniqligi va o'rtacha aniqligi atigi 0,29% ni tashkil qiladi. Bu bizning
bizning ta'lim ma'lumotlarimiz. Va keyingi qismda ishlatiladigan test ma'lumotlari uchun 108. In
O'ylaymizki, bu aniqlik bizning maqsadimizga erishadi. Har ikkilik o'rtasidagi farq
SVM modeli. Biz yorliqlangan 315 ta ipni yarmiga qisqartiramiz. 107 etiketli ma'lumotlar va etiketlanmagan ma'lumotlar sifatida
tasniflash usulini soddalashtirishning kelishuvidir. Avvaliga biz tayinlashga qaror qildik
ko'p toifalarga va ba'zi mavzular hech qanday turkumga tegishli emas. Biz buni tahlil qilamiz
samaradorlik. Ikkilik tasniflash masalasini hal qilish uchun biz yarim nazoratdan foydalanamiz
80%.
6 bu aniqlikni ko'rsatadi. Rasmdan biz o'rtacha aniqlik deyarli ekanligini ko'rishimiz mumkin
vaqtni ko'p tasniflashdan foydalangan holda, bu usul qiyinchilikni sezilarli darajada kamaytiradi va yaxshilaydi
tasnifi yaxshi. Ammo bashoratdan keyin biz ba'zi mavzular tegishli ekanligini aniqladik
Ushbu qismda biz barcha etiketlanmagan ma'lumotlarimizni bashorat qilishni xohlaymiz, chunki biz aniqligini o'ylaymiz
Barcha turdagi uzilishlar tasnifini olish uchun 14 marta. Ma'lumotlar to'plamini tasniflash bilan solishtirganda
har bir ikkilik klassifikator va barcha 14 ta ikkilik klassifikatorning o'rtacha aniqligi. Rasm
Treningdan so'ng biz klassifikatorni baholash uchun test ma'lumotlaridan foydalanamiz. ning aniqligini olamiz
ma'lum bir toifada yoki yo'q. Shunday qilib, ushbu usulga asoslanib, biz ma'lumotlar to'plamini tasniflashimiz kerak
3.2.3 Belgilanmagan ma'lumotlarni bashorat qilish
3.2.2 Sinov va baholash
6-rasm: Tasniflashning aniqligi
Machine Translated by Google


2008 yilda tarmoqqa texnik xizmat ko'rsatish eng ko'p ishlamoqda
Haqiqiy ijobiy va haqiqiy salbiyga e'tibor qaratamiz, biz har bir uzilish turlarini ajratamiz
haqiqiy sinfda. 7-rasmda klassik chalkashlik matritsasi ko'rsatilgan. Matritsada biz faqat
2006 yilda tabiiy ofat va tolaning uzilishi eng ko'p uzilishlarni egallagan. 2007 yilda va
Biz har yili har bir uzilish turi uchun foizni hisoblaymiz. 9-rasm bizni ko'rsatadi
oldindan belgilangan sinfdagi misollarni ifodalaydi, har bir qator esa misollarni ifodalaydi
Bu matritsaning har bir ustuni, algoritmning ishlashini vizual tarzda ko'rsatish imkonini beradi

Yüklə 0,65 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin