Molekulyar biologiya fanidan tayyorlagan


Xususiyatlarni ajratib olish



Yüklə 77,67 Kb.
səhifə6/15
tarix13.05.2022
ölçüsü77,67 Kb.
#57774
1   2   3   4   5   6   7   8   9   ...   15
KONOTOKSIN

2.1 Xususiyatlarni ajratib olish

SVM yordamida tasniflash n o'lchovli fazodagi vektorlarni giper tekisliklarni topish orqali ajratishga asoslangan. Shunday qilib, birinchi bosqichda X qiziqish ob'ektlarini xususiyat vektorlari deb nomlash kerak . Bu xususiyatni chiqarish bosqichiga ishora qiladi. O'quv to'plami S m × n matritsada tasvirlangan, bu erda qatorlar X ∈ S trening ketma-ketliklarining F X xususiyat vektorlarini ifodalaydi . Ushbu matritsaning yozuvlari quyidagicha hisoblanadi. Birinchidan, biz S o'quv ketma-ketliklarining ma'lumotlar bazasini ℓ uzunlikdagi bitta uzun D ketma-ketligiga birlashtiramiz. Masalan, S = { } dan D = uzunlikdagi ℓ = 14 admn, qghk, il, gedkketma-ketlikni olamiz . Ikkinchidan, ℓ V uzunlikdagi oynani D bo'ylab shunday siljitamizki, har bir qadamda uning uzunligi bo'yicha harakatlantiriladi. Ushbu oynaning uzunligi n = ⌈ℓ/ℓ W ⌉ sifatida xususiyat vektorlarining n o'lchamini aniqlaydi, bu erda ⌈ x ⌉ x dan katta yoki unga teng keyingi butun songa yaxlitlashni bildiradi . Yuqoridagi misol uchun biz olamizadmnqghkilgedkℓ W = 4 tanlash uchun n = 4. W t suriluvchi oyna tomonidan hosil qilingan t - chi ketma - ketlikni ( t = 1 ... n ) bildirsin , ya'ni . Ketma-ketlikka asoslangan xususiyatlarni ajratib olish usullarida F X ning har bir komponenti X va t th keyingi W t o'rtasidagi o'xshashlikni o'lchaydigan raqam bilan beriladi . Bu o'lchov, masalan, SVM-Pairwise [ 20 ] da bo'lgani kabi optimal tekislash balli yoki bu erda bepul ball deb ataladigan bo'lishi mumkin.

Boinformatika tadqiqotlarida oynani bitta pozitsiyaga siljitish ham keng tarqalgan. Biroq, bu shunchaki oynani o'lchamiga ko'ra siljitishdan ko'ra ko'proq W t kichik ketma-ketliklarni hosil qiladi va shuning uchun sezilarli darajada kattaroq vektor maydoni. Masalan, 4 o‘lchamdagi oynani D ustiga surganda, faqat n o‘rniga n = ℓ -ℓ W + 1 = 11 ta ketma-ketlik hosil bo‘ladi .o'zgartirish uchun = 4. O'rganish qobiliyati o'lchovga bog'liq bo'lishi mumkin bo'lsa ham, hisoblash murakkabligi ko'p miqdordagi protein ketma-ketligini samarali boshqarish uchun muhim masaladir. Bundan tashqari, o'quv to'plamining birlashtirilgan ketma-ketliklari ustida siljish oynasidan foydalanish faqat dastlabki ketma-ketliklarning bo'laklaridan iborat oynalarga olib kelishi mumkin. Biroq, bu muammo emas, chunki qiziqish uyg'otadigan barcha protein ketma-ketliklari bir xil pastki ketma-ketliklarga qarshi baho beradi. Biz ikkala yondashuvni ham sinab ko'rdik va natijalar aniqlikda sezilarli farq yo'qligini ko'rsatdi.


Yüklə 77,67 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   ...   15




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin