Yashirin Markov modeli ( HMM) - noma'lum parametrlarga ega bo'lgan Markov jarayoniga o'xshash jarayonning ishlashini taqlid qiluvchi statistik model bo'lib, uning vazifasi kuzatilishi mumkin bo'lgan narsalarga asoslangan noma'lum parametrlarni taxmin qilish (qayta tiklash). Olingan parametrlar keyingi tahlilda, masalan, naqshni aniqlash uchun ishlatilishi mumkin. Yashirin Markov modellari haqidagi birinchi eslatmalar 1960-yillarda Baum tomonidan nashr etilgan va 70-yillarda ular birinchi marta nutqni aniqlashda ishlatilgan. 1980-yillarning oʻrtalaridan boshlab HMM biologik ketma-ketliklarni, xususan, DNKni tahlil qilishda qoʻllanila boshlandi.
Markov jarayoni - bu tasodifiy jarayon bo'lib, uning t vaqt parametrining har qanday berilgan qiymatidan keyin evolyutsiyasi t dan oldingi evolyutsiyaga bog'liq bo'lmaydi , agar jarayonning o'sha paytdagi qiymati qat'iy bo'lsa (jarayonning "kelajagiga" bog'liq emas). ma'lum "hozirgi" bilan "o'tmish" bo'yicha; yoki, boshqacha qilib aytganda: jarayonning "kelajak" faqat "hozir" orqali "o'tmish" ga bog'liq).
Markov jarayonini belgilaydigan xususiyat odatda Markov xossasi deb ataladi; u birinchi marta ehtimollar nazariyasi, matematik tahlil va sonlar nazariyasiga katta hissa qo'shgan taniqli rus matematigi Andrey Andreevich Markov (1856-1922) tomonidan tuzilgan. 1907 yil asarlarida A.A. Markov qaram sinovlar ketma-ketligini va ular bilan bog'liq tasodifiy o'zgaruvchilar yig'indisini o'rganish uchun asos yaratdi. Ushbu tadqiqot yo'nalishi Markov zanjirlari nazariyasi sifatida tanilgan . Bioinformatikadan tashqari yashirin Markov modellari kriptoanaliz va mashina tarjimasida qo'llaniladi.
Bioinformatikada yashirin Markov modellari gomologik ketma-ketliklar oilalari o'rtasida mavjud bo'lgan nozik farqlarni tasvirlash uchun xizmat qiladi. Yashirin Markov modellari usuli (Hidden Markov modeli, HMM) uzoq qarindoshlarni solishtirishda ham, oqsillarni katlama yo'llarini bashorat qilishda ham samarali. Butunlay ketma-ketlik tahliliga asoslangan (ya'ni strukturaviy ma'lumotlardan foydalanmaydigan)gina ushbu usul uzoq gomologlarni aniqlashda PSI-BLAST dasturi bilan raqobatlasha oladi.
Yashirin Markov modellari bir nechta ketma-ketlikni tekislash bilan ishlasa ham, bu usul ko'pincha ketma-ketliklarni yaratish uchun ham qo'llaniladi. Odatdagi bir nechta ketma-ketlikni moslashtirish jadvali, odatda, ketma-ket pozitsiyalarda aminokislotalarni tanlash orqali ushbu ketma-ketliklarni yaratish uchun ham ishlatilishi mumkin. Har bir aminokislota profildan olingan pozitsiyaga xos ehtimollik taqsimotidan tanlanadi.
HMM modellari profillardan ko'ra ko'proq umumiy usullardir, chunki ular yaratilgan ketma-ketlikda o'chirish yoki qo'shish ehtimolini, ular uchun pozitsiyaga bog'liq jazolarni o'z ichiga oladi. Agar profillarni qo'llash bir nechta ketma-ket tekislashlarni oldindan qurishni talab qilsa va bu yondashuv bilan so'rovlar statistikasi tekislashni qurishdan keyin aniqlansa, u holda HMM bir vaqtning o'zida ham tekislashni, ham ehtimollikni baholashni amalga oshiradi. 3.18-rasmda ketma-ketlikni yaratish mexanizmi sxematik tarzda ko'rsatilgan. Rasmda uchta pozitsiya va holatlar to'plami (m), (0, (d) ko'rsatilgan. "Start" dan boshlab HMM strelkalar bo'ylab "To'xtash" ga o'tadi.
tizimning ma'lum bir holatiga olib keladi . Ushbu holatlarning har birida (1) ma'lum bir harakat amalga oshiriladi (masalan, aminokislota ko'rsatilgan) va keyin (2) o'q tanlanadi,
3.18-rasm. - Yashirin Markov modeli tuzilishi
bu sizni tizimning keyingi holatiga olib boradi. Harakat va keyingi holatni tanlash muayyan ehtimollar to'plami bilan boshqariladi.
Aminokislota qoldig'i kiritilgan har bir pozitsiyada 20 ta standart 86 ta aminokislotadan birini tanlash uchun bir ehtimollik to'plami beriladi va keyingisiga o'tish jarayonini tanlash uchun ikkinchi ehtimollik to'plami beriladi. jarayonning bosqichi. Ushbu ikkala ehtimollik to'plami ma'lum ketma-ketliklar oilasining adekvat tavsifini berish uchun tanlanadi. Ushbu yondashuvdan foydalangan holda va faqat pozitsion o'ziga xos ehtimollik jadvallarini o'zgartirgan holda, bir xil algoritm ketma-ketlikning turli oilalari uchun ishlatilishi mumkin. 3.18-rasmda HMM ko'p tekislashdagi uchta pozitsiyaning har biri mos keladigan (m) (mach) va o'chirish (d) ga to'g'ri keladi. Qo'shimchalar ( i ) ham qoldiqlarning pozitsiyalari orasida, ham hizalanishning boshida va oxirida bo'lishi mumkin.
Agar berilgan pozitsiya mos keladigan ( m ) mos keladigan bo'lsa, unda mos keladigan aminokislota qoldig'i moslamaga kiritiladi.
Bunday holda, "xaritalash" so'zi faqat HMM ketma-ketligida ham, yakuniy ketma-ketlikda ham ba'zi aminokislotalar mavjudligini anglatadi va ular bir xil aminokislotalar bo'lishi shart emas . Berilgan xaritalash pozitsiyasida 20 ta aminokislotadan birini tanlash ehtimoli foydalanilgan modelning parametrlari, ya'ni ma'lum bir pozitsiyaga aminokislotalarni kiritishning pozitsiyaga xos ehtimollari bilan belgilanadi.
O'chirish (d) bo'lsa, bu bir nechta tekislash ustuni o'tkazib yuboriladi. Birinchi o'chirishning kiritilishi o'chirish oralig'ining ochilishini anglatadi (bo'shliq-ochiq) va bunday kiritish ehtimoli o'chirishni kiritish uchun jazoni belgilaydi, bu ham pozitsiyaga xosdir. Birinchisidan so'ng darhol ikkinchi o'chirishning kiritilishi o'chirishning davom etishini anglatadi ( bo'shliqni uzaytirish), buning uchun jazo ham qo'llanilishi mumkin.
Qo'shimchalar ( i ) bir tekisda ketma-ket ikkita pozitsiya orasiga joylashtiriladi. Agar dastur qo'shimchani kiritsa, u holda hosil qilingan ketma-ketlikka (bu holatda) bir nechta tekislash amalga oshiriladigan ketma-ketlikdagi qoldiqlarga mos kelmaydigan qoldiq kiritiladi. Birinchi qo'shimchadan keyin ikkinchisi va shunga o'xshash bir qoldiqdan kattaroq qo'shimchani hosil qilish mumkin.
Taqqoslash va kiritish orqali olingan qoldiqlar ketma-ketligi kerakli (hosil qilingan) ketma-ketlikdir.
Tegishli harakat (t, d yoki i) bajarilgandan so'ng, grafikning keyingi tuguniga o'tish yangi ehtimolliklar to'plami bilan aniqlanadi.
Har qanday mumkin bo'lgan pozitsiyalar ketma-ketligida tuzilgan tekislashning har bir ustuni mos kelishi yoki o'chirilishi kerak - a ( m ) - tugun yoki ( d? ) - tugunidan o'tmasdan grafikni kesib o'tishning hech qanday usuli yo'q. ketma-ketlikdagi har bir pozitsiya uchun shunday.
Ta'riflangan tizimning dinamikasi shundan iboratki, faqat joriy pozitsiya keyingi o'tish uchun mumkin bo'lgan o'qlardan qaysi biri tanlanishini aniqlaydi, boshqacha aytganda, tizim o'z tarixini "eslab qolmaydi". Va bu Markov jarayonlariga xos bo'lgan narsadir.
E'tibor bering, dastur ishidagi pozitsiyalar (yoki bosqichlar) ketma-ketligi algoritm operatsiyasi natijasida hosil bo'lgan aminokislotalar ketma-ketligidan farqlanishi kerak.
Ma'lum bo'lishicha, tizim orqali turli yo'llar bir xil ketma-ketlikni yaratishi mumkin.
Natijada, biz algoritm natijasini olamiz va grafikni tizim ichida o'tkazish va "Start" va "To'xtatish" o'rtasida ma'lum bir "marshrut" tanlashning barcha "tafsilotlari" yashirin (yashirin) qoladi. Shuning uchun nom - yashirin Markov modeli (Yashirin Markov modeli). Algoritmning ma'lum ketma- ketliklar to'plami uchun ishlashining o'ziga xosligi har bir pozitsiya uchun alohida o'rnatiladigan aniq ehtimollar to'plami (qolganlarni tanlash va o'tishni tanlash) bilan belgilanadi.
Biologik ketma-ketlikni tahlil qilish uchun HMMlarni amalga oshiradigan dasturlar quyidagilarni amalga oshirishi mumkin.
Ta'lim. Noto'g'ri moslashtirilgan gomologik ketma-ketliklar to'plamini hisobga olgan holda, (1) ularni tekislash va (2) berilgan ketma-ketliklarni tavsiflovchi HMMni aniqlash uchun shunday o'tish va qoldiq tanlash ehtimolini tanlash mumkin.
Uzoq gomologlarni qidiring. HMM va qiziqishlar ketma-ketligini hisobga olgan holda, HMM ushbu ketma-ketlikni yaratishi ehtimolini hisoblash mumkin. Agar ma'lum ketma-ketliklar oilasi uchun ishlab chiqilgan HMM buni etarlicha yuqori ehtimollik bilan amalga oshira olsa, bu o'rganilayotgan ketma-ketlikning ham ushbu turkumga tegishli ekanligini ko'rsatadi.
Qo'shimcha ketma-ketliklarni tekislash. Berilgan HMMda har qanday marshrutdan o'tish ehtimoli, ya'ni ma'lum holatlar to'plamini olish ehtimoli alohida shtatdan shtatga o'tish ehtimolidan hisoblanishi mumkin . HMM bir yoki bir nechta test ketma-ketligini yaratish uchun foydalanadigan holatlarning eng ehtimoliy ketma-ketligini topish ularning ma'lum ketma-ketliklar oilasi bilan optimal mos kelishini ko'rsatadi.