Nazorat savollari va topshiriqlari Nukleotidlar va aminokislotalarning bir harfli belgilarini yozing.
Genetik kod nima?
Tarjima va oqsillarni katlama jarayonlari o'rtasidagi paradoksal farq nima?
Qaysi uchta axborotga asoslangan jarayon asosan bioinformatika tomonidan tahlil qilinadi?
Biologik ketma-ketlikni moslashtirish nima?
Ketma-ketliklar umumiy ajdoddan kelib chiqqan holda qanday uch turdagi o'zgarishlar sodir bo'ladi?
Global ketma-ketlikni moslashtirish nima?
Mahalliy ketma-ketlikni moslashtirish nima?
Ketma-ketliklarni tekislashda mos keladigan motivlarni qidirish nima?
Ko'p tekislash nima?
O'xshashlik nuqta matritsasi nima va u nima uchun ishlatiladi?
O'xshashlik nuqta matritsalarida teskari va palindromik ketma-ketliklar qanday namoyon bo'ladi?
O'xshashlik matritsalarida qo'shish va o'chirish qanday paydo bo'ladi?
Nega, biolog nuqtai nazaridan, mahalliy o'xshashlikni izlash ketma-ketlikning butun uzunligi bo'ylab moslashishni baholashdan ko'ra mazmunli va aniqroq natijalar berishi mumkin?
Grafik va digraf o'rtasidagi o'xshashlik va farqlar qanday?
Digrafda marshrut nima deyiladi?
Grafikning boshlanishi (manbai) va oxiri (drenaj) nima? Qaysi tugunlar global tekislash grafigida manbalar va chuqurliklardir?
Optimal tekislash nima va u suboptimal tekislashdan qanday farq qiladi?
2. Biologik ketma-ketlikni bir va ko'p qiyoslash
. BLAST algoritmi.
2.1. Portlash algoritmi ( asosiy mahalliy tekislash qidirmoq asbob Yangi genomdagi genlarni ma'lumotlar bazasidagi barcha ketma-ketliklar bilan solishtirish odatiy holdir.
Odatda birinchi navbatda taxminiy usullar qo'llaniladi , ular o'xshash ketma-ketliklarni topish uchun yaxshi va tez ishlashi mumkin, lekin juda uzoq munosabatlarni qidirganda, ular aniq usullar kabi ishlamasligi mumkin.
Amalda, taxminiy usullar so'rovlar ketma-ketligi ma'lumotlar bazasidagi bir yoki bir nechta ketma-ketliklarga etarlicha o'xshash bo'lgan ko'p hollarda qoniqarli natijalar beradi, birinchi navbatda ularni sinab ko'rish mantiqan.
Odatiy taxminiy yondashuv ba'zi bir kichik tamsayı k qiymatini tanlaydi va ma'lumotlar bazasida istalgan ketma-ketlikda paydo bo'ladigan so'rovlar ketma-ketligidagi k uzunlikdagi belgilarning barcha pastki qatorlarini topadi .
Bunday qisqa bir xil ketma-ketlik "so'z" yoki " k -tuple " ("k-tuple") deb ataladi. Matematikada kortej chekli sonli elementlar ketma-ketligidir. Ba'zi dasturlash tillarida kortej ma'lumotlar strukturasining maxsus turi hisoblanadi. Python da kortej ro'yxatdagidan farq qiladi, chunki kortejni o'zgartirib bo'lmaydi .
” so‘zining o‘zi o‘sib boruvchi uzunlikdagi so‘zlarni sanashda umumlashtiruvchi “qo‘shimcha”ning bir turi hisoblanadi: yakka , qo‘sh , uchlik , to‘rtlik , beshlik , oltita , to‘rtta , sakkizta , ..., “- tup , ...
Nomzodlar ketma-ketligi - bu ma'lumotlar bazasidagi ko'p sonli mos keladigan k - kortejlarni o'z ichiga olgan ketma-ketlik.
So'ngra, tanlangan qatorlar to'plami uchun taxminiy optimal tekislash hisoblari bir nechta mos keladigan k - kortejlar to'plamini o'z ichiga olgan diagonallar ichida matritsadan o'tishni o'z ichiga olgan vaqtinchalik va fazoviy cheklovlar bilan amalga oshiriladi. FASTA va BLAST kabi dasturlarning algoritmlarida amalga oshirilgan so'z yoki k -tuple usullari so'rovlar ketma-ketligi bilan eng yaxshi mos keladigan nomzodlar ketma-ketligini izlashda butun ma'lumotlar bazasini skanerlash uchun etarlicha tezdir. FASTA va BLAST dasturlarining algoritmlari evristik bo'lib, ya'ni mashina dasturlashning empirik usullariga asoslangan bo'lib, bunda yechim tajriba bilan belgilangan qoidalarga muvofiq topiladi va natijani aniqlashtirish uchun fikr-mulohazalardan foydalaniladi. Ma'lumotlar bazasini qidirishning asosiy operatsiyasi so'rovlar ketma-ketligini har bir ma'lumotlar bazasi nomzodi ketma- ketligi bilan moslashtirishdan iborat; va agar evristik usullar bu operatsiyani ancha tez bajarishga imkon bersa, u holda dinamik dasturlashning algoritmik usullaridan ko'ra ulardan foydalangan ma'qul.
FASTA dasturi ham yuqori sezuvchanlik darajasini, ham yuqori o'xshashlikni qidirish tezligini ta'minlaydi. Sezuvchanlikka optimallashtirilgan mahalliy moslashtirish algoritmlari va FASTA dasturida amalga oshirilgan almashtirish matritsasi tahlili tufayli erishiladi.