VecScreen - nuklein kislotaning vektorli bo'lishi mumkin bo'lgan nukleotidlar ketma-ketligini aniqlash va boshqalar.
BLAST qanday ishlaydi Barcha tekisliklar odatda global (ketma-ketliklar to'liq taqqoslanadi) va mahalliy bo'linadi (faqat ma'lum bo'limlar taqqoslanadi). BLAST seriyali dasturlari turli xil oqsillarda o'xshash domenlar va naqshlarning mavjudligi bilan bog'liq bo'lgan mahalliy moslashuvlarni ishlab chiqaradi. Bundan tashqari, mahalliy hizalanish mRNKni genom DNK bilan taqqoslashga imkon beradi. Global hizalanish holatida ketma-ketlikning kamroq o'xshashligi, ayniqsa ularning domenlari va naqshlari aniqlanadi.
O'rganilgan nukleotid yoki aminokislotalar ketma-ketligi (so'rov) BLAST veb-sahifalaridan biriga yuborilgandan so'ng, u boshqa kirish ma'lumotlari (ma'lumotlar bazasi, "so'z" (fitna) hajmi, E qiymati va boshqalar) bilan birgalikda serverga yuboriladi. BLAST barcha "so'zlar" jadvalini tuzadi (oqsilda bu uchta aminokislotadan iborat nuklein kislotalar va 11 ta nuklein kislotadan iborat ketma-ketliklar bo'limidir.
Keyin ularni ma'lumotlar bazasida qidirishadi. Gugurt topilganda, "so'z" ning hajmini (4 yoki undan ko'p aminokislotalar va 12 yoki undan ko'p nukleotidlarga qadar), avval bo'shliqlarsiz (bo'shliqlarsiz), so'ngra ulardan foydalanishga urinish amalga oshiriladi. O'rganilayotgan ketma-ketlikning barcha "so'zlari" o'lchamlarini maksimal kengaytirgandan so'ng, moslashtirish har bir so'rov - juftliklar uchun ma'lumotlar bazasining ketma-ketligi bo'yicha maksimal natijalar bilan belgilanadi va olingan ma'lumotlar SeqAlign tuzilmasida qayd etiladi. BLAST serverida joylashgan formatlash vositasi SeqAlign ma'lumotlaridan foydalanadi va uni turli usullar bilan (an'anaviy, grafik, jadval ko'rinishida) taqdim etadi.
BLAST dasturlari tomonidan ma'lumotlar bazasida aniqlangan har bir ketma-ketlik uchun, o'rganilayotgan ketma-ketlikka (so'rovga) qanchalik o'xshashligini va bu o'xshashlik ahamiyatli ekanligini aniqlash kerak. Buning uchun BLAST har bir ketma-ketlik uchun bit sonini va E qiymatini (kutilgan qiymat, E-qiymat) hisoblab chiqadi.
O'xshashlikni aniqlashda asosiy element o'rin almashtirish matritsasi hisoblanadi, chunki u har qanday mumkin bo'lgan nukleotidlar yoki aminokislotalar juftligi uchun o'xshashlik indekslarini aniqlaydi. BLAST seriyasining ko'plab dasturlarida
LOSUM62 matritsasidan foydalanadi (Bloklarni almashtirish matritsasi 62% identifikatsiya, 62% identifikatsiyali blokni almashtirish matritsasi). Istisno holatlar blastn va megablast (nukleotidni ishlatadigan dasturlar -nukleotidlarni taqqoslash va aminokislotalarni almashtirish matritsalarini ishlatmaslik).
O'zgartirilgan Smith-Waterman yoki Sellers algoritmlaridan foydalanib, barcha segmentlar (kengaytirilgan "so'zlar") aniqlanmagan, chunki ular o'xshashlik ko'rsatkichlarining pasayishiga olib keladi.
Bunday kengaytirilgan "so'zlar" juftlari yuqori ko'rsatkich segmentlari (HSP) deb nomlanadi. O'rganilgan ketma-ketliklar (m) va ma'lumotlar bazasining ketma-ketligi (n) etarlicha katta bo'lsa, HSP o'xshashlik ko'rsatkichlari ikkita parametr K (qidiruv maydonining o'lchami) va P bilan tavsiflanadi.
Ushbu ko'rsatkichlar o'rganilayotgan ketma-ketlik va ma'lumotlar bazasi ketma-ketligining o'xshashlik ko'rsatkichlarini (S) keltirishda ko'rsatilishi kerak.
Amaldagi matritsadan qat'i nazar, turli xil hizalanishlarning o'xshashlik ko'rsatkichlarini taqqoslash uchun ular o'zgartirilishi kerak. O'zgartirilgan o'xshashlik indeksini olish uchun (bitlar soni, B) foydalaning
formula:
B = (P \ cdot S - \ ln {K}) / \ ln {2}
B qiymati ketma-ketliklar bir-biriga qanchalik o'xshashligini ko'rsatadi (bit soni qancha ko'p bo'lsa, o'xshashlik shuncha katta bo'ladi). B hisoblash formulasi K va P ko'rsatkichlarini o'z ichiga olganligi sababli, B qiymatlarini o'zgartirganda ularni ko'rsatishga hojat yo'q,
BLAST dasturlari asosan E ni emas, balki P ning qiymatini aniqlaydilar (indekslari S dan katta yoki unga teng bo'lgan kamida bitta HESga ega bo'lish ehtimoli). Ammo E <0.01 uchun P va E qiymatlari deyarli bir xil.
E ning qiymati faqat ikkita aminokislota yoki nukleotidning ketma-ketligini taqqoslashda formula bilan aniqlanadi. Uzunligi m o'rganilgan ketma-ketlikni ko'plab ma'lumotlar bazalari ketma-ketligi bilan taqqoslash ikki nuqtaga asoslanishi mumkin. Birinchi nuqta, ma'lumotlar bazasining barcha ketma-ketliklari o'rganilayotganga o'xshashdir. Bu ma'lumotlar bazasida mavjud bo'lgan qisqa ketma-ketlik bilan hizalanish uchun E qiymatini uzun ketma-ketlik bilan tekislash uchun E qiymatiga tenglashtirish kerakligini anglatadi. Ma'lumotlar bazasidan E qiymatini hisoblash uchun olingan E qiymatini undagi ketma-ketliklar soniga juft-juft taqqoslash orqali ko'paytirish kerak. Ikkinchi nuqta, o'rganilgan ketma-ketlik uzoq ketma-ketliklarga qaraganda qisqaroqroqqa o'xshaydi, chunki ikkinchisi ko'pincha turli qismlardan iborat (ko'p oqsillar domenlardan iborat). Agar o'xshashlik ehtimolligi ketma-ketlik uzunligiga mutanosib deb hisoblasak, n uzunlikdagi ma'lumotlar bazasi uchun E ning juft qiymatini N / n ga ko'paytirish kerak, bu erda N - bazadagi aminokislotalar yoki nukleotidlarning umumiy uzunligi. BLAST dasturlari asosan ushbu yondashuvdan ma'lumotlar bazasidagi E qiymatlarini hisoblashda foydalanadilar.
Nazariy jihatdan, mahalliy hizalanish har qanday nukleotid yoki aminokislotalarning hizalanadigan ketma-ketligidan boshlanishi mumkin. Biroq, GES, qoida tariqasida, chekkaga yaqin boshlamaydi (boshida yoki oxirida)
ketma-ketliklar. Bunday chekka effektni tuzatish uchun ketma-ketlikning samarali uzunligini hisoblash kerak. 200 dan ortiq qoldiqlar ketma-ketligi holatida zararsizlantirish amalga oshiriladi
BLAST (Basic Basic Alignment Search Tool) - asosiy tuzilish (ketma-ketlik) yoki uning bo'lagi ma'lum bo'lgan oqsillar yoki nuklein kislotalarning homologlarini qidirishda ishlatiladigan kompyuter dasturlari oilasi. BLAST-dan foydalanib, tadqiqotchi o'z ketma-ketligini ma'lumotlar bazasidagi ketma-ketliklar bilan taqqoslashi va taxmin qilinayotgan homologlarning ketma-ketligini topishi mumkin. Bu molekulyar biologlar, bioinformatika, sistematikalar uchun eng muhim vositadir. BLAST dasturi olimlar Stiven Altschul, Uorren Gish, Uebb Miller, Evgeniy Myers va Devid J. Lipman tomonidan AQShning Milliy Sog'liqni saqlash institutida ishlab chiqilgan va 1990 yilda Molekulyar Biologiya jurnalida nashr etilgan [1].
O'rganilgan nukleotid yoki aminokislotalar ketma-ketligi (so'rov) BLAST veb-sahifalaridan biriga kiritilgandan so'ng, u boshqa kirish ma'lumotlari (ma'lumotlar bazasi, "so'z" (fitna) hajmi, E qiymati va boshqalar) bilan birgalikda serverga yuboriladi. BLAST barcha "so'zlar" jadvalini (oqsilda, bu uchta aminokislotadan tashkil topgan va 11 ta nukleotidning nuklein kislotalaridan iborat ketma-ketliklar bo'limi) va shunga o'xshash "so'zlar" ning jadvalini tuzadi.
Keyin ularni ma'lumotlar bazasida qidirishadi. Gugurt topilganda, "so'z" ning hajmini (4 yoki undan ko'p aminokislotalar va 12 yoki undan ko'p nukleotidlarga qadar), avval bo'shliqlarsiz (bo'shliqlarsiz), so'ngra ulardan foydalanishga urinish amalga oshiriladi. O'rganilayotgan ketma-ketlikning barcha "so'zlari" o'lchamlarini maksimal kengaytirgandan so'ng, moslashtirish har bir so'rov - juftliklar uchun ma'lumotlar bazasining ketma-ketligi bo'yicha maksimal natijalar bilan belgilanadi va olingan ma'lumotlar SeqAlign tuzilmasida qayd etiladi. BLAST serverida joylashgan formatlash vositasi SeqAlign ma'lumotlaridan foydalanadi va uni turli usullar bilan (an'anaviy, grafik, jadval ko'rinishida) taqdim etadi.
BLAST dasturlari tomonidan ma'lumotlar bazasida aniqlangan har bir ketma-ketlik uchun, o'rganilayotgan ketma-ketlikka (so'rovga) qanchalik o'xshashligini va bu o'xshashlik ahamiyatli ekanligini aniqlash kerak. Buning uchun BLAST har bir ketma-ketlik uchun bit sonini va E qiymatini (kutilgan qiymat, E-qiymat) hisoblab chiqadi.
O'xshashlikni aniqlashda asosiy element o'rin almashtirish matritsasi hisoblanadi, chunki u har qanday mumkin bo'lgan nukleotidlar yoki aminokislotalar juftligi uchun o'xshashlik indekslarini aniqlaydi. BLAST seriyali dasturlarning aksariyati BLOSUM62 matritsasidan foydalanadi (Bloklarni almashtirish matritsasi 62% identifikatsiya, 62% identifikatsiyali blokni almashtirish matritsasi). Istisnolardan blastn va megablast (nukleotid-nukleotidni taqqoslashni amalga oshiradigan va aminokislotalar matritsasini ishlatmaydigan dasturlar).
O'zgartirilgan Smith-Waterman yoki Sellers algoritmlaridan foydalanib, barcha segmentlar (kengaytirilgan "so'zlar") aniqlanmagan, chunki ular o'xshashlik ko'rsatkichlarining pasayishiga olib keladi. Bunday kengaytirilgan "so'zlar" juftlari yuqori ko'rsatkich segmentlari (HSP) deb nomlanadi. O'rganilgan ketma-ketliklar (m) va ma'lumotlar bazasi ketma-ketligi (n) etarlicha katta bo'lsa, HSP o'xshashlik ko'rsatkichlari ikkita parametr (K qidiruv maydonining o'lchami) va P (hisoblash tizimi) bilan tavsiflanadi. Ushbu ko'rsatkichlar o'rganilayotgan ketma-ketlik va ma'lumotlar bazasi ketma-ketligining o'xshashlik ko'rsatkichlarini (S) keltirishda ko'rsatilishi kerak.