1 1111 ; 1 11 Contig 1 i ; Kontig 2i Contig 3 i b ~ _2" _G
« AV - AV
Ketma-ket kodlash 1 kontig 2 kontig 3
4.7-rasm. Shotgun ketma-ket iskala yig'ish
Birinchidan, alohida kontiglar klon ketma-ketligini o'qishlar orasidagi noyob o'xshashliklarni tahlil qilish asosida tuziladi (4.7 (a)-rasm). Keyin kontiglarning juftlashgan uchlarining so'nggi qismlari o'qiladi (4.7 (b)-rasm), buning natijasida kontiglar to'g'ri tartibga solinadi va yo'naltiriladi va ular orasidagi bo'shliqlar ko'prik qilinadi va iskala deb ataladigan kattaroq birliklarga birlashtiriladi. ( 4.7(b)-rasm).
Floresan sekvensiya texnologiyasining joriy etilishi DNK ketma-ketligi bo'yicha ma'lumotlarni to'plash tezligini tezlashtirdi. Ko'proq ketma-ketlik reaktsiyalari endi bir xil vaqt ichida bajarilishi mumkin va protokollar avtomatlashtirish uchun ko'proq mos keladi. Agar reaksiyalar lyuminestsent jelda sodir bo'lsa, u holda lazerdan kelib chiqqan floresans to'g'ridan-to'g'ri kompyuter tomonidan qayd etiladi.
Odatda, gel elektroforezi 36 parallel chiziqda amalga oshiriladi. Chiqarish ma'lumotlari rang-kodlangan tepaliklar seriyasidir, ularning ustida asosiy belgilar qatori joylashgan. Agar xromatogrammani sharhlovchi dastur ma'lum bir pozitsiyada qaysi bazani nomlash kerakligini aniqlay olmasa, "-" bo'sh joy belgisi paydo bo'ladi. Yakuniy ketma-ketlik ma'lumotlar faylida bunday noaniq pozitsiyalar "N" harfi bilan ko'rsatilgan.
Klonlar namunasi kutubxonadan tasodifiy tanlanadi - masalan, 2 million klon kutubxonasidan 10 000 ta. 10 000 ta ketma-ketlik reaksiyalarini boshlash va keyin ularni autosequencerlarda bajarish uchun murakkab avtomatlashtirilgan ketma-ketlik operatsiyasi bajariladi. Olingan ma'lumotlar keyingi tahlil qilish uchun ma'lumotlar bazasiga yuklanadi.
Ideal natija - har biri 200-400 nukleotiddan iborat bo'lgan va 10 000 klonning har biridan ketma-ketlikning ma'lum bir qismini ifodalovchi 10 000 ta ketma-ketlik to'plami.
Darhaqiqat, ba'zi ketma-ketlik reaktsiyalari umuman muvaffaqiyatsiz bo'ladi, ba'zilari etarli ma'lumot bermaydi va ba'zilari qabul qilinishi mumkin bo'lmagan sifatdagi ma'lumotlarni ishlab chiqaradi. Ushbu jarayondan muvaffaqiyatli o'tgan ketma- ketliklar Expressed Sequence Tags ( EST ) deb ataladi.
Olingan EST belgilari GenBank, EMBL va DDBJ-ga joylashtiriladi.
EST teglariga kirish ushbu ma'lumotlar bazalarining barchasi orqali ochiq. Xuddi shu EST teglari NCBI tomonidan yuritiladigan dbEST (Expressed Sequence Tags ma'lumotlar bazasi) da mavjud .
Ochiq o'qish ramkasini topish. ORF
Finder.
molekulyar genetikada , Ochiq o'qish ramkasi ( ORF ) o'qish ramkasining tarjima qilish qobiliyatiga ega bo'lgan qismidir . ORF - boshlanish bilan boshlanadigan kodonlarning qo'shni qismidir kodon (odatda AUG) va to'xtash kodon bilan tugaydi (odatda UAA, UAG yoki UGA). ORF ichidagi ATG kodoni ( RNK jihatidan AUG ) (birinchi bo'lishi shart emas) tarjimaning qayerdan boshlanishini ko'rsatishi mumkin. Tugatish sayti transkripsiya ORF dan keyin , translatsiya to'xtash kodonidan keyin joylashgan . Agar transkripsiya stop-kodon paydo bo'lgunga qadar to'xtagan bo'lsa, tarjima paytida to'liq bo'lmagan oqsil hosil bo'lar edi. Ko'p ekzonli eukaryotik genlarda intronlar olib tashlanadi va ekzonlar transkripsiyadan so'ng oqsillarni tarjima qilish uchun yakuniy mRNK hosil qilish uchun birlashtiriladi. Gen kontekstida topish, ORF dan start-stop aniqlash qo'llaniladi, shuning uchun genomik DNK emas, balki faqat birlashtirilgan mRNK qo'llaniladi, chunki intronlar to'xtash kodonlarini o'z ichiga olishi va/yoki o'qish ramkalari o'rtasida siljishlarni keltirib chiqarishi mumkin. Muqobil ta'rif shuni ko'rsatadiki, ORF uzunligi uchga karrali va to'xtash kodonlari bilan chegaralangan ketma-ketlikdir. Ushbu umumiy ta'rif transkriptomika va/yoki kontekstda ham foydali bo'lishi mumkinmetagenomika, bu erda boshlang'ich va/yoki to'xtash kodoni hosil bo'lgan ketma-ketlikda mavjud bo'lmasligi mumkin. Bunday ORF to'liq genga emas, balki genning qismlariga mos keladi.
biologik ahamiyati
genlarni bashorat qilishda yordam beradigan dalil sifatida ishlatiladi . Uzoq ORF ko'pincha, boshqa dalillar qatorida , DNK ketma -ketligidagi nomzod protein kodlash hududlarini yoki funktsional RNK kodlash hududlarini dastlabki aniqlash uchun ishlatiladi . ORF mavjudligi mintaqa har doim efirga uzatilishini anglatmaydi . Shunday qilib, masalan, har bir nukleotidning teng foiziga ega bo'lgan tasodifiy yaratilgan DNK ketma-ketligida har 21 marta A to'xtash kodoni kutiladi.kodonlar.
Oddiy algoritm prokaryotlar uchun genlar boshlang'ich kodonni izlashi mumkin, so'ngra odatdagi oqsilni kodlash uchun etarlicha uzunlikdagi ochiq o'qish ramkasi, bu mintaqadagi kodondan foydalanish ushbu organizmning kodlash hududlari uchun chastota reaktsiyasiga mos keladi. Shuning uchun, ba'zi mualliflar ORF 100 yoki 150 kodon kabi minimal uzunlikka ega bo'lishi kerakligini aytishadi. O'z-o'zidan, hatto uzoq ochiq o'qish ramkasi ham gen mavjudligining ishonchli dalili emas . Boshqa tomondan, oqsil kodlovchi genlarning klassik xususiyatlariga ega bo'lmagan ba'zi qisqa ORFlar (sORFs) funktsional peptidlarni ishlab chiqarishi mumkinligi ko'rsatilgan. Sutemizuvchilarning taxminan 50% 5'NTR mRNKlari bir yoki bir nechta sORFlarni o'z ichiga olishi ma'lum. Eksperimental ravishda topilgan sORF tarjimasini boshlash joylarining 64-75% odam va sichqon genomlarida saqlanib qolgan va bu elementlarning funktsiyani bajarishini ko'rsatishi mumkin. Biroq, sORFlar ko'pincha faqat kichik mRNK shakllarida topilishi mumkin va tanlovdan qochish mumkin; boshlash joylarining yuqori konservatizmi ularning tegishli genlarning promouterlari ichida joylashishiga bog'liq bo'lishi mumkin. Bu holat, masalan, SLAMF1 geni uchun xosdir.
Olti kvadrat tarjima. DNK uchta nukleotid (kodon) guruhlarida talqin qilinganligi sababli, DNK zanjirida uch xil o'qish ramkalari mavjud. DNK molekulasining qo'sh spirali ikkita antiparallel zanjirga ega; Har birida uchta o'qish ramkasi bo'lgan ikkita ip bilan oltita ramka tarjimasi mavjud.
Olti kadrli tarjimaga misol. Nukleotidlar ketma-ketligi o'rtada yuqorida oldinga va pastda teskari tarjima bilan ko'rsatilgan. Ketma-ketlik bilan ikkita mumkin bo'lgan ochiq o'qish ramkalari aniqlandi.
O'qish ramkalari uchun qidiruvni oching
ORF topuvchisi siz kiritgan DNK ketma-ketligida ochiq o'qish ramkalarini (ORF) qidiradi. Dastur har bir ORF diapazonini oqsil tarjimasi bilan birga qaytaradi. Potensial oqsil kodlash segmentlari uchun yangi ketma-ketlashtirilgan DNKni qidirish uchun ORF qidiruvchisidan foydalaning, prognoz qilingan oqsilni yangi ishlab chiqilgan SMART BLAST yoki an'anaviy BLASTP bilan tekshiring.
ORF brauzerining ushbu veb-versiyasi 50 KB gacha bo'lgan so'rovlar ketma-ketligi pastki diapazoni bilan cheklangan. Linux x64 uchun so'rovlar ketma-ketligi uzunligi bo'yicha cheklovsiz mustaqil versiya mavjud .