260 000 dan ortiq Drosophila melanogaster ESTlari rivojlanishning bir qator bosqichlari va to'qimalaridan ajratilgan (1-jadval). Bularning deyarli barchasi to'liq uzunlikdagi klonlarning foizini maksimal darajada oshirish uchun yaratilgan cDNK kutubxonalaridan olingan 5'-EST. ESTlar genlar va ularning tuzilmalari mavjudligi uchun qimmatli dalillarni taqdim etadi. BDGP shuningdek, Drosophila genlar to'plamini (DGC) ketma-ketlashtirish uchun taxminiy to'liq uzunlikdagi cDNKlarning ortiqcha bo'lmagan to'plamini tanlash uchun ushbu ESTlarning hisoblash tahlilidan foydalangan. Dastlab, cDNKlar ESTlarning o'zaro klasterlanishi natijasida hosil bo'lgan 5'-eng ko'p klonni tanlash orqali tanlangan (138). Release 1 izohli genomik ketma-ketlik mavjud bo'lgandan so'ng, cDNKlar ESTlarni genom ketma-ketligiga moslashtirish orqali tanlandi, so'ngra moslashtirilgan ESTlarni bir-biriga va prognoz qilingan gen modellariga solishtirish; ushbu tanlash strategiyasi to'liq uzunlikdagi cDNK klonlarini ishonchliroq aniqladi (155).
To'liq uzunlikdagi cDNKlar genlarning intron/ekson tuzilishini aniqlash va muqobil splicingni aniqlash uchun mavjud bo'lgan eng aniq dalillarni taqdim etadi. Ular, shuningdek, proteomika va funktsional tahlillar uchun muhim manbadir. Drosophila tadqiqot hamjamiyatining a'zolari tomonidan 3500 dan ortiq individual genlarning cDNKlari ketma-ketlashtirilgan; qo'shimcha ravishda, BDGP DGCda (154) 8 921 ta klonning bir-biriga o'xshash to'plami uchun yuqori sifatli to'liq insert ketma-ketliklarini yaratdi. Izohlangan Release 3 genomik ketma-ketligi ushbu ketma-ket cDNKlarning sifat nazoratini jiddiy baholash imkonini beradi. Genomik ketma-ketlikni taqqoslash natijasida teskari transkriptaza, to'liq ochiq o'qish ramkasi (ORF) bo'lmagan klonlar va kutubxona qurilishining boshqa artefaktlari tufayli yuzaga kelgan xatolar aniqlandi. Ushbu jarayon orqali barcha prognoz qilingan Drosophila genlarining 40 foizini tashkil etuvchi 5300 ta noyob genlar uchun to'liq va aniq ORFlarni o'z ichiga olgan cDNK klonlari aniqlandi.
Release 3 genomik ketma-ketligini izohlash jarayonida kuratorlar cDNK sekvensiyasi quvur liniyasiga qo'shilgan 2013 ta yangi klonni ifodalovchi ESTlarni aniqladilar. Bularga kesilgan ORFlarni o'z ichiga olgan oldingi klonlarni almashtirish uchun tanlangan 309 klon, ilgari DGCda taqdim etilmagan genlar uchun 543 klon va muqobil qo'shilish shakllarini ifodalovchi 833 klon kiradi. Har bir genning har bir asosiy qo'shilish varianti uchun ketma-ket cDNKni olish uchun qo'shimcha EST ketma-ketligi va izohlangan genomik ketma-ketlikdan ishlab chiqilgan zondlar bilan yo'naltirilgan kutubxona skriningi talab qilinadi3.
Genomning evromatik qismining dastlabki izohlarining maqsadi Drosophila proteomini bashorat qilish uchun zarur bo'lgan aniq gen tuzilmalarini olish edi. Release 1 ketma-ketligi asosan 1999 yil noyabr oyida ikki haftalik davrda bioinformatika bo'yicha mutaxassislar va xususiy va davlat sektori biologlari o'rtasidagi misli ko'rilmagan hamkorlikdagi "Annotatsiya Jamboree" ning bir qismi sifatida izohlangan. Ushbu dastlabki izohda 13,601 gen (1) haqida xabar berilgan. Release 1 izohlarining to'g'riligini baholashga urinish, Karlin va boshqalar. (73) kontseptual tarjimalarni SWISS-PROT-da 1999-yilda izohlangan 1-chi reliz ketma-ketligi nashr etilishidan oldin mavjud bo'lgan 1049 polipeptid ketma-ketligidan iborat ma'lumotlar to'plami bilan taqqosladi va ko'plab aniq izoh xatolarini aniqladi. Misra va boshqalar. (108) ushbu holatlarni qayta ko'rib chiqdi va ko'pchilik SWISS-PROT yozuvlarida shtamm polimorfizmlari yoki ketma-ketlik xatolaridan kelib chiqqan degan xulosaga keldi. Reliz 1 nomukammal ketma-ketlikka asoslangan nomukammal izoh edi, lekin u Drosophila tadqiqot hamjamiyati uchun ham, qiyosiy genomikaga qiziquvchilar uchun ham bebaho vosita bo'ldi (85, 140, 164).
Izohlangan ketma-ketlikning 2-relizi 2000 yil oktyabr oyida yaratilgan, ammo ketma-ketlik va izohga faqat kichik o'zgarishlar kiritilgan. Bundan farqli o'laroq, 3-reliz ketma-ketlikning asosiy yangilanishi va uning izohini ifodalaydi. Drosophila genomining annotatsiyasini yangilab turish FlyBase (45) hamjamiyat ma'lumotlar bazasining asosiy mas'uliyatidir. O'nlab FlyBase kuratorlari to'qqiz oy davomida Release 3 annotatsiyasini (108) amalga oshirdilar. Kuratorlar sa'y-harakatlarning izchilligini oshirish uchun hisoblash tahlillari, cDNK ma'lumotlari va oqsillarni moslashtirishni yangilangan izohlarga integratsiya qilish uchun keng qamrovli ko'rsatmalardan foydalanganlar. Har bir gen modeli uchun kuzatilishi mumkin bo'lgan dalillar saqlangan va FlyBase'dan hamma uchun ochiq. Ushbu sa'y-harakatlarni qo'llab-quvvatlash uchun bir nechta yangi ochiq kodli dasturiy vositalar yaratilgan. Har bir modelga tegishli ma'lumotlar ketma-ketlik izohi muharriri Apollo (93) yordamida vizuallashtirildi va baholandi. Kerakli hisoblash tahlillarini yaratish va izohlar va ularni tasdiqlovchi dalillarni saqlash uchun integratsiyalangan hisoblash quvuri va ma'lumotlar bazasi (115) ishlatilgan. Biroq, Release 3 izohlari sifatini yaxshilashning eng muhim sabablari prognoz qilingan genlarning 78% ga mos keladigan cDNK va EST ketma-ketliklarining mavjudligi va izohga ko'proq vaqt ajratilganligidir.
Gen tuzilmalari to'liq uzunlikdagi cDNK ketma-ketligi bo'lmaganda qiyosiy ketma-ketlik tahlili yordamida tasdiqlanishi va takomillashtirilishi mumkin. Uchuvchi tadqiqotda Bergman va boshqalar. (9) D. melanogaster genomining 500 kb dan ortiq qismini qamrab oluvchi beshta Drosophila turlaridan (D. melanogaster, D. erecta, D. pseudoobscura, D. willistoni va D. littoralis) sakkiz genomik mintaqada gen saqlanishini tahlil qildi. Boshqa to'rtta tur mos ravishda 6-15, 46, 53 va 61-65 million yil oralig'idagi farqlanish vaqtlarini qamrab olish uchun tanlangan (128). D. pseudoobscura kabi turli xil turlarda aniqlangan barcha D. melanogaster genlari (va kodlash eksonlarining 78-82%) funktsional cheklanishning dalillarini ko'rsatdi.
Yana uzoqdagi organizmlar ham tekshirildi. D. melanogaster va Anopheles gambiae nasl-nasabi taxminan 250 million yil oldin ajralib chiqqan. Ushbu ikki dipteraning genomlari va proteomlarini solishtirish (13, 171) ikkala genomdagi genlarning deyarli yarmi ortologik ekanligini va o'rtacha ketma-ketlikni taxminan 56% ni tashkil etishini ko'rsatadi. Bu l ketma-ketlik darajasi Fugu rubripes va Homo sapiens ortologlari o'rtasida kuzatilganidan bir oz pastroq bo'lib, ular taxminan 450 million yil oldin ajralib chiqqan, bu ikki hasharotlar ikki umurtqali hayvonlarga qaraganda ancha tezroq ajralib chiqqanligini ko'rsatadi. Gen tartibida bir oz saqlanish pashsha va chivin genomlarida kuzatilishi mumkin, ammo umurtqali hayvonlar turlari orasida kuzatilganidan pastroq darajada. Tegishli chivin va chivinlar ketma-ketligini tahlil qilish shuni ko'rsatadiki, ortologik genlar o'zlarining intron/ekson tuzilishining faqat yarmini saqlab qolgan, bu intron ortishi yoki yo'qolishi har 125 million yilda bir genga taxminan bir tezlikda sodir bo'lganligini ko'rsatadi.
Prognoz qilingan Drosophila oqsillarining taxminan 20% boshqa filalardan organizmlar genomlari tomonidan kodlangan oqsillarga o'xshashlik ko'rsatmaydi. 2000 va 2002 yillarda TrEMBL kabi ommaviy ma'lumotlar bazasidagi oqsillar soni mos ravishda 1 va 2002 yillarda relizlar 1 va 3 relizlar annotatsiyasi o'rtasidagi vaqt oralig'ida eksponent ravishda oshgan bo'lsa-da, oqsil ma'lumotlar to'plamining kattalashishi ularning sonining atigi 14% ga o'sishiga olib keldi. boshqa oqsillarga o'xshash oqsillarni ishlab chiqaradigan chivin genlari. Bu A. gambiae (63) oqsillari bilan taqqoslashni o'z ichiga olmaydi, to'liq genom ketma-ketligiga ega bo'lgan yagona boshqa dipteran, chunki A. gambiae ma'lumotlari mavjud bo'lgunga qadar 3-reliz muzlatilgan. Biz hozir turlarga xos bo'lgan ko'plab Drosophila oqsillari Anopheles oqsillari bilan ketma-ketlik o'xshashligini kutamiz.
3-relizda bildirilgan genlar soni (13,676) 2-reliz izohidan deyarli o'zgarmaydi (2-jadvalga qarang). Biroq, izohlarni qayta ko'rib chiqish genomdagi prognoz qilingan oqsillarning 45% ketma-ketligini va gen modellarining 85% tarkibiy o'zgarishlariga olib keladi. Bu, asosan, 3' va 5' tarjima qilinmagan hududlarning (UTR) yaxshilangan izohlari bilan bog'liq; Endi genlarning 70 foizida izohli UTR ketma-ketligi mavjud. Alohida gen modellarini qo'llab-quvvatlovchi dalillar ham yaxshilandi: gen modellarining 78% EST yoki cDNA ketma-ketligi bilan qo'llab-quvvatlanadi va 82% asosiy mahalliy moslashishni qidirish vositasi (BLASTX yoki TBLASTX) homologiyasi tomonidan qo'llab-quvvatlanadi (2-jadvalga qarang). EST qamrovining kengayishi muqobil birlashmaning ko'plab qo'shimcha holatlarini aniqladi va Release 3 genlarining 20% muqobil transkriptlarga izoh berdi. Transposable elementlar va protein kodlamaydigan RNKlar birinchi marta 3-relizda tizimli ravishda izohlangan.