Bir necha oy ichida bir qator sekvensiya markazlari va kompaniyalarining birgalikdagi sa'y-harakatlari inson genomi ketma-ketligining birinchi loyihasini ishlab chiqaradi. Bunday urinish insonning biologik jarayonlarini tushunishda juda dastlabki qadamdir. Yengish kerak bo'lgan birinchi muammo bu genomik ketma-ketlikda barcha kodlash hududlarini aniqlashdir.
Amaldagi algoritmlar juda kuchli bo'lishiga qaramay, barcha eksonlarni aniq aniqlashga qodir emas, turli xil ulanish variantlarini ajratish uchun yaxshi jihozlanmagan va kichik oqsillarni aniqlay olmaydi (ular ko'p va ko'plab biologik jarayonlar uchun juda muhimdir). Barcha potentsial kodlash hududlari bashorat qilingan bo'lsa ham, foydalanuvchilar jamoasi o'z ixtiyorida 80 000 dan 100 000 gacha "yalang'och" oqsillar ketma-ketligiga ega bo'ladi.
Biz bu oqsillarni "yalang'och" deb ataymiz, chunki genomik ma'lumotlar oqsillarning aksariyati maqsadli bo'lgan barcha post-translatsion modifikatsiyalarni (PTM) samarali prognoz qilishga imkon bermaydi. Proteinlar bir marta ribosomalarda sintez qilingandan so'ng, ko'plab modifikatsiya bosqichlaridan o'tadi. Ushbu barcha modifikatsiyalar bilan bog'liq murakkablik, ketma-ketlik darajasida muqobil birlashma hosil qilishi mumkin bo'lgan yuqori darajadagi xilma-xillik bilan qo'shiladi.
Shunday qilib, inson genomi tomonidan ifodalangan turli xil protein molekulalarining soni, ehtimol, genom olimlari tomonidan umumiy hisoblangan yuz mingga qaraganda millionga yaqinroqdir. Murakkablikning yana bir omili - bu protein ketma-ketligi darajasida polimorfizm miqdori. Ushbu polimorfizmlarning ba'zilari kasallik holatlari bilan bog'liq bo'lsa-da, aksariyati bunday emas:
Shuning uchun biz SWISS-PROT sifat standartlariga muvofiq barcha ma'lum inson ketma-ketliklarini izohlash bo'yicha yirik loyihani boshlamoqdamiz. Bu har bir ma'lum protein uchun uning funktsiyasi tavsifi, domen tuzilishi, hujayra ichidagi joylashuvi, translatsiyadan keyingi modifikatsiyalari, variantlari, boshqa oqsillarga o'xshashliklari va hokazolarni o'z ichiga olgan ko'plab ma'lumotlarni taqdim etishni anglatadi. Hozirda 5400 dan bir oz ko'proq izohlangan. SWISS-PROTdagi inson ketma-ketligi. Ushbu yozuvlar ~ 14 500 adabiyot havolalari, 16 000 ta eksperimental yoki bashorat qilingan PTMlar, 800 ta ulanish variantlari va 8000 ta polimorfizmlar (ularning aksariyati kasallik holatlari bilan bog'liq) bilan bog'liq. Biz joriy ma'lumotlardan "Inson proteomikasi tashabbusi" (HPI) deb ataydigan narsa uchun asos sifatida foydalanamiz.
HPI loyihasi quyida qisqacha tavsiflangan bir qator kichik komponentlarni o'z ichiga oladi:
• Barcha ma'lum inson oqsillarining izohi. Keyingi 9 oy davomida (2000 yil apreligacha) SWISS-PROTda hali mavjud bo'lmagan inson oqsillari ketma-ketligi to'liq izohlanadi. Shuningdek, biz hozirda SWISS-PROT da inson ketma-ketligining izohini ko'rib chiqamiz va yakunlaymiz. Ushbu 9 oylik davr oxirida biz to'liq va dolzarb bo'lishini va bundan keyin ham inson oqsillari bilan bog'liq yangi ma'lumotlar paydo bo'lishini kutamiz.
• Inson oqsillarining sutemizuvchilar ortologlari izohi. Biz har qanday inson oqsillari uchun boshqa sutemizuvchilar turlaridagi mavjud ortologlar ham birlashgan inson ketma-ketliklariga teng darajada izohlanishiga ishonch hosil qilamiz.
• Protein ketma-ketligi darajasidagi barcha ma'lum inson polimorfizmlarining izohi. Yuqorida aytib o'tilganidek, SWISS-PROT allaqachon bunday polimorfizmlarning katta miqdori haqida ma'lumotga ega va u oqsil darajasidagi barcha "kichik" o'zgarishlarni saqlash va izohlash bo'yicha sa'y-harakatlarini sezilarli darajada kengaytiradi.
• Inson oqsillaridagi barcha ma'lum post-translatsiya modifikatsiyalarining izohi. Kelgusi 9 oy davomida SWISS-PROT-da taqdim etilgan inson oqsillaridagi ma'lum post-translatsiya modifikatsiyalarining allaqachon to'liq tavsifini to'ldirish uchun katta sa'y-harakatlar amalga oshiriladi.
• Strukturaviy ma'lumotlarga qattiq havolalar. SWISS-PROT PDB/RCSB 3D-tuzilma ma'lumotlar bazasi bilan chambarchas bog'langan va allaqachon tizimli biologlar uchun foydali bo'lgan ko'plab xususiyatlarni o'z ichiga oladi. Bunday yondashuv ilmiy jihatdan ahamiyatli bo'lgan barcha inson oqsillari uchun homologiyadan olingan modellarni taqdim etish orqali ushbu qattiq aloqalar yanada kengaytiriladi.
HPI loyihalarining barcha jihatlari uchun biz ilmiy hamjamiyatning yordami va hamkorligini qadrlaymiz. Inson proteomasi haqidagi ma'lumotlar hayot haqidagi fanlar hamjamiyatining katta qismi uchun juda muhimdir. Shuning uchun biz foydalanuvchilar hamjamiyatiga yordam berish va inson proteomasining keng qamrovli izohini tezlashtirish uchun barcha kerakli ma'lumotlarni taqdim etish orqali ushbu tashabbusda to'liq ishtirok etishni so'raymiz.
HPI loyihasi vaqt bilan bog'liq ikki xil jihatga ega: ulardan biri tadqiqotning hozirgi holatiga moslashish uchun 9 oylik "marafon", ikkinchisi esa bunday loyihani uzoq muddatli saqlash majburiyatidir. bu zarur. HPI loyihasining batafsil tavsifi va uning joriy holati uchun http://www.expasy.ch/sprot/hpi/ saytiga murojaat qiling.
Format va tarkibni yaxshilash
SWISS-PROT-da saqlangan ma'lumotlar ilgari faqat katta harflar bilan ifodalangan. Biz ma'lumotlarni aralash holatga aylantirish jarayonini boshladik. Bu jarayon allaqachon yaxshi yo'lga qo'yilgan va 2000 yil davomida yakunlanadi. Oxirgi 12 oy ichida biz yangi sharh mavzularini ("Turli" va "Farmatsevtika") hamda yangi xususiyat kalitini ("Se_Cys") qo'shdik. “Oʻxshashlik” va “Muqobil mahsulot” sharhlari mavzularidan foydalanish va mazmunini standartlashtirish boʻyicha katta oʻzgarishlar yakunlanmoqda. Kitob va patent ma'lumotnomalarini saqlash uchun ishlatiladigan formatlar ushbu ma'lumotni kompyuterda tahlil qilish uchun o'zgartirildi.
Molekulyar ketma-ketlik ma'lumotlar bazalarida qo'llaniladigan taksonomiyalarni standartlashtirishga hissa qo'shish uchun biz DDBJ/EMBL/GenBank nukleotidlar ketma-ketligi ma'lumotlar bazalari tomonidan qo'llaniladigan NCBI taksonomiyasiga o'tdik. NCBIda saqlanadigan taksonomik tasnif quyidagi manzilda mavjud: http://www.ncbi.nlm. nih.gov/Taxonomy/
Hujjatlar fayllari
SWISS-PROT ko'p sonli hujjat fayllari bilan tarqatiladi. Ushbu fayllarning ba'zilari uzoq vaqtdan beri mavjud (foydalanuvchi qo'llanmasi, nashr yozuvlari, mualliflar uchun turli indekslar, iqtiboslar, kalit so'zlar va boshqalar), lekin ularning ko'plari yaqinda yaratilgan va biz doimiy ravishda yangi fayllarni qo'shmoqdamiz. Hozirda mavjud bo'lgan barcha hujjatlar ro'yxati uchun http://www.expasy/sprot/sp_docu.html ga qarang.
Yangi oʻzaro havolalar
Biz yaqinda SWISS-PROTni Zebrafish Information Network (ZFIN) maʼlumotlar bazasiga bogʻlovchi oʻzaro havolalarni qoʻshdik ( 3 ) (qarang: http://zfish.uoregon.edu/ZFIN/). Shuningdek, biz SWISS-PROT dan CarbBank Complex Carbohydrate Structure Ma'lumotlar bazasiga (CCSD) o'zaro havolalarni qo'shishni boshladik (qarang: http://128.192.9.29/ carbbank/).
Hozirgi vaqtda SWISS-PROT 31 xil ma'lumotlar bazalari bilan bog'langan va o'z rolini biomolekulyar ma'lumotlar bazalarining o'zaro bog'liqligining asosiy markazi sifatida mustahkamladi. 38-chiqarishda har bir ketma-ketlik yozuvi uchun o'rtacha 4,5 o'zaro bog'liqlik mavjud.