Annotatsiya guruhlari ilmiy adabiyotlar ma'lumotlari va tadqiqotchilarning o'zlari tomonidan taqdim etilgan ma'lumotlarga asoslanib, shifrlangan ketma-ketliklarning strukturaviy yozuvlarini yaratadilar va ularni EMBL (Yevropa molekulyar biologiya laboratoriyasi) va DDBJ ( Yaponiya DAN ma'lumotlar banki ) kabi xalqaro nukleotid ma'lumotlar bazalari bilan almashadilar . ). Entrez. EMBnet uchun SRS singari, NCBI ma'lumotlar bazalaridan molekulyar biologiya ma'lumotlarini olish (shuningdek, bibliografik manbalarga havolalarni tashkil qilish) uchun Entrez brauzerini (http://www.ncbi.nlm.nih.gov/sites/gquery) ishlab chiqdi. , NCBIda birlashgan (2.2-rasm).
Entrez turli ma'lumotlar bazalaridagi o'xshash yozuvlarni, ular o'rtasida o'zaro bog'lanishlar mavjudligidan qat'i nazar, bir-biriga bog'lash imkonini beradi. Entrez quyidagilarga kirishni ta'minlaydi: DNK ketma-ketligi ma'lumotlar bazalari - GenBank, EMBL va DDBJ; oqsil ketma-ketligi ma'lumotlar bazalari -
Swiss-Prot (http://www.expasy.org/sprot/),
PIR (http://pir.georgetown.edu/),
PRF (http://www.genome.jp/dbget-bin/www_bfind?prf),
SeqDB, PDB, DNK ketma-ketliklarini tarjima qilish orqali olingan oqsil ketma-ketliklari;
genom va xromosomalarni xaritalash uchun ma'lumotlar bazalari, PDB dan uch o'lchovli oqsil tuzilmalari;
PubMed bibliografik ma'lumotlar bazasi.
2.2-rasm. Entrez veb-sahifasi
Turli ma'lumotlar bazalari o'rtasidagi bunday aloqa ushbu tizimning kuchi hisoblanadi. Entrezni NCBI resurslaridan ketma-ketliklar va tuzilmalarni namuna olish uchun boshlang'ich nuqta deb atash mumkin.
Entrez - bu tarmoq ma'lumotlarini qidirish tizimi. U barcha NCBI ma'lumotlar bazalarida mavjud bo'lgan ma'lumotlarni birlashtiradi. Bu NCBI tomonidan qo'llab-quvvatlanadigan barcha ma'lumotlar bazalari uchun umumiy old qism va juda qulay. Hammasi bo'lib Entrez 11 ta ma'lumotlar bazasiga havolalarga ega. NCBI ketma-ketliklarni tavsiflovchi heterojen ma'lumotlar munosabatlari modelini ishlab chiqdi. Buning yordamida mashhur Entrez axborot-qidiruv tizimi tomonidan boshqariladigan dasturiy ta'minot va ma'lumotlar bazasi integratsiyasining jadal rivojlanishi mumkin bo'ldi. GenBank ma'lumotlar bazasi xuddi shu modelda qurilgan. Ushbu modelning afzalliklari orasida DNK ketma-ketliklarining tavsifi va ular kodlagan oqsillar, xromosomalarning genetik xaritalari va tegishli oqsillarning fazoviy tuzilmalari o'rtasida oson o'tish imkoniyati, shuningdek, ular bilan bog'liq ma'lumotlarni o'z ichiga olgan nashr etilgan adabiyotlar ro'yxati kiradi. obyektlar.
NCBI ma'lumotlar modeli to'g'ridan-to'g'ri DNK ketma-ketligi va oqsil ketma-ketligi bilan ishlaydi. Tarjima jarayoni bir-biriga o'zaro izohlar emas, balki bu ikki ketma-ketlik o'rtasidagi bog'liqlik sifatida taqdim etiladi. Protein tavsifini o'z ichiga olgan izohlar (masalan, peptid degradatsiyasi mahsulotlari) oqsil ketma-ketligiga to'g'ridan-to'g'ri izohlangan xususiyatlar sifatida taqdim etiladi.
Ushbu printsip tufayli translatsiya natijasida olingan protein ketma-ketligini va BLAST dasturi yoki boshqa ketma-ketlik namunalarini olish vositasidan foydalangan holda DNK kodlash ketma-ketliklarining xususiyatlarini tahlil qilish juda qulay bo'ldi (va bundan tashqari, asl gendan fikr-mulohazalarni yo'qotmasdan). DNK ketma-ketligi va uning tarjima mahsulotlaridan iborat to'plam NucProt to'plami (NucProt to'plami) deb ataladi. NCBI da ishlab chiqilgan ma'lumotlar modeli ketma- ketlik turini "segmentlangan ketma-ketlik" sifatida tavsiflaydi . GenBank, EMBL va DDBJ segmentlangan ketma-ketliklarning rekonstruksiya qilingan yig'indilarini qo'shni qoplangan hududlar (yoki kontiglar) sifatida ifodalaydi. Entrez bunday yig'ilishni uning barcha tarkibiy qismlarini birlashtiruvchi chiziq sifatida ko'rsatadi.
Contig (ingliz tilidan. contiguous - qo'shni, qo'shni) - (1) genomning bir qismini yoki butun genomni ma'lum tartibda doimiy ravishda bir-biriga yopishtiruvchi klonlangan DNK bo'laklari to'plami; (2) fizik xaritaning ko'rinishi, unda markerlar parchalar klonlanadi.
Ko'zgular va intranet. Ko'zgular ba'zi sabablarga ko'ra kirish imkoni bo'lmagan asosiy serverga xizmatlar va ma'lumotlarni taqdim etadigan takroriy serverlar deb ataladi. Kerakli veb-saytga kirish uchun brauzeringizning manzil satriga uning URL manzilini kiritishingiz kerak.
Ko'pgina ta'lim muassasalarida "Intranet", ya'ni korporativ lokal tarmoq mavjud bo'lib, unga faqat ushbu muassasa kompyuterlaridan ulanish mumkin. Butunjahon o'rgimchak to'rini juda kuchli qiladigan keng tarmoq (WWW). Dastlabki kirish uchun quyidagi asosiy shlyuz veb-saytlari tavsiya etiladi:
NCBI - http://www.ncbi.nlm.nih.gov/
EMBL-EBI - http://www.ebi.ac.uk/
ExpASy Proteomics Server - http://www.expasy.ch/
EMBL-Heidelberg - http://www.embl.de/
Ta'lim manbalari - http://www.ebi.ac.uk/2can/home.html
Bioinformatika resurslari - http://anil.cchmc.org/BioInfoRes.html
Bioinformatika veb-saytlari - http://pbil.univ-lyon1.fr/bookmarks.html Bioinformatika veb-resurslari - http://www.cs.columbia.edu/~cleslie/cs4761/resources.html
Ro'yxatda keltirilgan veb-saytlardan tashqari, u yoki bu tarzda biologiyaga oid ko'plab ixtisoslashgan saytlar mavjud. Umumiy qidiruv tizimlari ushbu manbalarni topishda yordam berishi mumkin:
Google - http://www.google.com/
Yahoo - http://www.yahoo.com/
Alta Vista - http://www.altavista.com/
Hotbot - http://www.hotbot.com/