Kurs ishi mavzu: Oqsil ketma-ketliklari bazalari (swiss-prot)
O‘ZBEKISTON RESPUBLIKASI OLIY TA’LIM VAZIRLIGI
Urganch Davlat Universiteti
Tabiiy fanlar fakulteti biologiya sirtqi ta’lim yo’nalishi
183-guruh talabasi Shokirova Shamsiyaning
Bioinformatika fanidan
KURS ISHI
Mavzu: Oqsil ketma-ketliklari bazalari (SWISS-PROT).
Bajardi: Shokirova Shamsiya
Tekshirdi: Raximova Sh
Urganch 2023
REJA:
I bob. Kirish.
II bob. Asosiy qism.
2.1. TrEMBL-oqsil ketma-ketliklari bazalari.
2.2. SWISS-PROT protein ketma-ketligi ma'lumotlar bazasi va uning qo'shimchasi TreEMBL 2000 yilda.
2.3. UniProt haqida.
2.4. PIR - oqsil ketma-ketliklari bazalari.
III bob. Xulosa.
Foydalanilgan adabiyotlar.
I-bob. Kirish
SWISS-PROT - bu oqsillar ketma-ketligi ma'lumotlar bazasi bo'lib, u yuqori darajadagi izohlarni (masalan, oqsil funktsiyasining tavsifi, uning domenlarining tuzilishi, post-translatsiyadan keyingi modifikatsiyalari, variantlari va boshqalar), minimal darajada ta'minlashga intiladi. ortiqcha va boshqa ma'lumotlar bazalari bilan yuqori darajadagi integratsiya. Ma'lumotlar bazasining so'nggi ishlanmalariga quyidagilar kiradi: model organizmlar soni va ko'lamining ko'payishi; ikkita qo'shimcha ma'lumotlar bazasiga o'zaro havolalar; turli xil yangi hujjatlar fayllari va SWISS-PROTga kompyuter izohli qo'shimchasi bo'lgan TrEMBL ni yaratish. Ushbu qo'shimcha SWISS-PROTga allaqachon kiritilgan CDSdan tashqari, EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasidagi barcha kodlash ketma-ketliklarining (CDS) tarjimasidan olingan SWISS-PROT formatidagi yozuvlardan iborat.
SWISS-PROT 1986 yilda tashkil etilgan va 1987 yildan beri Jeneva universiteti Tibbiy biokimyo kafedrasi va EMBL ma'lumotlar kutubxonasi (hozirgi EMBL Outstation-Evropa bioinformatika instituti) tomonidan hamkorlikda olib boriladi . ). SWISS-PROT protein ketma-ketligi ma'lumotlar banki ketma-ketlik yozuvlaridan iborat. Ketma-ket yozuvlar har xil chiziq turlaridan iborat bo'lib, ularning har biri o'z formatiga ega. Standartlashtirish maqsadida SWISS-PROT formati EMBL nukleotidlar ketma-ketligi maʼlumotlar bazasiga imkon qadar yaqinroq boʻladi. SWISS-PROT yozuvining namunasi 1-rasmda ko'rsatilgan.
SWISS-PROT ma'lumotlar bazasi o'zini boshqa oqsillar ketma-ketligi ma'lumotlar bazalaridan uchta alohida mezon bilan ajratib turadi.
TrEMBL - bu kompyuterda izohlangan proteinlar ketma-ketligi ma'lumotlar bazasi SWISS-PROT Proteinlar ketma-ketligi ma'lumotlar banki. TrEMBL ning tarjimalarini o'z ichiga oladi EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasida mavjud bo'lgan barcha kodlash ketma-ketliklari (CDS) hali SWISS-PROT-ga integratsiyalanmagan. TrEMBLni dastlabki deb hisoblash mumkin SWISS-PROT bo'limi. Nihoyat bo'lishi kerak bo'lgan barcha TrEMBL yozuvlari uchun standart SWISS-PROT sifatiga, SWISS-PROT ulanish raqamlariga yangilandi tayinlanganlar.
Davom etayotgan genlarni sekvensiyalash va xaritalash loyihalari keskin tus oldi SWISS-PROT ga qo'shiladigan protein ketma-ketliklari sonini oshirdi. Biz SWISS-PROT sifat standartlarini birlashtirish orqali susaytirmoqchi emasmiz to'g'ri ketma-ketlik tahlili va izohsiz ketma-ketliklar, lekin biz buni xohlaymiz ketma-ketliklarni imkon qadar tezroq mavjud qiling. TrEMBL bu soniyaga erishadi maqsad va keyingi tezlashtirish jarayonidagi asosiy qadamdir annotatsiyani standart SWISS-PROT sifatiga oshirish. Ortiqchalik muammosini hal qilish uchun barcha kodlashning tarjimalari EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasiga allaqachon kiritilgan ketma-ketliklar (CDS). SWISS-PROT da TreEMBL dan olib tashlandi.
Biz ushbu qo'shimchani asboblardan beri TreEMBL (EMBL dan tarjima) deb nomlaymiz CDS tarjimalarini yaratishda foydalaniladi, dasturga asoslanadi EMBL da Thure Etzold tomonidan yozilgan "trembl".
Ushbu TrEMBL versiyasining maqsadi SWISS-PROT bilan sinxronlashtirishga erishishdir 37.0 versiyasi. Shuning uchun, SWISS-PROT 37.0 versiyasida mavjud bo'lgan barcha ketma-ketlik yozuvlari TrEMBL 9-versiyasidan olib tashlandi, mavjud TrEMBL yanada yangilandi yozuvlarga erishildi va faqat bir nechta yangi yozuvlar kiritildi.
TrEMBL 9-versiyasida 59'461'791 aminokislotadan iborat 221422 ta ketma-ketlik yozuvlari mavjud.
kislotalar.
TrEMBL ikkita asosiy bo'limga bo'lingan: SP-TrEMBL va REM-TrEMBL:
SP-TrEMBL (SWISS-PROT TrEMBL) yozuvlarni (179'066) o'z ichiga oladi.
oxirida SWISS-PROT tarkibiga kiritildi. SWISS-PROT ulanish raqamlari mavjud
barcha SP-TrEMBL yozuvlari uchun tayinlangan.
SP-TrEMBL quyi bo'limlarda tashkil etilgan:
arc.dat (Archea): 7315 ta yozuv
fun.dat (Qo'ziqorin): 5862 yozuv
hum.dat (Inson): 7594 ta yozuv
inv.dat (umurtqasizlar): 22665 ta yozuv
mam.dat (Boshqa sutemizuvchilar): 2792 ta yozuv
mhc.dat (MHC oqsillari): 3981 ta yozuv
org.dat (Organelles): 13996 ta yozuv
phg.dat (Bakteriofaglar): 1736 ta yozuv
pln.dat (O'simliklar): 14626 ta yozuv
pro.dat (Prokaryotlar): 39243 ta yozuv
rod.dat (Kemiruvchilar): 6863 ta yozuv
unc.dat (Tasniflanmagan): 44 ta yozuv
vrl.dat (Viruslar): 48436 yozuv
vrt.dat (Boshqa umurtqali hayvonlar): 3913 ta yozuv
SP-TrEMBL-ga 407 ta yangi yozuvlar kiritilgan. ning ketma-ketligi
979 ta SP-TrEMBL yozuvlari yangilandi va izoh yangilandi
22'224 ta yozuv.
deleteac.txt hujjatida siz barcha kirish raqamlari ro'yxatini topasiz
TrEMBL ma'lumotlar bankida mavjud bo'lgan, ammo hozir o'chirilgan
ma'lumotlar bazasi.
REM-TrEMBL (Qolgan TrEMBL) biz bajaradigan yozuvlarni (42'356) o'z ichiga oladi.
SWISS-PROTga qo'shishni istamayman. REM-TrEMBL yozuvlari qo'shilmaydi. Ushbu bo'lim beshta kichik bo'limda tuzilgan:
1) Immunoglobulinlar va T-hujayra retseptorlari (Immuno.dat)
Aksariyat REM-TrEMBL yozuvlari immunoglobulinlar va T-hujayra retseptorlaridir. Biz SWISS-PROTga immunoglobulinlar va T-hujayra retseptorlarini kiritishni to'xtatdi, chunki biz faqat mikrob chizig'i genidan olingan tarjimalarni saqlamoqchimiz, bu oqsillarning SWISS-PROT-da va barcha ma'lum somatik rekombinatsiyalanmagan bu oqsillarning o'zgarishi. Biz ixtisoslashgan korxona yaratmoqchimiz. Qo'shimcha sifatida ushbu ketma-ketliklar bilan shug'ullanadigan ma'lumotlar bazasi
SWISS-PROT va bularning faqat vakillik kesimini saqlang SWISS-PROTdagi oqsillar.
2) Sintetik ketma-ketliklar (Synth.dat)
SWISS-PROTga kiritilmaydigan ma'lumotlarning yana bir toifasi sintetik ketma-ketliklar. Shunga qaramay, biz ushbu yozuvlarni qoldirishni xohlamaymiz. Ideal holda sun'iy ma'lumotlar bazasini yaratish kerak, ketma-ketliklar SWISS-PROTga qo'shimcha qo'shimcha sifatida.
3) Patentga ariza berish ketma-ketligi (Patent.dat)
Uchinchi kichik bo'lim patentdan olingan kodlash ketma-ketliklaridan iborat ilovalar. Bu yozuvlarni chuqur o‘rganish shuni ko‘rsatdi, juda kichik ozchilikdan tashqari (ko'p hollarda allaqachon mavjud SWISS-PROT-ga integratsiya qilingan), bu ketma-ketliklarning aksariyati ikkalasini ham o'z ichiga oladi. Noto'g'ri ma'lumotlar yoki undan tashqarida sun'iy ravishda yaratilgan ketma-ketliklarga tegishli SWISS-PROT doirasi.
4) Kichik qismlar (Smalls.dat)
Yana bir kichik bo'lim sakkizdan kam amino bo'lgan qismlardan iborat kislotalar.
5) CDS haqiqiy oqsillarni kodlamaydi (Pseudo.dat)
Oxirgi bo'lim CDS tarjimalaridan iborat bo'lib, bizda kuchli. Ushbu CDS haqiqiy oqsillarni kodlamasligiga ishonish uchun dalillar.
Dostları ilə paylaş: |