Genom loyihalaridan olingan ma'lumotlar. Organizmlarning to'liq genomlari tezlashgan sur'atlar bilan aniqlanmoqda. To'liq genomni aniqlashdan olingan ketma-ketliklar odatda nashr etilgandan so'ng tez orada haftalik oraliq yangilanishda Proteinlar ketma-ketligi ma'lumotlar bazasiga kiritiladi. Genom ma'lumotlarini import qilish jarayonida biz bir qator ketma-ketlik hisobotlarini yaxshilashga muvaffaq bo'ldik: (i) AUG bo'lmagan boshlang'ich kodonlarni to'g'ri ifodalash va izohlash; (ii) to'g'ridan-to'g'ri aminokislotalar ketma-ketligi ma'lumotlarini o'z ichiga olgan oldingi yozuvlar bilan taqqoslash orqali to'g'ri boshlash joyini aniqlash; (iii) peptid zanjirining 2-chiqarish omilidagi kabi translatsiya ramkasining o'zgarishini izohlash; va (iv) format dehidrogenaza alfa zanjirlarida selenotsistein kabi tarjima istisnolarini izohlash. Tarjimaviy ramka o'zgartirishni yoki tugatish kodonlarini o'qishni talab qiladigan ketma-ketliklarni kodlovchi ORFlar ba'zan GenBank va EMBL ma'lumotlar bazalarida tarjima qilinmaydi. PIR ma'lumotlar bazasi tarjimalarni taqdim etadi va genom loyihalaridagi ushbu ketma-ketliklarga izoh beradi. PIR ma'lumotlar bazasida mavjud bo'lgan to'liq genomlarning ro'yxati va tegishli ma'lumotlar PIR veb-saytida mavjud.
Yuqori oila va domen tasnifi. PIR eng keng tarqalgan tasniflangan proteinlar ketma-ketligi ma'lumotlar bazasi. Proteinlar ketma-ketligini superoilalar va oilalarga ajratish olimlarga gen oilalariga qarshi izlanishda va oila a'zolari o'rtasidagi funktsional va evolyutsion munosabatlarni aniqlashda yordam beradi. Tasniflash shuningdek, tegishli yozuvlarga izohni kengaytirish imkonini beradi.
Protein superfamiliyalari kontseptsiyasi dastlab Margaret Dayhoff tomonidan taklif qilingan va keyinchalik PIR-International tomonidan aniqlangan va rasmiy modelga aylantirilgan.). Qayta qilingan modelda superfamiliyalarning ikkita klassi aniqlangan: gomeomorf va domenli superoilalar. Gomeomorf superfamiliyalarga tasniflash uchun yozuvlar aminokislotadan karboksil oxirigacha global ketma-ketlik o'xshashligiga ega bo'lishi kerak. Oila guruhlari 50% yoki undan ortiq ketma-ketlikni taqsimlovchi gomeomorf superoilaning a'zolari sifatida aniqlanadi. Domen superoilasi a'zolari mahalliy ketma-ketlik o'xshashligini odatda funktsional yoki strukturaviy birlikni tashkil etuvchi homologik domen bilan bo'lishadi. To'liq oqsil faqat bitta gomeomorf superoilaning a'zosi bo'lishi mumkin, bu ma'lumotlar bazasini bir-biriga mos kelmaydigan to'plamlarga bo'lish imkonini beradi. Proteinlar ketma-ketligi ma'lumotlar bazasida o'ta oila a'zoligi yozuvning "Superfamily" yozuvida nom bilan ko'rsatilgan. Gomologik domenlar ketma-ketlik xususiyatlari sifatida ham izohlanadi.
MIPSdagi doktor Fridhelm Pfayfer PIR ma'lumotlar bazasidagi ketma-ketliklarning 93 foizini oilaviy guruhlarga to'pladi. Ma'lumotlar bazasidagi qolgan yozuvlar tasniflanmagan, chunki ular juda qisqa yoki parchalangan. Ikki yoki undan ortiq ketma-ketlikni o'z ichiga olgan oilalarning 11 000 dan ortiq tekislashlari MIPS yoki PIR veb-saytlari orqali mavjud. Shu tarzda tasniflangan har bir oilaga doimiy identifikatsiya raqami berilgan. Bundan tashqari, PIR ma'lumotlar bazasidagi ketma-ketliklarning yarmidan ko'pi gomeomorf superfamilalarga birlashtirilgan va doimiy identifikatorlar tayinlangan. Yuqori oilalarning ketma-ketligi PIR-ALN ma'lumotlar bazasida saqlanadi va PIR veb-sayti orqali mavjud.