TrEMBL: Shveytsariya-Protga Kompyuter Annotatli Qo'shimcha Genom loyihalaridan ketma-ketlik ma'lumotlar bazalariga ma'lumotlar oqimining ko'payishi tufayli biz ma'lumotlar bazasini izohlash usulida bir qator qiyinchiliklarga duch kelamiz. SWISS-PROT-da ketma-ketlik va izohning yuqori sifatini saqlash ketma-ketlikni sinchkovlik bilan tahlil qilishni va har bir yozuvning batafsil izohini talab qiladi. Bu SWISS-PROT ishlab chiqarishda tezlikni cheklovchi qadamdir. Bir tomondan, biz SWISS-PROT ning yuqori tahririy standartlarini bo'shashtirmoqchi emasmiz va biz izohlash jarayonlarini qanchalik tezlashtirishimiz mumkinligining chegarasi borligi aniq. Boshqa tomondan, biz imkon qadar tezroq yangi ketma-ketliklarni taqdim etishimiz juda muhimdir. Ushbu tashvishni bartaraf etish uchun biz 1996 yilda TrEMBL (EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasi tarjimasi) ni taqdim etdik. TrEMBL EMBL ma'lumotlar bazasidagi barcha kodlash ketma-ketliklarining (CDS) tarjimasidan olingan kompyuter izohli yozuvlardan iborat,
Hozirgi holat 1999 yil iyul oyida TrEMBL 11-versiyasi ishlab chiqarildi. 11-nashr EMBL Nukleotidlar ketma-ketligi ma'lumotlar bazasi 58-versiyasidagi barcha 379 000 CDS tarjimasiga asoslangan edi. Ushbu CDS larning 119 000 ga yaqini allaqachon SWISS-PROT-da ketma-ketlik hisobotlari sifatida bo'lgan va shuning uchun TrEMBLdan chiqarib tashlangan. Qolgan 260 000 ta ketma-ketlik yozuvlari TrEMBL-da ortiqchalikni kamaytirish uchun iloji boricha avtomatik ravishda birlashtirildi. Ushbu qadam 245 761 TrEMBL yozuviga olib keldi.
Biz TrEMBLni ikkita asosiy qismga ajratdik; SP-TrEMBL va REM-TrEMBL: SP-TrEMBL (SWISS-PROT TrEMBL) SWISS-PROT-ga kiritilishi kerak bo'lgan yozuvlarni (11-nashrda 199 794) o'z ichiga oladi. Ushbu yozuvlarga SWISS-PROT kirish raqamlari berilgan. SP-TrEMBL SWISS-PROT-ga nisbatan qisman ortiqcha, chunki bu yozuvlarning ~60 000 tasi SWISS-PROT tarkibidagi oqsillarning faqat qo'shimcha ketma-ketlik hisobotlaridir. TrEMBL ning SWISS-PROT ga kompyuter izohli qo'shimchasi sifatida ishlashi uchun ortiqchalikni olib tashlash va avtomatik ravishda yuqori ishonchli izoh qo'shish uchun yangi tartiblar joriy etildi .
TrEMBL izohini yaxshilash uchun oltin standart sifatida mavjud SWISS-PROT annotatsiyasidan foydalanadigan qoidaga asoslangan tizim qo'llaniladi. Hozirda bu jarayon barcha TrEMBL yozuvlarining atigi 15 foiziga ta'sir qiladi. Qo'shimcha qoidalarni yaratish kelgusi yil davomida TrEMBL uchun ustuvor vazifalardan biri bo'ladi. Bu avtomatik izoh bilan qamrovning keskin oshishiga olib kelishi kerak.
REM-TrEMBL (REMaining TrEMBL) biz SWISS-PROT-ga kiritishni istamaydigan yozuvlarni (11-nashrda ~ 46 000) o'z ichiga oladi.
Akademik foydalanuvchilar uchun SWISS-PROT dan foydalanish bepul. Biroq, 1998 yil sentyabr oyida biz ma'lumotlar bazasidan tijorat foydalanuvchilari uchun yillik abonent to'lovi tizimini joriy qildik. SIB va EMBL/EBI yangi kompaniya, Geneva Bio-informatics (GeneBio) (http://www.genebio.com) ga zarur litsenziya shartnomalarini tuzish va to'lovlarni undirish maqsadida ularning vakili sifatida harakat qilish majburiyatini yukladi. Yig'ilgan mablag'lar SIB va EBIda SWISS-PROTni yangilash, uni yangilab turish va sifatini yanada oshirish uchun ishlatiladi. Ushbu yangi tizim haqida qo'shimcha ma'lumotni http://www.expasy.ch/announce/ saytidan olishingiz mumkin.
Hozirgi vaqtda (1999 yil oktyabr), SWISS-PROT ~ 65 000 havolalardan olingan 30 million aminokislotalarni o'z ichiga olgan ~ 81 000 ketma-ket yozuvlarni o'z ichiga oladi. Ma'lumotlar fayli (ketma-ketliklar va izohlar) diskda 185 Mb saqlash joyini talab qiladi. Hujjatlar va indeks fayllari uchun ~65 Mb disk maydoni talab qilinadi.