Filogenetik daraxtlar klasterlash metodlari

Filogenetik daraxtlarni rekonstruktsiya qilishda genetik algoritm qanday qo'llaniladi

Yüklə 45,88 Kb.

səhifə	3/6
tarix	02.06.2023
ölçüsü	45,88 Kb.
	#123380

1 2 3 4 5 6

FILOGENETIK DARAXTLAR KLASTERLASH METODLARI

II Bob Filogenetik daraxtlar klasterlash metodlari

1.2 Filogenetik daraxtlarni rekonstruktsiya qilishda genetik algoritm qanday qo'llaniladi
Hideo Matsuda [5] (1996) aminokislotalar ketma -ketligidan filogenetik daraxtlar yaratishni taklif qildi, bu genetik algoritmdan farq qiladi, bu kodlash sxemasi, o'zaro faoliyat va mutatsion operatori asosida oddiy genetik algoritmdan [2] farq qiladi. Dastlabki bosqichda, mavjudlar orasida muqobil daraxtlar, ularning yaroqliligiga qarab rulet tanlash orqali belgilangan miqdordagi daraxtlar tanlangan. Shundan so'ng daraxtlarning sifatini yaxshilash uchun avloddan -avlodga krossover va mutatsion operatsiyalar qo'llanildi. Har bir avloddagi daraxtlar soni aniqlanganligi sababli, eng yaxshi ball to'plagan daraxtlar ushbu operatorlar tomonidan olib tashlanadi. Algoritm shuningdek, eng yaxshi ball bilan qurilgan daraxt har bir avlod uchun omon qolishi kerakligini tekshiradi. Algoritmning asosiy afzalligi uning tasodifiy hosil bo'lgan daraxtlardan krossover va mutatsiya operatorlari yordamida ko'proq ehtimoliy daraxt qurish qobiliyatidir. Eksperimental natijalar shuni ko'rsatadiki, taklif qilingan algoritmning ishlashi boshqa Maksimal Parsimon Maksimal ehtimoli, UPGMA usullari kabi turli xil daraxt qidirish algoritmlari bilan solishtirish mumkin.

II Bob Filogenetik daraxtlar klasterlash metodlari
Filogeniyani rekonstruktsiya qilish - bu qiyin hisoblash muammosi, chunki ko'p miqdordagi soliqlar (ob'ektlar) ni o'z ichiga olgan holda, mumkin bo'lgan echimlar ham ko'payadi, bu esa optimal bo'lmagan daraxtlarni baholashga sarflanadigan vaqtni oshiradi. Bu muammoni bartaraf etish uchun Paul.et.al [8] (1998) nukleotidlar ketma-ketligi ma'lumotlaridan foydalanib, maksimal ehtimollik filogenezi xulosasi uchun genetik algoritmni taklif qildi. Pavlus genetik algoritmga asoslangan evristik qidiruvni taqdim etadi, bu ko'p sonli taksonlarni o'z ichiga olgan ma'lumotlar to'plamida maksimal ehtimollik filogenetik xulosa qilish uchun zarur bo'lgan vaqtni kamaytiradi. Algoritm quyidagicha ishlaydi: Birinchidan, har bir shaxs tasodifiy daraxt topologiyasi bilan ishga tushiriladi, unda har bir filialga tasodifiy qiymat beriladi. InL ball asosida har bir zarrachaning yaroqlilik qiymati hisoblanadi. InL balining eng yuqori qiymatiga ega bo'lgan shaxs keyingi avlod uchun nasl berish uchun ishlatiladi. Nihoyat, rekombinatsiya operatsiyasi amalga oshiriladi. Bu rekombinatsiya operatsiyasi GAni boshqa an'anaviy echimlardan kamroq vaqt ichida yechim olishdan ajratib turadi. Eksperimental natijalar shuni ko'rsatadiki, bir xil Maksimal ehtimollik topologiyasini olish uchun daraxtning ikkiga bo'linishi (TBR) novdalarini almashtirishdan foydalangan holda an'anaviy evristik qidiruv uchun talab qilinadigan hisoblash harakatlarining atigi 6%.
2002 yilda Clare et. al [10] taklif qilgan "Gaphyl: organizmlar o'rtasidagi evolyutsion munosabatlarni o'rganish uchun evolyutsion algoritmlar yondashuvi". Mavjud filogenetik dasturiy paketlar optimal filogenetik daraxtni topish uchun evristik qidiruv usullaridan foydalanadi, Graphyl esa evolyutsion mexanizmlardan foydalanadi, shuning uchun qisqa vaqt ichida to'liqroq yechim topadi. Grafildagi GA qidirish jarayoni filogenetika uchun xuddi shu ish vaqtida Phylip [3] ga qaraganda bir xil darajada ishonchli daraxtlarni topishda katta foyda keltiradi. Bundan tashqari, ma'lumotlar to'plami turlar va atributlar sonining ko'payishi hisobiga kattalashib borgan sari, Gafilning Filip ustidan samaradorligi oshadi, chunki Gafil qidirish jarayoni atributlar (va atributlar-qiymatlar) soniga va qidirishning murakkabligiga bog'liq emas. daraxtdagi barg tugunlari sonini aniqlaydigan turlar soniga qarab o'zgaradi.
Gafil Kler. va boshqalar. al [12] (2003) Gafilning yangi versiyasini taklif qildi, unda Gafil genetik ma'lumotlar bilan ishlash uchun kengaytirilgan. Taklif etilgan algoritmda Gafilning DNK versiyasi tuzilgan va DNK ma'lumotlari asosida Gafil va Filipni qidirish jarayoni solishtirilgan. Eksperimental natijalar shuni ko'rsatadiki, Gafilning ishlashi, ba'zi hollarda, Filipga qaraganda yaxshiroq.
Chumolilar koloniyasini optimallashtirish (ACO) M. Dorigo tomonidan ishlab chiqilgan evolyutsiya algoritmidir va boshqalar. al [6] (1996), haqiqiy chumolilarning ovchilik xatti -harakatlaridan ilhomlangan. Chumoli ovqatni qidirganda, chumoli dastlab uyasi bilan qoplangan joyni tasodifiy ravishda siljitadi. Chumoli oziq -ovqat manbasini topgach, uning sifati va miqdorini tahlil qilib, uning bir qismini uyasiga qaytaradi. Kimyoviy feromon izi chumoli qaytib kelganida erga tushiriladi. Bu boshqa chumolilarga oziq -ovqat manbalariga etib borishiga yordam beradi. Feromon yo'llari orqali chumolilar o'rtasidagi bilvosita aloqa yordamida uya va oziq-ovqat manbai o'rtasidagi eng qisqa yo'lni topishga yordam beradi. Chumolilar koloniyalarining bu xususiyati sun'iy chumolilar koloniyalarida kombinativ optimallashtirish (CO) muammolarini hal qilish uchun ishlatiladi. Umuman olganda, ACO optimallashtirish muammolarini hal qilish uchun ikki bosqichni takrorlaydi.
1) Nomzodlik eritmasi feromonli model yordamida quriladi, ya'ni eritma maydonida ehtimollik taqsimotini parametrlangan holda ishlatish.
2) Nomzod echimlar yaxshi sifatli eritma olishda filtrlash uchun ferom qiymatlarini yangilash yoki o'zgartirish uchun ishlatiladi.
B bo'limida biz filogenetik daraxtlarni rekonstruksiya qilishda chumolilar koloniyasini optimallashtirish (ACO) qanday qo'llanilishini muhokama qilamiz, so'ngra C bo'limida bir qancha tadqiqotchilar chumolilar koloniyasini optimallashtirish orqali filogenetik daraxtni qurish uchun qilgan ishlarini tasvirlab beramiz.
3.2 Filogenetik daraxtlarni rekonstruksiya qilishda chumolilar koloniyasini optimallashtirish qanday qo'llaniladi.
Filogenetik daraxt qurilishi muammosi standart TSP (sayohatchi sotuvchi muammosi) ga juda o'xshash. Har bir taksiga bitta xayoliy shaharni bog'lash mumkin va bu mos keladigan taksilar juftligi uchun ma'lumotlar matritsasidan olingan ma'lumotlar ikki shahar orasidagi masofa sifatida belgilanadi. Muammoning bunday tuzilishi ACO kabi evristik algoritmlarni qo'llashga yo'l ochadi, vositachi tugun chumolilar tizimi tomonidan ilgari tanlangan ikkitasi orasidan tanlanadi. Vositachilik tuguniga asoslanib, qolgan tugunlarga (turlarga) bo'lgan masofalar qayta hisoblab chiqiladi. Ushbu protsedura, tashrif buyurilgan tugunlarga tegishli bo'lmagan barcha tugunlar yo'l qurilgunga qadar takrorlanadi. Yo'lning qo'shni tugunlarining o'tish ehtimoli yig'indisi feromon izini yangilashda foydalanilgan yo'lning balli deb ataladi. Amalga oshirish tsikli davomida hech bo'lmaganda bitta yo'lga tegishli bo'lgan barcha tugunlar feromon izini oshirishga yordam beradi. Bu asosiy nuqta mahalliy maksimal tuzoqqa tushmaslikka yordam beradi. Shunday qilib, TSPni echish uchun chumolilar koloniyasi algoritmiga ruhiy jihatdan yaqin bo'lgan algoritmga amal qilib, filogenetik daraxtlarni samarali rekonstruksiya qilish mumkin [20].
3.3 Chumolilar koloniyasini optimallashtirish asosida daraxtning filogenetik rekonstruksiyasi
Shin Ando.et.al [11] (2002) Evolyutsion daraxt qurilishi uchun chumolilar algoritmini taklif qildi. Algoritm NP muammolarida metaevristik qidiruvni o'rganish uchun ACO algoritmini qo'llaydi. Muallif ikkita yangi mexanizmni taqdim etadi: qo'shimchani ifodalash va tepalik tanlash mexanizmi, bu chumolilar koloniyasini o'rganish qobiliyatini takomillashtirish [7] strategiyasini qo'llashda yordam beradi. Algoritm mumkin bo'lgan daraxtlar to'plamidan daraxt tanlaydi, bu ma'lum bir DNK ketma -ketligi uchun balni kamaytiradi. Taklif etilgan algoritm simulyatsiya qilingan eksperimentda va 15 turdan oqsil ketma -ketligini moslashtirishda qoniqarli natijalarni ko'rsatadi.
Pist Kumnorkaew.et.al [15] (2004) Chumolilar koloniyasiga asoslangan yangi algoritmni taklif qildi, unda evolyutsion daraxt daraxt konstruktsiyasi, novdalar uzunligini hisoblash, filial nuqtasini tanlash, yangi ACO parametri va masofani tortish parametri. Algoritm chumolilarni turli filial nuqtalariga joylashtirishdan boshlanadi va har bir chekkada feromon izining boshlang'ich qiymatini o'rnatadi. Tarmoq nuqtasi tanlash vektoridagi har bir chumolining filial nuqtasi tartiblangandan so'ng, har bir chumoli feromon izi va masofasidan kelib chiqib, keyingi bosqichga o'tish uchun shaharlarni tanlaydi. Algoritm shaharni tanlash va har bir chumolining harakatini barcha chumolilar sayohatlari va filiallarini tugatmaguncha takrorlaydi. nuqta tanlash vektori to'ldiriladi. Umumiy filial har bir chumolining uzunligi hisoblab chiqiladi va feromonning qiymati yangilanadi. Tarmoq nuqtasi tanlash vektorini bo'shatishdan oldin, eng qisqa umumiy tarmoq uzunligi saqlanadi. Bu jarayon tugatish shartiga erishilgunga qadar davom etadi. Algoritmning qobiliyatini yanada kuchaytirish uchun kichik uzunlikdagi manfiy qabul qilingan, chunki n ning katta qiymatlari bo'lsa (n - evolyutsion daraxt muammosidagi turlar soni), musbat novdalar uzunligini qabul qilish konvergentsiyani cheklaydi. Olingan natija chumolining eng qisqa yo'li bo'lib, evolyutsiya daraxtini qurish uchun etarli bo'lgan novdalar yorliqlari va uzunliklarini o'z ichiga oladi. Eksperimental natijalar shuni ko'rsatadiki, algoritm polinomli vaqtda evolyutsion daraxt muammosining eksponent vaqt murakkabligini ancha kamaytiradi.
Maurisio Perretto. va boshqalar. al [16] (2005) chumolilar koloniyasini optimallashtirish paradigmasi yordamida filogenetik daraxtni rekonstruksiya qilishni taklif qildi. Taklif etilgan algoritmda filogenetik daraxtlarni rekonstruksiya qilish turlar orasidagi masofa matritsasi yordamida to'liq bog'langan grafik tuzish orqali amalga oshiriladi. Ushbu grafikada turlar orasidagi masofa va tugunlar turni ifodalaydi. Dastlab chumolilar tasodifiy tugunni tanlaydilar, keyin har bir tugunda yo'nalish o'tish funktsiyasidan kelib chiqib belgilanadi. Bu chumolining asosiy maqsadi o'tish ehtimolini maksimal darajada oshiradigan yo'lni topishdir, natijada eng kichik evolyutsion masofani hosil qiladigan turlar ketma -ketligi olingan. Taklif etilayotgan algoritm NEIGHBOR va FITCH dasturlari yordamida yaxshi ma'lum bo'lgan PHYLIP to'plami bilan taqqoslanadi. Taqqoslash ularning tuzilishi va tugunlar orasidagi umumiy masofani tahlil qilishga asoslangan. Umuman olganda, ushbu maqolada keltirilgan tajriba natijalari juda istiqbolli edi.
Ling. va boshqalar. al [18] (2006) daraxtlarning filogenetik qurilishiga stoxastik, optimallashtirish va klaster yordamida yangi yondashuvni taklif qildi, bunda chumolilar koloniyasi algoritmi ham klasterlash usuli, ham aglobal optimallashtirish texnikasi yordamida qo'llaniladi, shunda daraxtlar topologiyasi yomon bo'lsa ham optimal daraxt topiladi. . Taklif etilayotgan usul uchta komponentdan iborat, ya'ni boshlash, klasterlash va filogenetik daraxtlarni optimallashtirish orqali filogenetik daraxtlarni qurish. Boshlash bosqichida og'irlikdagi digraf quriladi, uning tepasi klasterlangan ma'lumotlarni, cheti esa ikkita ob'ekt o'rtasidagi qabul qilish tezligini ifodalaydi. Keyin chumoli digrafda sayohat qiladi va yo'lda feromonni yangilaydi va nihoyat chumolilar koloniyasi va uning feromonlari bilan aloqa tizimi ishlatiladi, bu daraxtning optimal topologiyasini olish uchun global optimallashtirish usuli sifatida ishlaydi. Taklif etilgan algoritm Genetik algoritm bilan taqqoslanadi va natijalar shuni ko'rsatadiki, u tezroq birlashadi va yuqori sifatga erishadi.
Jing Juo. va boshqalar. al [17] (2006) Filogenetik daraxt qurish uchun o'z-o'zidan moslashuvchi chumolilar koloniyasi algoritmini taklif qildi, unda filogenetik daraxt taqsimlanish muvozanati asosida qurilgan. Taklif etilayotgan usul 3 bosqichni o'z ichiga oladi, ishga tushirish, chumolilar tomonidan topilgan optimal yo'l bo'yicha filogenetik daraxtlarni qurish va optimallashtirish. Birinchi to'liq bog'langan grafik turlar orasidagi masofa matritsasi yordamida tuziladi. Filogenetik daraxtni qayta qurishni boshlash uchun chumolilar tasodifiy tugunni tanlash bilan boshlanadi. Ular tuzilgan grafik bo'ylab sayohat qilishadi va har bir tugunda chumolilar ehtimollik funktsiyasiga asoslanib o'z yo'nalishini topadi. Algoritm iz ma'lumotlarini to'g'rilaydi va yo'l tanlash taqsimotining muvozanati asosida har bir yo'lning ehtimoli aniqlanadi. Har bir chumoli protsedurani barcha tugunlar bir marta bosib o'tmaguncha takrorlaydi, ya'ni barcha tugunlar allaqachon tashrif buyurilgan tugunlar ro'yxatiga kiritiladi. Ushbu yo'lning balli yo'lda qo'shni tugunlarning ehtimollik funksiyasi yig'indisi bilan beriladi. Konvergentsiyani tezlashtirish va mahalliy konvergentsiyani oldini olish uchun algoritm har bir yo'l bo'yicha ma'lumotlarning tanlash ehtimoli va strategiyasini, olingan echimlarning sifati va taqsimlanishiga qarab sozlaydi. Taklif etilayotgan algoritm PHYLIP dasturiy ta'minot paketi va TSP-yondashuvidagi Neighbor Joining (NJ) dasturlari bilan taqqoslanadi. Tajriba natijalari shuni ko'rsatadiki, taklif qilingan algoritmni amalga oshirish va boshqa algoritmlarga qaraganda yuqori sifatli natijalarni olish osonroq.
Ling Chen.et. al [21] (2009) Chumolilar koloniyasini qismlarga ajratishga asoslangan filogenetik daraxt qurish uchun yangi algoritmni taklif qildi. Dastlab daraxtning ildizi aniqlanadi, bu genlar ketma-ketligi to'plamiga mos keladi. Keyin algoritm genlar ketma -ketligini ikkiga ajratadi, shunda bitta kichik to'plam o'xshash xususiyatga ega bo'ladi va har xil kichik guruhlar orasidagi genlar ketma -ketligi har xil xususiyatga ega. Bu jarayon barcha kichik guruhlar faqat bitta gen ketma -ketligini o'z ichiga olmaguncha takrorlanadi. Ushbu kichik to'plamlar yordamida filogenetik daraxt asta -sekin quriladi, unda barglar genlar ketma -ketligi. Bissektsiyaning har bir darajasi chumolilar koloniyasini sayohatchilar muammosini optimallashtirishga asoslangan. Tajriba natijalari shuni ko'rsatadiki, tavsiya etilgan algoritmni amalga oshirish oson, samaraliroq, tez birlashtiriladi va boshqa usullarga qaraganda yuqori sifatli natijalar olinadi.

Yüklə 45,88 Kb.

Dostları ilə paylaş:

1 2 3 4 5 6