Sun’iy neyron tarmoqlarida nutqni sintezlash modellari tahlili mavzusida bitiruv malakaviy ishi

Yüklə 1,67 Mb.

səhifə	14/23
tarix	24.03.2023
ölçüsü	1,67 Mb.
	#89648

1 ... 10 11 12 13 14 15 16 17 ... 23

Baxodirov Abduraxmon BMI

11-rasm. Kompilyativ sintez modeli.
Kompilyativ sintez modeli ma'ruzachi tomonidan aytilgan alohida tovushlarning yozib olingan namunalarini birlashtirish (tuzish) orqali nutq sintezini nazarda tutadi. Ushbu modeldan foydalanganda, kelajakda nutq sintez qilinadigan tovush qismlarining ma'lumotlar bazasi tuziladi. Bir qarashda, bu yondashuv katta qiyinchiliklarga olib kelmasligi kerak. Haqiqatan ham, mikrofon va ovoz muharriridan, masalan, kitobimizning 3-bobida tasvirlangan GoldWave muharriridan foydalanib, siz turli xil tovush fragmentlari fayllari to'plamini yaratishingiz va keyin ularning mazmunini ma'lumotlar bazasida saqlashingiz mumkin. Matnli xabarlar bilan audio WAV fayllarini yaratish orqali siz Microsoft Windows operatsion tizimi va uning ko'pgina ilovalari, masalan, elektron pochta dasturlari, ishlab chiqish vositalari va boshqalarni ovozli qilishingiz mumkin.[21]
Agar siz dasturlarni qanday yaratishni bilsangiz, unda alohida fragmentlardan iboralar tuzadigan oddiy nutq sintezatorini yaratish siz uchun qiyin bo'lmaydi. Ovoz bilan ishlaydigan dasturlarni yozish uchun zarur bo'lgan ma'lumotlarni, masalan, [10] da, shuningdek, MSDN kutubxonasida (http://msdn.microsoft.com) topish mumkin. Kompilyatsiya qilingan sintez modeli asosan sintezator nisbatan kichik va ma'lum iboralar to'plamini talaffuz qilishi kerak bo'lgan eng oddiy holatlar uchun mos keladi. Bu nutqning ancha yuqori sifatini ta'minlaydi. Ammo, agar insonning tabiiy nutqi sintez uchun ishlatilishini eslasak, bu haqiqat juda ajablanarli emas. Biroq, tuzilgan tovush bo'laklarining birlashmasida intonatsion buzilishlar va tanaffuslar bo'lishi mumkin, ular quloq tomonidan seziladi. Bundan tashqari, turli intonatsiyaga ega fonema va allofonlarning talaffuzining barcha xususiyatlarini hisobga olgan holda tovush fragmentlarining katta bazasini yaratish murakkab.
Tovush chastotasi ovoz balandligini aniqlaydi. Ushbu parametr sizga hech qanday savol tug'dirmasligi kerak. Shovqin chastotasiga kelsak, bu erda tushuntirish kerak. [3] muallifi ta'kidlaganidek, shovqin hosil bo'lishi juda murakkab jarayon bo'lib, u havo oqimining bosimi va tezligi, havo yo'lining geometrik shakli, materialning akustik xususiyatlari va boshqalar kabi ko'plab omillarga bog'liq. Jismoniy darajadagi nutq shovqinini to'liq taqlid qilish uchun inson nutq apparatining aniq modelini yaratish kerak, bu juda qiyin vazifadir. Shu bilan bir qatorda, [3] muallifi oq shovqindan foydalanadi, uning spektri ba'zi bir qonunga (masalan, Gaussga ko'ra) qandaydir markaziy chastotaga nisbatan taqsimlanadi. Bunday holda, tarqatish qonuni eksperimental ravishda tanlanadi va bu holda shovqin chastotasi yuqorida aytib o'tilgan markaziy chastotadir. Nutqni shakllantirishda ishtirok etuvchi faol formantlar soni [3] da eksperimental ravishda tanlanadi va taxminiy qiymat sifatida 4 tadan foydalaniladi. Formant vokal traktidagi rezonansni ifodalaganligi sababli, u rezonans chastotasi va konvertga ega. Konvertning shakli ham eksperimental tarzda aniqlanadi, birinchi taxminda bu Gauss taqsimoti. Har bir formantning hissasi, asosiy signalga qanday kuchli ta'sir qilishini aniqlaydi.
Yuqoridagi barcha parametrlar, formulalar sonidan tashqari, nutqni shakllantirish jarayonida turli tovushlarni hosil qilish uchun o'zgaradi. Nutqni yaxshiroq sintez qilish uchun batafsilroq modelni qurish zarur bo'lsa-da, [3] da keltirilgan parametrlar sintezlangan tovushlarning tushunarli bo'lishi uchun etarli.

Yüklə 1,67 Mb.

Dostları ilə paylaş:

1 ... 10 11 12 13 14 15 16 17 ... 23