Sun’iy neyron tarmoqlarida nutqni sintezlash modellari tahlili mavzusida bitiruv malakaviy ishi


-rasm. Nutqni qanday tanib olish texnologiyasi



Yüklə 1,67 Mb.
səhifə4/23
tarix24.03.2023
ölçüsü1,67 Mb.
#89648
1   2   3   4   5   6   7   8   9   ...   23
Baxodirov Abduraxmon BMI

3-rasm. Nutqni qanday tanib olish texnologiyasi.
ANN uchun treninglar mavjud, ammo bu parametrlarning qiymatlari ko'pincha mashg'ulotlarning muvaffaqiyati uchun hal qiluvchi ahamiyatga ega. Shuning uchun biz Scaled Conjugate Gradient (SCG) algoritmidan foydalanishga qaror qildi superchiziqli yaqinlashish tezligi bilan. SCG sinfga tegishli Superlinearni ko'rsatadigan konjugat gradient usullari ko'pgina muammolar uchun konvergentsiya; qo'shimcha tavsif taklif etiladi[19] da.
Kohonenning o'zini o'zi tashkil qilish xususiyatlari xaritasi (KSOM) edi hissiyotlarni hal qilish uchun qo'llanilgan ikkinchi ANN tasnifi. KSOM - bu ANN shakli bo'lib, uni o'qitadi nazoratsiz o'rganish qoidalari, ya'ni maqsadli (zarur) qiymatlarsiz. Klasterlash usuliga asoslangan iterativ jarayon; o'zaro bog'liqliklarni izlovchi klaster tahlil usullari va taqdim etilgan naqshlar to'plamidagi qo'shma xususiyatlar. Yangi SOM Variant his-tuyg'ularni tasniflash uchun ishlatilgan, ya'ni birlashtirgan o'zini o'zi tashkil qilish xaritasi (SSOM) nazorat qilinadi Kvantlash vektorlarining tartibini saqlagan holda topologiya bilan vektor kvantlash usulining aspektlari. Algoritm SSOM juda samarali tasniflash usulini ifodalaydi, lekin faqat taniqli kirish ma'lumotlari yoki taniqli ma'lumotlar uchun. kirish ma'lumotlarining sinflari. C. Korpusni yaratish.

4- rasm. Suniy intelekt yordamida matndan tovushga o’tish.
ANNni sinash va takomillashtirish uchun uni yaratish kerak jumlalarning nutqiy korpusi va oldindan ishlov berish orqali korpus, tarmoqni o'qitish uchun kirish ma'lumotlarini tayyorlash va sinov. Umuman olganda, tabiiy nutqning korpuslari bo'lgan keng assortimentdan ehtiyotkorlik bilan tanlash orqali yaratilgan turli neytral jumlalar. Hozirda hissiy nutq yo'q ma'lumotlar bazasi mavjud. Natijada, hissiy nutq korpusi va biz uchun ANN treningi uchun ma'lumotlar bazasi yaratilishi kerak edi tadqiqot. Jumlalar professional aktyorlar tomonidan o'qildi, ikkita ayol va bitta erkak. Nutqni yozib olish a.da amalga oshirildi professional uskunaga ega ovoz yozish studiyasi (“wav” formati, Namuna olish chastotasi 44,1 kHz, 24 bit).[17]
Nutq korpusi yozma matn va uning tarkibidan iborat mos keladigan nutq signali, ikkalasi uchun ham ishlatiladi ANNni o'qitish. Murakkab korpus bo'lingan ikkita qism, birinchi to'plam mashg'ulot uchun ishlatiladi va ikkinchi qism sinov to'plami sifatida xizmat qiladi, shuningdek, monitoring uchun ishlatiladi o'quv jarayoni. So'zlar to'rt turdagi hissiyotlar uchun amalga oshirildi: g'azab, zerikish, zavq va qayg'u - I va II jadvalga qarang.
D. Kirish ma'lumotlarini yaratish
Prozodiy nazoratning muvaffaqiyati aniq bog'liq ma'lumotlar bazasida tabiiy nutq signalining markalanishi. Belgilash (nutq o'rtasidagi chegaralarni aniqlash) va nutqdan gaplarning fonetik transkripsiyasi korpus oldindan ishlov berish bosqichida amalga oshiriladi. ning o'zgarishlari asosiy chastota F0, formant chastotasi Fi , i = 1, . . . , 4 va jumlalarni ovoz berish jarayonida fonemalarning davomiyligi Du gapning ohangini (uning intonatsiyasini) yarating. Intonatsiya – bu gapning ma'nosi va hissiyligi bilan ham bog'liq tembr.[13]
Yozib olingan tuyg'u nutqi sub'ektiv ravishda baholandi to'rt kishi. Yakuniy ma'lumotlar bazasida 720 ta naqsh mavjud (360 bir so'zli jumlalar uchun naqsh va ko'p so'zli jumlalar uchun 360 naqsh).
III. TAJRIBALAR
Ushbu hissada tasvirlangan barcha tahlillar va tajribalar hisoblash tizimi yordamida amalga oshirildi NN-toolbox [16] va SOM Toolbox bilan MATLAB. SOM Toolbox axborot laboratoriyasida ishlab chiqilgan va Xelsinki universitetida Kompyuter fanlari (MDH). Texnologiya va u MATLAB skript tilidan foydalangan holda qurilgan. SOM asboblar to'plami yaratish uchun funktsiyalarni o'z ichiga oladi.
O'z-o'zini tashkil etuvchi xaritalarni vizuallashtirish va tahlil qilish. The Asboblar to'plami umumiy jamoatchilik ostida bepul mavjud Litsenziya ([7]). domenidagi loyihalar uchun ANN tomonidan nutqni qayta ishlash (ular bilan bog'liq bizning universitetimizning sxemalar nazariyasi bo'limi), yangi maxsus M-fayllar, ular qo'llab-quvvatlovchi dasturning bir qismi bo'lishi kerak paketi yaratilgan.
MLNN va SOM, ayniqsa, so'zlarga nisbatan qo'llanilgan I va II jadvaldan. MLNN trening natijalari almashtirish matritsasi deb ataladigan joyga jamlangan, Bu erda "1-sinf" g'azab sifatida ko'rsatilgan bo'lsa, "2-sinf" ko'rsatilgan zerikish sifatida “3-sinf” zavq sifatida ko'rsatilgan va “4-sinf” qayg'u sifatida belgilandi. ANN ta'limi uchun ma'lumotlar bazasi olindi 216 ta naqsh, tekshirish uchun 72 ta naqsh va shuncha ko'p sinov uchun 72 ta naqsh sifatida.
Birlashtirilgan masofa matritsasi yoki U-matritsa tasvirdir neyronlar orasidagi masofani tasavvur qiladigan KSOM va ularning qo'shnilari. KSOM neyronlari bilan ifodalanadi olti burchakli hujayralar (bizning tajribamizda). Orasidagi masofa qo'shni neyronlar hisoblab chiqiladi va turlicha taqdim etiladi ranglar. Neyronlar orasidagi quyuq ranglar kattaroq rangga mos keladi masofa va shuning uchun qiymatlar orasidagi farqni ifodalaydi kirish maydonida. Neyronlar orasidagi ochiq ranglar degani vektorlar kirish fazosida bir-biriga yaqin ekanligi. Yorug'lik joylari klasterlarni (sinflarni) va qorong'u joylarni ifodalaydi klaster chegaralari (batafsilroq [2] da). Xaritaning o'lchami edi 15x15, kvantlash (QE) va topografik (TE) xatolar esa xaritasi ham hisoblab chiqilgan. A. I usul: vaqt va chastotaga asoslangan naqshlar xususiyatlari.
MLNN ta'limi uchun to'qqizta naqshlar orqali yaratilgan vaqt va chastota domenlarining xususiyatlari (jadvalga qarang). III). Yashirin qatlam 20 neyron, chiqish qatlami esa 4 neyron edi. O'quv davrining soni 56 resp edi. 53 bir so'zli jumlalar uchun javob. ko'p so'zli jumlalar. B. II usul: musiqa nazariyasiga asoslangan naqshlar.
Ikkinchi taqdim etilgan usul g'oyaga asoslanadi musiqiy interval: ma'lum bir chastota o'rtasidagi farq n-ton va mos yozuvlar ohangi. Masalan, kvint - beshinchi tonning nisbati birinchi ohangga bo'lingan, raqamli qiymati 1,498. musiqiy intervallarning nisbatlari bo’ladi.


Yüklə 1,67 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   ...   23




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin