Nutqni Segmentatsiya Qilish Dasturi. Ikkilik dastur ina_speech_segmenter.py tomonidan qo'llab-quvvatlanadigan har qanday formatda kodlangan multimedia arxivlarini segmentlash uchun ishlatilishi mumkin ffmpeg. Bu segmentatsiyaga mos keladigan kirish vositalarini va csv fayllarini chiqarishni talab qiladi. Tegishli csv quyidagi dasturlar yordamida ingl
# yordam oling $ ina_speech_segmenter.py --yordam foydalanish: ina_speech_segmenter.py [- h] - I kiritish [kiritish ...]- o OUTPUT_DIRECTORY [- d {sm, smn}] [- g {haqiqiy,soxta}] [- b FFMPEG_BINARY] [- e {csv,textgrid}]
Nutq/musiqa(/shovqin) va erkak/ayol segmentatsiyasini bajaring va SEGMENTATSIYALARNI CSV fayllariga saqlang. 'NoEnergy' deb nomlangan segmentlar musiqa, shovqin, nutq va jinsdan olib tashlanadi tahlil. 'nutq', 'erkak' va 'ayol' yorliqlariga musiqa ustidagi nutq va shovqin ustidagi nutq kiradi. 'musiqa' va 'shovqin' yorliqlar-bu nutqni o'z ichiga olmaydigan sof segmentlar.
ixtiyoriy argumentlar: - h, --bu yordam xabar va chiqish ko'rsatish yordam - I kiritish [kiritish ...], --kirish kiritish [kiritish ...] Tahlil qilish uchun media kiriting. Agar ommaviy axborot vositalari uchun to'liq yo'l bo'lishi mumkin (/home/david/test.mp3), to'liq yo'llar ro'yxati (/home/david/test.mp3 /tmp/mymedia.avi), regex kiritish naqsh ("/uy / david / myaudiobooks/*. mp3"), http protokoli bilan url (http://url_of_the_file) - o OUTPUT_DIRECTORY, --output_directory OUTPUT_DIRECTORY Katalog segmentatsiyalarni saqlash uchun ishlatiladi. Olingan segmentatsiyalar csv kengaytmasi bilan mos keladigan kirish vositasi bilan bir xil asosiy nomga ega. Masalan: mymedia.MPG qiladi natijada mymedia.csv - D {sm,smn}, --vad_engine {sm, smn} Ovozli faoliyatni aniqlash (VAD) dvigatelidan foydalanish kerak (standart: 'smn'). 'smn 'signalni' nutq',' musiqa 'va' shovqin ' ga ajratdi (yaxshiroq). 'sm' ichiga ajratilgan signal