Mbrola a windows rendszeren.

A következőkben az ahhoz szükséges lépéseket írom le, hogy egy windows rendszeren a gép fölolvasson egy tetszőleges magyar nyelvű szöveget (mbrola és az itt leírt összes program működik linuxon is! leiras.htm).

1. Letöltés:


Az mbrola szövegfelolvasó rendszer a weben a http://tcts.fpms.ac.be/synthesis/mbrola.html oldalon található.
Innen kell a letöltési oldalról: http://tcts.fpms.ac.be/synthesis/mbrola/mbrolatools.html
a windowson végrehajtható programot:
http://tcts.fpms.ac.be/synthesis/mbrola/bin/pcwin/MbrolaTools35.exe -t letölteni, és a magyar hangot:
http://tcts.fpms.ac.be/synthesis/mbrola/dba/hu1/hu1.zip

2. Installálás:


1. Az MbrolaTools305.exe állományt hajtasd végre. Jelöld ki a programok tárolására szokásos direktorit helyének. Installálás után pakold ki a hu1.zip állományt abba a direktoriba, ahova az mbroli.exe állományt kopírozta az installáció.
2. Készíts el egy mbrola.ini állományt ugyanabba a direktoriba, ahol mbroli.exe van.
Az mbrola.ini állomány így nézzen ki:
-------------------------------------
[GENERAL]
Path =C:\download\txt2speech\szoveg
AutoPlayFile = 1

[DATABASE]
Default =hu1

[PITCH]
Min = 10
Max = 300

[TIME]
Min = 10
Max = 300

[VOICE]
Min = 10
Max = 16000

[VOLUME]
Min = 0.2
Max = 3
---------------
A Path a [GENERAL] részlegben az a direktori, ahol először keresi majd mbroli.exe a .pho állományokat. Add meg itt azt a direktorit, amelynek használata neked a legcélszerűbb.
3. indítsd el mbroli.exe-t. Ez először megkérdezi, hogy melyik nyelvet akarod regisztrálni. Válaszd ki a kipakolt hu1 direktorit, majd kettős klikk után a hu1 állományt. Természetesen további nyelveket is kiválaszthatsz és regisztrálhatsz, ha szükséged van rájuk.

3. Szöveg-fonéma átalakítás


Majd a szöveg-fonéma átalakító szükséges, ez lehozható:
http://tkltrans.sf.net/magyar/hunpho.tar.gz

A szöveg-fonéma átalakítóhoz szükséges a perl interpreter és az awk segédprogram. A perl interpretert például innen lehet lehozni: http://www.zdnet.de/downloads/prg/9/5/en10006395_is-wc.html, az awk-t pedig innen: http://gnuwin32.sourceforge.net/packages/gawk.htm

Installálásuk után a "path" környezeti változónak tartalmaznia kell mind a Perldir\bin mind az Awkdir\bin direktorikat. Ezt vagy a system/environment grafikus eszközzel lehet beállítani egyszer s mindenkorra, vagy beleírni egy batch állományba, amit a dos munkaablakból egyszer le kell futtatni a szövegfelolvasás(ok) előtt. A batch parancs erre így néz ki:
set path=%path%;Perldir\bin;Awkdir\bin
ahol a Perldir és Awkdir a tényleges perl és awk direktorikat tartalmazza, pl. c:\perl\bin vagy hasonló.

Működési feltételek:
1. A szövegnek szövegformátumban kell léteznie. *.doc, *.pdf, stb formátumokat előbb tiszta szöveggé kell átalakítani.

2. A szöveg két szűrőn kell hogy átmenjen, mielőtt hanggá (fonémák
sorozatává) válik:
  2.a szam.awk kiszűri a zárójeleket és idézőjeleket, az önálló
betűket kimondhatóvá teszi, bizonyos rövidítéseket kimondhatóvá tesz, problematikus szókapcsolatokat szétválaszt és a számjegyeket szavakká alakítja.
  2.b xttp.pl a szűrt szöveget fonémákká alakítja.
3. A fonéma állományra alkalmazni kell az mbrola programot a
hu1 adatbázissal.

2. és 3. windows batch formájában (do.bat):
  awk -f szam.awk <%1.txt >%11.txt
  perl xttp.pl $2 < %11.txt >%1.pho
  mbroli %1.pho

xttp.pl paramétere, melyet nem kötelező megadni, lehet m, f1, f2 vagy f3. A paraméter hiánya a legmélyebb női hangot jelenti, azaz megfelel az f1 paraméternek, f2 és f3 egyre magasabb hangokat jelent, m pedig férfihangot.

Ha egy tetszőleges szövegállományt sikeresen átalakítottál szöveg.pho formátumba, mbroli azt lejátssza.

do.bat fölhívása a parancssorból két példával illusztrálva a szoveg.txt állományra:
  do.bat szoveg f1
  do.bat szoveg

4. További információk


Információk további segédeszközökről és más adatok a magyar szövegszintetizátorról a leiras.htm állományban találhatók.