Tartalom

Magyar nyelvű gépi fölolvasás az espeak programmal
Üzembe helyezés
Parancssori használat
Ismert problémák
Perl interfész


Magyar nyelvű gépi fölolvasás az espeak programmal.

Az espeak fölolvasó az mbrola fölolvasóhoz hasonlóképpen képes magyar szövegek érthető felolvasására. Használható egyszerű parancssori felolvasóként, a KDE TTS programjaként vagy a Gnome Speech meghajtójával, a festival és hasonló programok helyett, melyekhez, ezek rossz dokumentáltsága miatt nincs magyar hang. Interfészt ad a Windows SAPI5-höz. Nyitott forráskódú program.

Espeak üzembe helyezése:

1. Windows verzió: lehozni, installálni. Használható vagy a melléadott egyszerű grafikus felülettel, vagy a parancssori változattal.

2. Linux változat: Hozza le a linux fát (pl. espeak-1.25.13.zip vagy ennél nagyobb verziószámút), és bontsa ki.
3. superuser-ként hajtsa végre a következő utasításokat:

cp -f espeak /usr/local/bin
cp -f speak /usr/local/bin
rm -rf /usr/share/espeak-data
cp -r espeak-data /usr/share
cp -f libespeak.so.1.1.25 /usr/lib

Végül:
cd /usr/lib
ln -s libespeak.so.1.1.25 /usr/lib/libespeak.so.1
Program aktualizálásnál az utolsó két lépés nem szükséges.

A program működéséhez szükséges a PortAudio könyvtár 18-as verziója, libportaudio0 könyvtár. Ez általában már installálva van a rendszereken, mivel az OpenOffice és az Audacity is használja. Az UHU esetén másolja az /usr/lib/openoffice.org-2.1/program mappából a következő fájlokat a /lib mappába:
libportaudio.so
libportaudio.so.0
libportaudio.so.0.0
libportaudio.so.0.0.18

Van espeak uhu csomag http://uhu.linux.hu alatt. Ennek használata feleslegessé teszi a kézi munkát a libportaudio könyvtárakkal.

Az espeak rendkívül dinamikusan fejlődő program, célszerű néha frissíteni oldaláról, ami eléggé egyszerű dolog.


1. Parancssori használat

espeak -vhu -x "halló világ!"

Női hang:
espeak -vhu+12 -x "halló világ!"

hosszabb szöveg felolvasása:
espeak -vhu -x -f /tmp/x.txt

A szöveg wav fájlba írása:
espeak -vhu -x -f /tmp/x.txt -w /tmp/x.wav

Wav fájlból ogg fájl előállítása:
sox /tmp/x.wav /tmp/x.ogg

a sox programmal a kész wav fájl pl. ogg formátumba alakítható, és ezek után bármelyik lejátszóval kényelmesen meghallgatható.

2. Ismert problémák:

1. Az r betű kiejtése néhol enyhén raccsoló
2. A z betű kiejtése néhol idegenszerű (bihalmat bizalmat helyett). Ez az újabb verzióknál határozottan javult.
3. A gy betű kiejtése néhol d szerű ("hodj az" "hogy az" helyett).
4. Kérdő mondatokban mindig az utolsó szótagot hangsúlyozza. (Nem tudja, hogy ha nincs kérdőszó, az utolsó előtti szótagon van a hangsúly, pl. "Látod a rádiót?" (szemben a "Hol a rádió?" típusú kérdéssel, ahol az első és utolsó szótagot kell hangsúlyozni).

3. Perl interfész

Az espeak perl interfésze a cpan könyvtárából hozható le, keressen cpan espeak szavakkal a googlen. E sorok írásakor a 0.22 változat aktuális. Perl segítségével egyszerűen lehetséges a nyelvek, hangtípusok és a beszélő nemének változtatása egy szövegen belül.
Perl példa férfi és női hangok használatára:

use strict;
use Speech::eSpeak ':all';
espeak_Initialize(AUDIO_OUTPUT_PLAYBACK, 0, '', 0);
my $synth_flags = espeakCHARS_AUTO | espeakPHONEMES
espeakENDPAUSE;
my $s = "helló, kedves Anna";
my $s2 = "helló, kedves Péter";
espeak_SetVoiceByName("hu+m2");
espeak_Synth($s, length($s) + 1, 0, POS_CHARACTER, 0, $synth_flags, 0, 0);
espeak_SetVoiceByName("hu+f2");
espeak_Synth($s, length($s) + 1, 0, POS_CHARACTER, 0, $synth_flags, 0, 0);
espeak_Synchronize();