Jdi na obsah Jdi na menu
 


DSpeech

23. 1. 2010

DSpeech

je program program pro převod textu do audia s použitím hlasové synthézy, kerá musí být instalovaná v počítači. Podporuje především hlasy SAPI 5 (Eliška - ACapella, Zuzana - Nuance RealSpeak, Jakub, Mirek a Markéta - Rosasoft a možná další ...). Podle stránek autora je možné doinstalovat SAPI 4 a zprovoznit aplikaci i pro hlasy SAPI 4, ale pokud používáte některý z hlasů SAPI 4, máte tuto podporu už nainstalovanou. K hlasům SAPI 4 patří hlasy Rosasoft, ale i Eliška, Hlas od Galopu a další). Přepínání mezi hlasy: Options - Use SAPI 4/SAPI 5 voice (Možnosti -

K dispozici je i čeština a anglický manuálek v textu. Čeština je uložena v souboru czech.lng a přepíná se z menu Options - Language selection - doprava Czech. Aplikace vyzve k restartu - potvrďte Yes a poté bude aplikace v češtině.

Výhody a použití:

Poslouchat můžete i bez převodu knihy v upraveném txt souboru například při ubíjejícím skenování. Zobrazuje se kurzor, kde se čte, takže v případě potřeby se přepnete do okna DSpeechu a podíváte se na text, kterému jste nerozuměli ("jak se správně píše").

K lepšímu poslechu je dobré zpravidla text upravit - skenované knihy z Braillnetu zpravidla obsahují dělítka: já text upravuji tak, že dám najít a nahradit tato rozdělítka a ručně zadaný konec řádku - najdete buď ve speciálních znacích (předchází tlačítko Více a pak tlačítko Speciální), nebo ho lze zapsat jako stříšku l (^l).

Můžete zkusit i volbu Úpravy - Automatické zakončení slova nebo ve stejné roletce Odstranit přebytečné konce řádků (je tu i stejnojmenná volba s upřesněním Násilně - nevím, co znamená). S textem se zde dá pracovat jako v běžném textovém editoru - nesmíte mít ovšem zapnuté přehrávání - stopku. Jde o volby v menu Úpravy: Cut (Vyjmout, Vložit, Kopírovat). Pod volbou Vložit je volba zavření aktuálního dokumentu CANCel.

Úplně však nejlépe upravíte text pomocí maker Knižka ze serveru http://www.santiago.wz.cz/ .

Prostředí programu a možnost předčítání textz

Po otevření textového souboru (Soubor - Otevřít) můžete spustit čtení klávesou F5 nebo tlačítkem Mluvit. Stejnou klávesou můžete čtení zastavit - k tomu můžete použít i klávesu Esc. Po opětovném stisku F5 začne číst znovu od začátku textu - od první řádky, tedy nikoli od aktuální pozice editačního kurzoru - k tomu slouží kláesa F9 nebo Alt+šipka doprava nebo tlačítko Vyslovit od kurzoru.

F4 nebo tlačítko Pauza je pozastavení čtení, znovu se od místa, kde jsme přestali číst, může spustit čtení kláesou F4 nebo tlačítkem Resume.

F6 nebo Alt+šipka šipka nahoru přečte předchozí řádek.

F7 nebo Alt+šipka vlevo přečte aktuální řádek.

Zároveň těmito klávesami přesunujeme i editačně čtecí kurzor, který se pohybuje se čtením. Těmto volbám odpovídají i tlačítka v druhé řadě tlačítek pod textovým boxem. Pro návrat do textového boxu použijte klávesu F1.

F8 nebo Alt+šipka dolů přečte následující řádek.

Je možné také v uživbatelském rozhraní programu zaškrtnout volbu Po stisku Enter přečíst řádek (je umístěna vprvo pod obrázkem mluvčího).

Hlasy

Program umožňuje využívat ke čtení více hlasů, pokud je máte instalované - může pomoci například při vícejazyčném textu.

F11 přepne na předchozí hlas,

F12 na následující hlas,

Shift+F11 přepne na první hlas

Shift+F12 přepne na poslední nastavený hlas.

Výběr hlasů najdete na pravé straně. Pokud tam některý hlas nenajdete, přepněte v Konfigutraci na jiný typ hlasu - DSpeech pracuje buď s rozhraním SAPI 4 nebo SAPI 5.

Pod rozbalovacím seznamem můžete nastavit i kvalitu hlasu - zvláště důležité při převodu do mp3 souboru.

Alt+1 zesílení hlasu

Alt+2 zeslabení hlasu

Alt+3 zvýšení rychlosti čtení hlasu

Alt+4 zpomalení roychlosti čtení hlasu

Alt+5 zvýšit hlasové výšky (pitch)

Alt+6 snížit hlasové výšky - hlubší hlas (pitch) - ne u všech hlasů funguje (ne mám odezvu u Elišky - Acapella). Pokud se Vám nedaří upravit výšku nebo jiný parametr hlasu, může být problém v tom, že máte v menu Možnosti zatrženou volbu Automaticky zvolí pro hlas jemu odpovídající zvukový formát. Parametry se také nemohou zřejmě měnit v průběhu čtení, ale až při pozastavení předčítání.

Ke změně parametrů hlasů můžete využít i posuvníky vlevo dole.

V menu Možnbosti můžete zaškrtnout volbu Konfigurovat hlasy nezávisle - každý hlas můžete mít například nastavený jinak rychle - opět využitelné například při vícejazyčných textech.

Pro rychlý návrat ke čtenému můžete zaškrtnout v Možnostech Automatické záložky a Při spuštění programu automaticky zaveď (otevři) naposledy otevřený soubor.

Vytváření zvukových knih

Začněme odzadu, protože někdy ani nechcete s textem žádné úpravy provádět: (máte-li text "připravený", tj minimálně otevřený) stačí k převedení dát Soubor - Uložit wav, mp3 nebo ogg soubor jako.

Kvalitu ukládaného zvukového souboru můžete zvolit v menu Možnosti - Zvolte mp3 kompresi - v podemnu máte možnost volby ze tří stupňů:

  • optimalizovat pro velikost;
  • vyvážení poměru mezi kvalitou a velikostí;
  • optimalizovat pro kvalitu.

Můžete také zaškrtnout v Možnostech - Vždy ulož s maximální hlasitostí.

Různá nastavení najdete též v menu Možnosti - Vytvoř zvukovou knihu, která pomůže zejména při rozdělování knihy na menší části - po kolika minutách (split options), nastavit počáteční a závěrečné ticho, ohlásit informační údaje, o který oddíl knihy jde nebo ještě další údaje, odstranění nevhodných prázdných řádků a zvolení výchozí konverzní tabulky.

Pro rozdělování knihy do jednotlivých mp3 souborů můžete využít makro příkaz #BREAK, který vložíte na řádku, za kterou se má nahrávka zalomit.

Text v uvozovkách přečte druhý hlas.

Dávková konverze

V menu Soubor - Dávková konverze - můžete odsud přímo spustit převod textů ve formátech txt, rtf, doc, pdf, html a xml.

Dalšími makro příkazy, kterými můžete vyšperkovat vytvářenou audioknihu, patří:

#PLAY FileName.wav - vložení zvukového souboru, který by měl zaznít na místě vložení tohoto příkazu, ale bohužel na mém počítači se zvuk opožďovat - zkoušel jsem použít zvuky z Windows. Může být užitečné například k upozornění na nadpisy kapitol.

K dispozici je anglický a italský návod v txt ve složce programu.

Rozpoznávání řeči

Program by měl umět i rozpoznávat lidský hlas a reagovat jakýmsi dialogem mezi uživatelem a počítačem. K tomu mi napsal jeden slovenský kamarád to, co otestoval:

"Dspeech vie okrem konverzie použiť aj rozpoznávanie reči. Je ale potrebné nainštalovať MS-Recognition Engine (samozřejmě pro anglickou výslovnost a anglická slova - více na stránkách Microsoftu). Skúšal som to a naozaj to funguje. Po nakopírovaní tohto textu a stlačení tlačidla speak sa dialo nasledovné
#VOICE Marco

I am Angelus the computer of Dimitri. You who are? (hlas marco - prepísal som na e-speak mi povedal, že sa volá Angelus a že sedím za počítačom dimitri. Opýtal sa ma, ako sa volám.
DO
 #RECOGNIZE Dimitri, Gloria, OTHER_WORDS (toto znamená, že má rozpoznať
Dimitri, Gloria, alebo iné)
 #IF RECOGNIZED Dimitri (ak som povedal dimitri)
povedal
 Angelus waiting for instructions. (Angelus čaká na príkazy)
 #EXIT DO (koniec)
 #END IF (koniec podmienky)
 #IF RECOGNIZED Gloria (ak som sa prihlásil ako Gloria)
 You have mistaken computer, yours is that of side. (sadla si si za zlý počítač, tvoj je na druhej strane)
 #EXIT DO
 #END IF
 #IF RECOGNIZED OTHER_WORDS (ak som povedal niečo iné)
 #RANDOM (program náhodne povie jednu z týchto troch správ)
 #CASE
  Can you repeat please? I have not understood your name. (opakujte prosím, nerozumel som Vaše meno)
 #CASE
  What have you said? Can you Repeat? (Čo ste povedali? Môžete to opakovať?)

 #CASE
  I have not understood what you have said, perhaps, simply, your

name I don't know him/it. (Nerozuml som, čo ste povedali, pravdepodobne nedokážem rozpoznať vaše meno)
 #END RANDOM (koniec opakovania
 #END IF (koniec podmienky
#LOOP (opakuj - týka sa ak poviem niečo iné ako gloria, dimitri)
Toto má simulovať komunikáciu s počítačom. On sa vás opýta ako sa voláte, a na základe počutého zareaguje. Dalo by sa to veľmi dobre uplatniť napr v callcentrách namiesto tónovej voľby (na podobnom princípe funguje irkr_pub na skype). Žiaľ tento microsoft speech recognition podporuje - pokial viem - len angličtinu. Pri konverzii do mp3 to asi len rpevedie čistý text.
Ondrej"

Nějak s rozpoznáváním souvisí i konfigurační soubor CustomTAG.txt - slova, která má umět rozpoznat?

Autor DSpeech chválí i hlasy RealSpeak a na jeho stránkách jsou odkazy na jejich stažení z RapidShare a tvrdí, že Microsoft by je měl defaultně integrovat do OS od Windows Vista (? nevím). Česká Zuzana mezi nimi však není.

Co mě nezafungovalo, je snad změna hlasů makropříkazem #VOICE

Na obrázku na domovské stránce je příklad:

#VOICE Microsoft Mike

text, který má říkat - bez uvozovek

#VOICE Susan.

Možná je problém v tom, jak se přesně u mě nainstalované hlasy jmenují a s kterými SAPI je možné příkaz použít.

Někdy se také stává, že DSpeech je nestabilní, spadne, zakousne se ... často postačí smazat konfigirační soubor DSpeech.ini.