Manuál pro aplikaci Generátor Podcastů (Python GUI)

1. Co aplikace umí?

Převádí psaný text na mluvené slovo.
Umožňuje střídat různé hlasy v rámci jednoho scénáře.
Vytváří finální podcastový soubor ve formátu MP3.
Podporuje jak systémové hlasy Windows (SAPI 5), tak i moderní neurální hlasy od Microsoftu (např. Vít a Jakub) prostřednictvím služby Edge TTS. Také neuronové hlasy Antonín a Vlasta.

2. Co potřebujete (Požadavky)

Než začnete, ujistěte se, že máte následující:

Python: Verze 3.x (aplikace je psána v Pythonu).
Instalované Python knihovny: pydub, edge-tts, pywin32. Pokud je nemáte, nainstalujete je v příkazovém řádku (cmd) příkazem:
Bash (Příkazový řádek)
pip install pydub edge-tts pywin32
FFmpeg: Toto je externí nástroj pro zpracování zvuku, nezbytný pro převod a spojování souborů do MP3.
- Stažení: Stáhněte si kompletní verzi pro Windows (např. win64-gpl-shared nebo full_build-shared) z oficiálních stránek FFmpeg.
- Umístění: Po stažení a rozbalení archivu zkopírujte VŠECHNY soubory ze složky bin (tj. ffmpeg.exe, ffprobe.exe a související DLL knihovny) do stejné složky, kde máte uložen soubor podcast_gui.py. Bez toho aplikace nebude fungovat!
Internetové připojení: Nezbytné pro použití hlasů Vít a Jakub a dalších neurálních hlasů Edge TTS, protože jejich generování probíhá online. Pro systémové SAPI hlasy internet není potřeba.
Hlasy ve Windows: Alespoň jeden funkční hlas ve vašem systému Windows.

3. Spuštění aplikace

Ujistěte se, že máte splněny všechny požadavky z bodu 2.
Najděte soubor podcast_gui.py na vašem počítači.
Spusťte soubor dvouklikem, nebo přes příkazový řádek (cmd) přejděte do složky, kde máte soubor, a zadejte:
Bash (Příkazový řádek)
python podcast_gui.py

4. Práce se scénářem

Hlavní okno aplikace obsahuje velké textové pole pro váš scénář.

Formát scénáře: Každá replika (část textu, kterou má namluvit jeden hlas) musí být na samostatném řádku a musí začínat specifikací hlasu v hranatých závorkách [], následovanou textem.

Příklad:

[vit] Dobrý den, vítejte u našeho podcastu.
[jakub] Ahoj, dnes se podíváme na nejnovější zprávy.
[vlasta] To bude jistě zajímavé!
[antonin] Nezapomeňte se přihlásit k odběru.

Dostupné aliasy (zkrácené názvy) pro hlasy: Aplikace má předdefinované aliasy pro usnadnění práce. Můžete použít buď alias, nebo plné jméno hlasu (pokud ho znáte a je to SAPI hlas).

[antonin] nebo [tonda] (pro Microsoft Antonín Online)
[vlasta] (pro Natura hlasy Vlasta)
[radek] (pro RH Voice - Radek)
[zdenek] (pro RH Voice - Zdeněk)
[ondra] (pro RH Voice - Ondro)
[vit] (pro neurální hlas cs-CZ-VitNeural - vyžaduje internet)
[jakub] (pro neurální hlas cs-CZ-JakubNeural - vyžaduje internet)

Důležité:

Hlasy Vít a Jakub (neurální) neuvidíte v rozbalovacím menu "Dostupné SAPI Hlasy", protože nefungují na technologii SAPI 5. Pro jejich použití je nutné je napsat přímo do scénáře pomocí aliasů [vit] nebo [jakub].
Alias je psán bez ohledu na velikost písmen (např. [Vit] i [vit] bude fungovat).

Funkce "Kopírovat název hlasu"

V sekci "Dostupné SAPI Hlasy" najdete rozbalovací menu. Zde můžete vybrat libovolný SAPI hlas nainstalovaný ve vašem systému. Po kliknutí na tlačítko "Kopírovat název hlasu" se vám do schránky zkopíruje formát [jméno_hlasu_nebo_alias] , který můžete rovnou vložit do scénáře. To je užitečné pro SAPI hlasy, které nemají předdefinovaný alias.

5. Vygenerování podcastu

Jakmile máte scénář připravený v textovém poli, klikněte na velké tlačítko "Vygeneruj MP3 Podcast".
Aplikace začne generovat jednotlivé audio segmenty.
Po dokončení se vás aplikace zeptá, kam chcete výsledný MP3 soubor uložit. Vyberte umístění a název souboru.
Po uložení se zobrazí zpráva "Hotovo".

6. Řešení problémů (Troubleshooting)

Pokud narazíte na chybu, zde jsou nejčastější příčiny a jejich řešení:

Chyba syntaxe (Řádek X nezodpovídá formátu '[hlas] text'):
- Příčina: Text ve scénáři není správně formátován.
- Řešení: Zkontrolujte každý řádek scénáře, zda začíná [JménoHlasu] a následuje text. Ujistěte se, že tam nejsou prázdné řádky nebo jiné znaky, které narušují formát.
Chyba FFmpeg (Encoding failed, ffmpeg/avlib returned error code: 3221225781):
- Příčina: FFmpeg není nalezen, je špatně nainstalován, nebo chybí potřebné soubory.
- Řešení: Znovu zkontrolujte, zda jste všechny soubory ze složky bin staženého FFmpeg zkopírovali do stejné složky, kde je podcast_gui.py. Ujistěte se, že máte verzi win64-gpl-shared nebo full_build-shared.
Chyba Edge TTS (No audio was received. Please verify that your parameters are correct.):
- Příčina: Aplikace nemohla získat zvuková data z Edge TTS služby.
- Řešení: Zkontrolujte své internetové připojení. Ujistěte se, že je stabilní a funkční. Pokud používáte VPN/proxy, zkuste ji vypnout. Firewall nebo antivirus mohou také blokovat spojení, zkuste je dočasně deaktivovat (pouze pro test).
Hlas nenalezen (Hlas 'XYZ' nebyl nalezen. Použije se výchozí hlas.):
- Příčina: Specifikovaný SAPI hlas není nainstalován ve vašem systému, nebo jste udělali překlep.
- Řešení: Zkontrolujte překlepy v názvu hlasu nebo aliasu. Ujistěte se, že SAPI hlas, který chcete použít, je skutečně nainstalován (např. v nastavení řeči ve Windows).
Já mám na počítači problém, že nemám dostupný hlas Vít ani Jakub - změnil jsem je pomocí reg klíče, který jsem se stáhl ze stránke Balabolky, poměrně sofistikovaného programu pro text to speech (TTS) proto, abych z nich udělal SAPI. Nedoporučuji to!!! Balíček je na adrese http://www.cross-plus-a.com/mobile.windows10.zip - úmyslně nenastvuji jako odkaz.

I když jsem teď podnikl kroky, které mně poradila AI a myslím si o nich, že jsou v přoádku - tedy smazání přidaného klíče v registrech - k obnově ani po restartu počítače nedošlo, tedcy Jakuba (Mobile) mohu např. v ZOOMTextu nastavit a mluví, Víta nemám, doinstalovat přidáním hlasů v Nastavení Windows nejde - čštinou mám přidanou a další hlas to nenabízí. Tím, že jsem si odstranil Jakuba a Víta, kteří obšem nebyli v mém skriptu detekováni jako SAPI hlasy, zmizely i z Balabolky jako hlasy SAPI, ale mám tam další: RH Voice (zdarma), neuronové hlasy od Microsoftu Zdeňka a Vlastu, mohu si dokoupit hlasy Kobo Ivetu a Zuzanu, ale to až do nového počítače, cca na podzim 2025.

Pokud jste si také něco takového provedli - tady je návod od AI Gemini, ale mně to nezafungovalo.

Při práci v registrech buďte velmi opatrní a nejméně dvakrát prohlížej a jednou maž - v každém případě nejdříve zálohu:

Zálohujte si registr:
- Stiskněte Win + R, napište regedit a stiskněte Enter.
- V editoru registru klikněte na Soubor > Exportovat....
- Vyberte Vše a uložte záložní soubor registru na bezpečné místo.
Odstraňte problematický klíč registru:
- V editoru registru přejděte na tuto cestu: HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech\Voices\Tokens\
- Zde byste měl(a) vidět složku/klíč s názvem MSTTS_V110_csCZ_JakubM.
- Pravým tlačítkem myši klikněte na MSTTS_V110_csCZ_JakubM a zvolte Odstranit. Potvrďte smazání.
- Pro hlas Vít: Je možné, že existuje podobný klíč i pro hlas Vít (např. MSTTS_V110_csCZ_VitM nebo podobný). Pokud ano, odstraňte ho také.
Restartujte počítač: Po odstranění klíčů registru je nezbytné restartovat počítač, aby se změny projevily.

Výhodnější než Balabolka nebo DSpeech. Nebo si mp3 nastiřhat a poskládeat v nějakém zvukovém editoru.

O skript si mi napište: milosmid@volny.cz

Ukázka scénáře - mohu zaslat i ukázku podcastu Římská mytologie podle knihy Tajné dějiny Evropy.

Online:	5
Celkem:	1040406
Měsíc:	7209
Den:	162

PCklavesnici

Manuál pro aplikaci Generátor Podcastů (Python GUI)

1. Co aplikace umí?

2. Co potřebujete (Požadavky)

3. Spuštění aplikace

4. Práce se scénářem

Funkce "Kopírovat název hlasu"

5. Vygenerování podcastu

6. Řešení problémů (Troubleshooting)

Menu

Vyhledávání

Toplist

Archiv

RSS

Statistiky