Manuál pro aplikaci Generátor Podcastů (Python GUI)
1. Co aplikace umí?
-
Převádí psaný text na mluvené slovo.
-
Umožňuje střídat různé hlasy v rámci jednoho scénáře.
-
Vytváří finální podcastový soubor ve formátu MP3.
-
Podporuje jak systémové hlasy Windows (SAPI 5), tak i moderní neurální hlasy od Microsoftu (např. Vít a Jakub) prostřednictvím služby Edge TTS. Také neuronové hlasy Antonín a Vlasta.
2. Co potřebujete (Požadavky)
Než začnete, ujistěte se, že máte následující:
-
Python: Verze 3.x (aplikace je psána v Pythonu).
-
Instalované Python knihovny:
pydub
,edge-tts
,pywin32
. Pokud je nemáte, nainstalujete je v příkazovém řádku (cmd) příkazem:Bash (Příkazový řádek)pip install pydub edge-tts pywin32
-
FFmpeg: Toto je externí nástroj pro zpracování zvuku, nezbytný pro převod a spojování souborů do MP3.
-
Stažení: Stáhněte si kompletní verzi pro Windows (např.
win64-gpl-shared
nebofull_build-shared
) z oficiálních stránek FFmpeg. -
Umístění: Po stažení a rozbalení archivu zkopírujte VŠECHNY soubory ze složky
bin
(tj.ffmpeg.exe
,ffprobe.exe
a související DLL knihovny) do stejné složky, kde máte uložen souborpodcast_gui.py
. Bez toho aplikace nebude fungovat!
-
-
Internetové připojení: Nezbytné pro použití hlasů Vít a Jakub a dalších neurálních hlasů Edge TTS, protože jejich generování probíhá online. Pro systémové SAPI hlasy internet není potřeba.
-
Hlasy ve Windows: Alespoň jeden funkční hlas ve vašem systému Windows.
3. Spuštění aplikace
-
Ujistěte se, že máte splněny všechny požadavky z bodu 2.
-
Najděte soubor
podcast_gui.py
na vašem počítači. -
Spusťte soubor dvouklikem, nebo přes příkazový řádek (cmd) přejděte do složky, kde máte soubor, a zadejte:
Bash (Příkazový řádek)python podcast_gui.py
4. Práce se scénářem
Hlavní okno aplikace obsahuje velké textové pole pro váš scénář.
Formát scénáře: Každá replika (část textu, kterou má namluvit jeden hlas) musí být na samostatném řádku a musí začínat specifikací hlasu v hranatých závorkách []
, následovanou textem.
Příklad:
[vit] Dobrý den, vítejte u našeho podcastu. [jakub] Ahoj, dnes se podíváme na nejnovější zprávy. [vlasta] To bude jistě zajímavé! [antonin] Nezapomeňte se přihlásit k odběru.
Dostupné aliasy (zkrácené názvy) pro hlasy: Aplikace má předdefinované aliasy pro usnadnění práce. Můžete použít buď alias, nebo plné jméno hlasu (pokud ho znáte a je to SAPI hlas).
-
[antonin]
nebo[tonda]
(pro Microsoft Antonín Online) -
[vlasta]
(pro Natura hlasy Vlasta) -
[radek]
(pro RH Voice - Radek) -
[zdenek]
(pro RH Voice - Zdeněk) -
[ondra]
(pro RH Voice - Ondro) -
[vit]
(pro neurální hlas cs-CZ-VitNeural - vyžaduje internet) -
[jakub]
(pro neurální hlas cs-CZ-JakubNeural - vyžaduje internet)
Důležité:
-
Hlasy Vít a Jakub (neurální) neuvidíte v rozbalovacím menu "Dostupné SAPI Hlasy", protože nefungují na technologii SAPI 5. Pro jejich použití je nutné je napsat přímo do scénáře pomocí aliasů
[vit]
nebo[jakub]
. -
Alias je psán bez ohledu na velikost písmen (např.
[Vit]
i[vit]
bude fungovat).
Funkce "Kopírovat název hlasu"
V sekci "Dostupné SAPI Hlasy" najdete rozbalovací menu. Zde můžete vybrat libovolný SAPI hlas nainstalovaný ve vašem systému. Po kliknutí na tlačítko "Kopírovat název hlasu" se vám do schránky zkopíruje formát [jméno_hlasu_nebo_alias]
, který můžete rovnou vložit do scénáře. To je užitečné pro SAPI hlasy, které nemají předdefinovaný alias.
5. Vygenerování podcastu
-
Jakmile máte scénář připravený v textovém poli, klikněte na velké tlačítko "Vygeneruj MP3 Podcast".
-
Aplikace začne generovat jednotlivé audio segmenty.
-
Po dokončení se vás aplikace zeptá, kam chcete výsledný MP3 soubor uložit. Vyberte umístění a název souboru.
-
Po uložení se zobrazí zpráva "Hotovo".
6. Řešení problémů (Troubleshooting)
Pokud narazíte na chybu, zde jsou nejčastější příčiny a jejich řešení:
-
Chyba syntaxe (
Řádek X nezodpovídá formátu '[hlas] text'
):-
Příčina: Text ve scénáři není správně formátován.
-
Řešení: Zkontrolujte každý řádek scénáře, zda začíná
[JménoHlasu]
a následuje text. Ujistěte se, že tam nejsou prázdné řádky nebo jiné znaky, které narušují formát.
-
-
Chyba FFmpeg (
Encoding failed
,ffmpeg/avlib returned error code: 3221225781
):-
Příčina: FFmpeg není nalezen, je špatně nainstalován, nebo chybí potřebné soubory.
-
Řešení: Znovu zkontrolujte, zda jste všechny soubory ze složky
bin
staženého FFmpeg zkopírovali do stejné složky, kde jepodcast_gui.py
. Ujistěte se, že máte verziwin64-gpl-shared
nebofull_build-shared
.
-
-
Chyba Edge TTS (
No audio was received. Please verify that your parameters are correct.
):-
Příčina: Aplikace nemohla získat zvuková data z Edge TTS služby.
-
Řešení: Zkontrolujte své internetové připojení. Ujistěte se, že je stabilní a funkční. Pokud používáte VPN/proxy, zkuste ji vypnout. Firewall nebo antivirus mohou také blokovat spojení, zkuste je dočasně deaktivovat (pouze pro test).
-
-
Hlas nenalezen (
Hlas 'XYZ' nebyl nalezen. Použije se výchozí hlas.
):-
Příčina: Specifikovaný SAPI hlas není nainstalován ve vašem systému, nebo jste udělali překlep.
-
Řešení: Zkontrolujte překlepy v názvu hlasu nebo aliasu. Ujistěte se, že SAPI hlas, který chcete použít, je skutečně nainstalován (např. v nastavení řeči ve Windows).
-
-
Já mám na počítači problém, že nemám dostupný hlas Vít ani Jakub - odemykal sjem je, aby z niích byly SAPI 5)!!!
Výhodnější než Balabolka nebo DSpeech. Nebo si mp3 nastiřhat a poskládeat v nějakém zvukovém editoru.
O skript si mi napište: milosmid@volny.cz
Ukázka scénáře - mohu zaslat i ukázku podcastu Římská mytologie podle knihy Tajné dějiny Evropy.