Jdi na obsah Jdi na menu
 


Manuál pro aplikaci Generátor Podcastů (Python GUI)

1. Co aplikace umí?

 

  • Převádí psaný text na mluvené slovo.

  • Umožňuje střídat různé hlasy v rámci jednoho scénáře.

  • Vytváří finální podcastový soubor ve formátu MP3.

  • Podporuje jak systémové hlasy Windows (SAPI 5), tak i moderní neurální hlasy od Microsoftu (např. Vít a Jakub) prostřednictvím služby Edge TTS. Také neuronové hlasy Antonín a Vlasta.

 

2. Co potřebujete (Požadavky)

 

Než začnete, ujistěte se, že máte následující:

  • Python: Verze 3.x (aplikace je psána v Pythonu).

  • Instalované Python knihovny: pydub, edge-tts, pywin32. Pokud je nemáte, nainstalujete je v příkazovém řádku (cmd) příkazem:

    Bash (Příkazový řádek)
    pip install pydub edge-tts pywin32
    
  • FFmpeg: Toto je externí nástroj pro zpracování zvuku, nezbytný pro převod a spojování souborů do MP3.

    • Stažení: Stáhněte si kompletní verzi pro Windows (např. win64-gpl-shared nebo full_build-shared) z oficiálních stránek FFmpeg.

    • Umístění: Po stažení a rozbalení archivu zkopírujte VŠECHNY soubory ze složky bin (tj. ffmpeg.exe, ffprobe.exe a související DLL knihovny) do stejné složky, kde máte uložen soubor podcast_gui.py. Bez toho aplikace nebude fungovat!

  • Internetové připojení: Nezbytné pro použití hlasů Vít a Jakub a dalších neurálních hlasů Edge TTS, protože jejich generování probíhá online. Pro systémové SAPI hlasy internet není potřeba.

  • Hlasy ve Windows: Alespoň jeden funkční hlas ve vašem systému Windows.

 

3. Spuštění aplikace

 

  1. Ujistěte se, že máte splněny všechny požadavky z bodu 2.

  2. Najděte soubor podcast_gui.py na vašem počítači.

  3. Spusťte soubor dvouklikem, nebo přes příkazový řádek (cmd) přejděte do složky, kde máte soubor, a zadejte:

    Bash (Příkazový řádek)
    python podcast_gui.py
    

 

4. Práce se scénářem

 

Hlavní okno aplikace obsahuje velké textové pole pro váš scénář.

Formát scénáře: Každá replika (část textu, kterou má namluvit jeden hlas) musí být na samostatném řádku a musí začínat specifikací hlasu v hranatých závorkách [], následovanou textem.

Příklad:

 

[vit] Dobrý den, vítejte u našeho podcastu.
[jakub] Ahoj, dnes se podíváme na nejnovější zprávy.
[vlasta] To bude jistě zajímavé!
[antonin] Nezapomeňte se přihlásit k odběru.

Dostupné aliasy (zkrácené názvy) pro hlasy: Aplikace má předdefinované aliasy pro usnadnění práce. Můžete použít buď alias, nebo plné jméno hlasu (pokud ho znáte a je to SAPI hlas).

  • [antonin] nebo [tonda] (pro Microsoft Antonín Online)

  • [vlasta] (pro Natura hlasy Vlasta)

  • [radek] (pro RH Voice - Radek)

  • [zdenek] (pro RH Voice - Zdeněk)

  • [ondra] (pro RH Voice - Ondro)

  • [vit] (pro neurální hlas cs-CZ-VitNeural - vyžaduje internet)

  • [jakub] (pro neurální hlas cs-CZ-JakubNeural - vyžaduje internet)

Důležité:

  • Hlasy Vít a Jakub (neurální) neuvidíte v rozbalovacím menu "Dostupné SAPI Hlasy", protože nefungují na technologii SAPI 5. Pro jejich použití je nutné je napsat přímo do scénáře pomocí aliasů [vit] nebo [jakub].

  • Alias je psán bez ohledu na velikost písmen (např. [Vit] i [vit] bude fungovat).

 

Funkce "Kopírovat název hlasu"

 

V sekci "Dostupné SAPI Hlasy" najdete rozbalovací menu. Zde můžete vybrat libovolný SAPI hlas nainstalovaný ve vašem systému. Po kliknutí na tlačítko "Kopírovat název hlasu" se vám do schránky zkopíruje formát [jméno_hlasu_nebo_alias] , který můžete rovnou vložit do scénáře. To je užitečné pro SAPI hlasy, které nemají předdefinovaný alias.

 

5. Vygenerování podcastu

 

  1. Jakmile máte scénář připravený v textovém poli, klikněte na velké tlačítko "Vygeneruj MP3 Podcast".

  2. Aplikace začne generovat jednotlivé audio segmenty.

  3. Po dokončení se vás aplikace zeptá, kam chcete výsledný MP3 soubor uložit. Vyberte umístění a název souboru.

  4. Po uložení se zobrazí zpráva "Hotovo".

 

6. Řešení problémů (Troubleshooting)

 

Pokud narazíte na chybu, zde jsou nejčastější příčiny a jejich řešení:

  • Chyba syntaxe (Řádek X nezodpovídá formátu '[hlas] text'):

    • Příčina: Text ve scénáři není správně formátován.

    • Řešení: Zkontrolujte každý řádek scénáře, zda začíná [JménoHlasu] a následuje text. Ujistěte se, že tam nejsou prázdné řádky nebo jiné znaky, které narušují formát.

  • Chyba FFmpeg (Encoding failed, ffmpeg/avlib returned error code: 3221225781):

    • Příčina: FFmpeg není nalezen, je špatně nainstalován, nebo chybí potřebné soubory.

    • Řešení: Znovu zkontrolujte, zda jste všechny soubory ze složky bin staženého FFmpeg zkopírovali do stejné složky, kde je podcast_gui.py. Ujistěte se, že máte verzi win64-gpl-shared nebo full_build-shared.

  • Chyba Edge TTS (No audio was received. Please verify that your parameters are correct.):

    • Příčina: Aplikace nemohla získat zvuková data z Edge TTS služby.

    • Řešení: Zkontrolujte své internetové připojení. Ujistěte se, že je stabilní a funkční. Pokud používáte VPN/proxy, zkuste ji vypnout. Firewall nebo antivirus mohou také blokovat spojení, zkuste je dočasně deaktivovat (pouze pro test).

  • Hlas nenalezen (Hlas 'XYZ' nebyl nalezen. Použije se výchozí hlas.):

    • Příčina: Specifikovaný SAPI hlas není nainstalován ve vašem systému, nebo jste udělali překlep.

    • Řešení: Zkontrolujte překlepy v názvu hlasu nebo aliasu. Ujistěte se, že SAPI hlas, který chcete použít, je skutečně nainstalován (např. v nastavení řeči ve Windows).

  • Já mám na počítači problém, že nemám dostupný hlas Vít ani Jakub - odemykal sjem je, aby z niích byly SAPI 5)!!!

Výhodnější než Balabolka nebo DSpeech. Nebo si mp3 nastiřhat a poskládeat v nějakém zvukovém editoru.

O skript si mi napište: milosmid@volny.cz

Ukázka scénáře - mohu zaslat i ukázku podcastu Římská mytologie podle knihy Tajné dějiny Evropy.