Na jakém principu pracuje hlasová podpora v programu ZoomText nebo Supernova

19. 8. 2025

Základní princip hlasové podpory v ZoomTextu a Supernově

Stejně jako u JAWS nebo NVDA, i tyto programy primárně využívají přístupnostní API Windows (MSAA a UI Automation) k získávání informací o prvcích na obrazovce. Díky tomu vědí, co je textové pole, tlačítko, odkaz, jaký text se v nich nachází, a jakou mají roli a stav.

Klíčový rozdíl oproti čistým screen readerům je, že ZoomText a SuperNova jsou optimalizovány pro slabozraké uživatele, kteří ještě částečně vidí a spoléhají se především na zvětšení obrazovky. Hlasová podpora je pro ně doplňkem k vizuálnímu vjemu, který:

Potvrzuje a upřesňuje vizuální informace: Uživatel vidí zvětšený text, ale hlas mu ho přečte, aby si ověřil, že čte správně, nebo aby mu pomohl s orientací, když se zrovna nedívá přesně na správné místo.
Oznamuje události, které by vizuálně nemusel postřehnout: Například otevření dialogového okna, změnu zaměření na nový prvek, psaní textu (ozvěna znaků a slov).
Umožňuje plynulé čtení delších pasáží: Pro čtení celých dokumentů nebo webových stránek by jen zvětšení nebylo dostatečné. Hlasová podpora umožňuje nepřerušované čtení, často s vizuálním zvýrazněním aktuálně čteného slova nebo řádku.
Zpřístupňuje prvky mimo aktuální zvětšený pohled: I když má uživatel zvětšenou jen část obrazovky, screen readerová část programu ví o celém obsahu obrazovky a může na něj uživatele upozornit nebo ho k němu navigovat.

Jak konkrétně funguje hlasová podpora:

Získávání informací:
- Přístupnostní API (MSAA, UIA): Toto je hlavní zdroj dat. Programy se "ptají" Windows a aplikací na informace o všech prvcích uživatelského rozhraní.
- Vnitřní modely aplikací: Pro komplexní aplikace jako webové prohlížeče (např. Google Chrome, Firefox) nebo Microsoft Office, programy využívají speciální techniky a skripty k získání bohatšího a strukturovanějšího obsahu. To zahrnuje DOM (Document Object Model) u webu nebo vlastní API Office aplikací.
- OCR (Optical Character Recognition): V omezené míře, a to především pro "nepřístupné" aplikace nebo obrázky s textem, mohou ZoomText a SuperNova použít OCR k rozpoznání textu z obrazových dat. To je ale vždy až poslední možnost a není tak spolehlivá jako API.
Zpracování informací a generování řeči:
- Získaný text a informace o prvcích jsou předány do hlasového syntetizátoru (TTS - Text-to-Speech). ZoomText i SuperNova podporují různé syntetizátory, včetně těch vestavěných ve Windows (např. Microsoft OneCore hlasy) a často i vlastní nebo komerční syntetizátory (např. RealSpeak, Vocalizer Expressive od Nuance), které mohou nabídnout kvalitnější a přirozenější hlasy (včetně českých, jako je Zuzana nebo Iveta).
- Výřečnost (verbosity): Uživatel si může nastavit úroveň detailů, které mu program bude číst. Například zda má číst jen text, nebo i typ prvku (tlačítko, zaškrtávací políčko), jeho stav (zaškrtnuto), klávesové zkratky apod. Toto je klíčové pro uživatele lupy, kteří často chtějí méně "mluveného" feedbacku než nevidomí uživatelé.
- Odezva klávesnice a myši: Programy čtou znaky nebo slova, která uživatel píše, a mohou oznamovat text pod ukazatelem myši (Mouse Echo).
- Čtecí nástroje (např. AppReader v ZoomTextu, Doc Reader v Supernově): Tyto nástroje umožňují plynulé čtení delších textů (dokumenty, webové stránky, e-maily). Často nabízejí funkce jako zvýraznění aktuálně čteného slova/řádku, automatické posouvání textu a navigaci po textu.

Rozdíly mezi "lupou s hlasovou podporou" a "plnohodnotným screen readerem" v Supernově:

Jako příklad Supernova má obvykle tři hlavní verze/edice:

SuperNova Magnifier (pouze lupa): Zaměřuje se výhradně na vizuální zvětšení, filtry barev, vylepšení kurzoru atd. Nemá hlasovou podporu ani funkce screen readeru.
SuperNova Magnifier & Speech (lupa s hlasovou podporou): Toto je ta "jedna větev programu jen o hlasové podpoře", o které mluvíš. Obsahuje všechny funkce lupy a přidává k nim:
- Základní hlasovou odezvu pro orientaci na obrazovce (čtení prvků, textu, ozvěna psaní).
- Schopnost číst webové stránky, e-maily a dokumenty.
- Podporu pro skenování a čtení papírových dokumentů (OCR).
- Je to pro slabozraké, kteří potřebují zvětšení, ale hlas jim pomáhá s efektivitou a přesností. Mnozí slabozrací uživatelé by bez hlasového doprovodu nebyli schopni efektivně pracovat.
SuperNova Magnifier & Screen Reader (plnohodnotný screen reader): Toto je "plnohodnotný screen reader" větev. Obsahuje všechny funkce Magnifier & Speech, ale navíc přidává:
- Kompletní odečítání obrazovky: Plná navigace po obrazovce pomocí klávesnice pro nevidomé uživatele.
- Podrobnější oznámení: Mnohem podrobnější oznamování interpunkce, formátování, pravopisných chyb a změn na obrazovce.
- Podpora Braillských řádků: Klíčová funkce pro nevidomé uživatele.
- Je to řešení pro uživatele s velmi těžkým zrakovým postižením nebo úplnou slepotou, kteří primárně používají klávesnici a hlasový/braillský výstup, ale ocení i možnost vizuálního zvětšení (např. pro spolupráci s vidícími kolegy).

Shrnutí pro kamaráda:

"ZoomText a SuperNova jsou trochu jiné než jen ty klasické screen readery jako JAWS nebo NVDA. Představ si je jako kombinaci lupy a mluvícího asistenta.

Princip je stejný jako u NVDA nebo JAWS: Programy se od Windows a jiných aplikací dozvídají, co je na obrazovce za text a jaké tam jsou ovládací prvky (tlačítka, políčka atd.). Nepřečtou to z 'obrázků', ale dostanou to přímo popsané.

Rozdíl je v tom, co s tím dělají a pro koho jsou určeny:

Zvětšení je hlavní: Především zvětšují obrazovku, aby slabozrací uživatelé viděli lépe.
Hlas je doplněk: Hlasová podpora je tu k tomu, aby ti potvrdila, co vidíš, přečetla ti dlouhé texty, abys nemusel scrollovat a namáhat oči, nebo ti řekla, co se děje, když se zrovna nedíváš na to správné místo na obrazovce.
Supernova je navíc ve verzích:
- Jedna verze (Magnifier & Speech) je primárně lupa s přidaným hlasem pro slabozraké. Funguje jako takový 'čtenář na požádání' a automaticky oznamuje důležité věci.
- Druhá verze (Magnifier & Screen Reader) je pak plnohodnotný screen reader, který umí všechno jako JAWS nebo NVDA (tedy kompletně vést nevidomého uživatele po celém systému jen hlasem a klávesnicí), ale navíc má i ty funkce zvětšení pro ty, co ještě něco vidí.

Takže i když tyhle programy zvětšují, jejich hlasová podpora se neopírá o to, že by 'četly z obrázku', ale o to, že se chytře zeptají systému, co se na obrazovce nachází a pak ti to řeknou nahlas."

Proč skripty neudělají ze ZoomTextu plnohodnotný screen reader?

ZoomText je primárně navržen jako lupa s integrovanou hlasovou podporou, určená pro slabozraké uživatele, kteří částečně vidí a spoléhají se na vizuální zvětšení. Zatímco jeho hlasová podpora je velmi užitečná a umožňuje například čtení textu pod myší, odezvu při psaní nebo plynulé čtení dokumentů, jeho architektura a zaměření se zásadně liší od plnohodnotných screen readerů, jako jsou JAWS nebo NVDA.

Zde jsou hlavní důvody:

Filozofie a model interakce:
- ZoomText: Jeho interakce je postavena na vizuálním modelu. Uživatel vidí zvětšenou část obrazovky a hlas mu poskytuje doplňující informace k tomu, co vidí. Prioritou je zvětšení a vizuální zpřístupnění.
- Plnohodnotný Screen Reader (JAWS/NVDA): Jejich interakce je postavena na objektovém modelu a nevizuální navigaci. Uživatel, který nevidí vůbec, se spoléhá pouze na hlasový nebo Braillský výstup a klávesnici. Screen reader v mysli uživatele vytváří jakousi "virtuální mapu" obrazovky, po které se navigují bez ohledu na to, co je vizuálně k vidění.
Šíře a hloubka API integrace:
- Zatímco ZoomText využívá přístupnostní API (MSAA, UIA) k získávání textu a informací o prvcích, jeho primární interpretace těchto dat je zaměřena na doplnění vizuálního zážitku.
- Plnohodnotné screen readery se do API "zanořují" mnohem hlouběji a extrahují komplexnější informace o kontextu, vztazích mezi prvky, hierarchii a dynamických změnách na obrazovce. Jsou navrženy tak, aby dokázaly přesně popsat celou strukturu a interaktivitu uživatelského rozhraní nevidomému uživateli.
Chybějící funkce pro nevidomé:
- Braillské řádky: ZoomText standardně nepodporuje Braillské řádky, což je klíčový nástroj pro nevidomé uživatele.
- Pokročilé navigační příkazy: Plnohodnotné screen readery nabízejí desítky, někdy i stovky, klávesových zkratek a navigačních příkazů pro rychlý pohyb po stránce (např. přeskok na další nadpis, tabulku, odkaz, formulářové pole), což ZoomText v takovém rozsahu nemá.
- Skripty pro komplexní aplikace: Zatímco ZoomText může mít základní skriptování, plnohodnotné screen readery mají sofistikované skriptovací jazyky a rozsáhlé komunity, které vytvářejí komplexní skripty pro specifické aplikace (např. Microsoft Office, Outlook, různé programovací IDE), aby kompenzovaly jejich nedostatečnou přístupnost. Tyto skripty umožňují plnohodnotnou interakci bez zraku.
Zaměření vývoje:
- Vývojáři ZoomTextu se soustředí na zlepšování zvětšení, vizuálních filtrů, odezvy myši a základní hlasové podpory.
- Vývojáři JAWS a NVDA se soustředí na co nejlepší interpretaci uživatelského rozhraní pro nevidomé uživatele, rychlost odezvy, podporu Braille a kompatibilitu s co nejširším spektrem aplikací.

Co skripty v ZoomTextu mohou (a nemohou) dělat?

Skripty v ZoomTextu jsou užitečné pro automatizaci opakujících se úkolů, zjednodušení práce s určitými aplikacemi nebo přizpůsobení chování hlasové podpory v konkrétních situacích. Mohou například:

Spouštět určité funkce ZoomTextu klávesovou zkratkou.
Automaticky změnit nastavení zvětšení nebo barvy pro konkrétní aplikaci.
Číst určité prvky, které by jinak nemusely být automaticky přečteny.
Simulovat stisky kláves nebo myši.

Nemohou však:

Přepsat základní model fungování ZoomTextu a jeho zaměření na vizuální interakci.
Vybudovat virtuální buffer pro komplexní navigaci, jak to dělají plnohodnotné screen readery pro web nebo dokumenty.
Přidat podporu pro Braillský řádek, pokud ji ZoomText v dané verzi nemá.
Poskytnout kontextuální informace o prvcích tak podrobně a komplexně, jak to dělají plnohodnotné screen readery pro nevidomé uživatele.

Shrnutí: Skripty v ZoomTextu jsou výkonným nástrojem pro přizpůsobení a automatizaci v rámci jeho funkcionality lupy a hlasové podpory. Nikdy z něj ale neudělají plnohodnotný screen reader navržený pro nevidomé uživatele, protože tyto dva typy programů mají odlišnou základní filozofii a architektonické zaměření.

Online:	6
Celkem:	1053449
Měsíc:	6383
Den:	192

PCklavesnici

Na jakém principu pracuje hlasová podpora v programu ZoomText nebo Supernova

Menu

Vyhledávání

Toplist

Archiv

RSS

Statistiky