Jdi na obsah Jdi na menu
 


Na jakém principu pracuje hlasová podpora v programu ZoomText nebo Supernova

19. 8. 2025

Základní princip hlasové podpory v ZoomTextu a Supernově

Stejně jako u JAWS nebo NVDA, i tyto programy primárně využívají přístupnostní API Windows (MSAA a UI Automation) k získávání informací o prvcích na obrazovce. Díky tomu vědí, co je textové pole, tlačítko, odkaz, jaký text se v nich nachází, a jakou mají roli a stav.

Klíčový rozdíl oproti čistým screen readerům je, že ZoomText a SuperNova jsou optimalizovány pro slabozraké uživatele, kteří ještě částečně vidí a spoléhají se především na zvětšení obrazovky. Hlasová podpora je pro ně doplňkem k vizuálnímu vjemu, který:

  1. Potvrzuje a upřesňuje vizuální informace: Uživatel vidí zvětšený text, ale hlas mu ho přečte, aby si ověřil, že čte správně, nebo aby mu pomohl s orientací, když se zrovna nedívá přesně na správné místo.
  2. Oznamuje události, které by vizuálně nemusel postřehnout: Například otevření dialogového okna, změnu zaměření na nový prvek, psaní textu (ozvěna znaků a slov).
  3. Umožňuje plynulé čtení delších pasáží: Pro čtení celých dokumentů nebo webových stránek by jen zvětšení nebylo dostatečné. Hlasová podpora umožňuje nepřerušované čtení, často s vizuálním zvýrazněním aktuálně čteného slova nebo řádku.
  4. Zpřístupňuje prvky mimo aktuální zvětšený pohled: I když má uživatel zvětšenou jen část obrazovky, screen readerová část programu ví o celém obsahu obrazovky a může na něj uživatele upozornit nebo ho k němu navigovat.

Jak konkrétně funguje hlasová podpora:

  1. Získávání informací:
    • Přístupnostní API (MSAA, UIA): Toto je hlavní zdroj dat. Programy se "ptají" Windows a aplikací na informace o všech prvcích uživatelského rozhraní.
    • Vnitřní modely aplikací: Pro komplexní aplikace jako webové prohlížeče (např. Google Chrome, Firefox) nebo Microsoft Office, programy využívají speciální techniky a skripty k získání bohatšího a strukturovanějšího obsahu. To zahrnuje DOM (Document Object Model) u webu nebo vlastní API Office aplikací.
    • OCR (Optical Character Recognition): V omezené míře, a to především pro "nepřístupné" aplikace nebo obrázky s textem, mohou ZoomText a SuperNova použít OCR k rozpoznání textu z obrazových dat. To je ale vždy až poslední možnost a není tak spolehlivá jako API.
  2. Zpracování informací a generování řeči:
    • Získaný text a informace o prvcích jsou předány do hlasového syntetizátoru (TTS - Text-to-Speech). ZoomText i SuperNova podporují různé syntetizátory, včetně těch vestavěných ve Windows (např. Microsoft OneCore hlasy) a často i vlastní nebo komerční syntetizátory (např. RealSpeak, Vocalizer Expressive od Nuance), které mohou nabídnout kvalitnější a přirozenější hlasy (včetně českých, jako je Zuzana nebo Iveta).
    • Výřečnost (verbosity): Uživatel si může nastavit úroveň detailů, které mu program bude číst. Například zda má číst jen text, nebo i typ prvku (tlačítko, zaškrtávací políčko), jeho stav (zaškrtnuto), klávesové zkratky apod. Toto je klíčové pro uživatele lupy, kteří často chtějí méně "mluveného" feedbacku než nevidomí uživatelé.
    • Odezva klávesnice a myši: Programy čtou znaky nebo slova, která uživatel píše, a mohou oznamovat text pod ukazatelem myši (Mouse Echo).
    • Čtecí nástroje (např. AppReader v ZoomTextu, Doc Reader v Supernově): Tyto nástroje umožňují plynulé čtení delších textů (dokumenty, webové stránky, e-maily). Často nabízejí funkce jako zvýraznění aktuálně čteného slova/řádku, automatické posouvání textu a navigaci po textu.

Rozdíly mezi "lupou s hlasovou podporou" a "plnohodnotným screen readerem" v Supernově:

Jako příklad Supernova má obvykle tři hlavní verze/edice:

  1. SuperNova Magnifier (pouze lupa): Zaměřuje se výhradně na vizuální zvětšení, filtry barev, vylepšení kurzoru atd. Nemá hlasovou podporu ani funkce screen readeru.
  2. SuperNova Magnifier & Speech (lupa s hlasovou podporou): Toto je ta "jedna větev programu jen o hlasové podpoře", o které mluvíš. Obsahuje všechny funkce lupy a přidává k nim:
    • Základní hlasovou odezvu pro orientaci na obrazovce (čtení prvků, textu, ozvěna psaní).
    • Schopnost číst webové stránky, e-maily a dokumenty.
    • Podporu pro skenování a čtení papírových dokumentů (OCR).
    • Je to pro slabozraké, kteří potřebují zvětšení, ale hlas jim pomáhá s efektivitou a přesností. Mnozí slabozrací uživatelé by bez hlasového doprovodu nebyli schopni efektivně pracovat.
  3. SuperNova Magnifier & Screen Reader (plnohodnotný screen reader): Toto je "plnohodnotný screen reader" větev. Obsahuje všechny funkce Magnifier & Speech, ale navíc přidává:
    • Kompletní odečítání obrazovky: Plná navigace po obrazovce pomocí klávesnice pro nevidomé uživatele.
    • Podrobnější oznámení: Mnohem podrobnější oznamování interpunkce, formátování, pravopisných chyb a změn na obrazovce.
    • Podpora Braillských řádků: Klíčová funkce pro nevidomé uživatele.
    • Je to řešení pro uživatele s velmi těžkým zrakovým postižením nebo úplnou slepotou, kteří primárně používají klávesnici a hlasový/braillský výstup, ale ocení i možnost vizuálního zvětšení (např. pro spolupráci s vidícími kolegy).

Shrnutí pro kamaráda:

"ZoomText a SuperNova jsou trochu jiné než jen ty klasické screen readery jako JAWS nebo NVDA. Představ si je jako kombinaci lupy a mluvícího asistenta.

Princip je stejný jako u NVDA nebo JAWS: Programy se od Windows a jiných aplikací dozvídají, co je na obrazovce za text a jaké tam jsou ovládací prvky (tlačítka, políčka atd.). Nepřečtou to z 'obrázků', ale dostanou to přímo popsané.

Rozdíl je v tom, co s tím dělají a pro koho jsou určeny:

  • Zvětšení je hlavní: Především zvětšují obrazovku, aby slabozrací uživatelé viděli lépe.
  • Hlas je doplněk: Hlasová podpora je tu k tomu, aby ti potvrdila, co vidíš, přečetla ti dlouhé texty, abys nemusel scrollovat a namáhat oči, nebo ti řekla, co se děje, když se zrovna nedíváš na to správné místo na obrazovce.
  • Supernova je navíc ve verzích:
    • Jedna verze (Magnifier & Speech) je primárně lupa s přidaným hlasem pro slabozraké. Funguje jako takový 'čtenář na požádání' a automaticky oznamuje důležité věci.
    • Druhá verze (Magnifier & Screen Reader) je pak plnohodnotný screen reader, který umí všechno jako JAWS nebo NVDA (tedy kompletně vést nevidomého uživatele po celém systému jen hlasem a klávesnicí), ale navíc má i ty funkce zvětšení pro ty, co ještě něco vidí.

Takže i když tyhle programy zvětšují, jejich hlasová podpora se neopírá o to, že by 'četly z obrázku', ale o to, že se chytře zeptají systému, co se na obrazovce nachází a pak ti to řeknou nahlas."

 

 

Proč skripty neudělají ze ZoomTextu plnohodnotný screen reader?

ZoomText je primárně navržen jako lupa s integrovanou hlasovou podporou, určená pro slabozraké uživatele, kteří částečně vidí a spoléhají se na vizuální zvětšení. Zatímco jeho hlasová podpora je velmi užitečná a umožňuje například čtení textu pod myší, odezvu při psaní nebo plynulé čtení dokumentů, jeho architektura a zaměření se zásadně liší od plnohodnotných screen readerů, jako jsou JAWS nebo NVDA.

Zde jsou hlavní důvody:

  • Filozofie a model interakce:
    • ZoomText: Jeho interakce je postavena na vizuálním modelu. Uživatel vidí zvětšenou část obrazovky a hlas mu poskytuje doplňující informace k tomu, co vidí. Prioritou je zvětšení a vizuální zpřístupnění.
    • Plnohodnotný Screen Reader (JAWS/NVDA): Jejich interakce je postavena na objektovém modelu a nevizuální navigaci. Uživatel, který nevidí vůbec, se spoléhá pouze na hlasový nebo Braillský výstup a klávesnici. Screen reader v mysli uživatele vytváří jakousi "virtuální mapu" obrazovky, po které se navigují bez ohledu na to, co je vizuálně k vidění.
  • Šíře a hloubka API integrace:
    • Zatímco ZoomText využívá přístupnostní API (MSAA, UIA) k získávání textu a informací o prvcích, jeho primární interpretace těchto dat je zaměřena na doplnění vizuálního zážitku.
    • Plnohodnotné screen readery se do API "zanořují" mnohem hlouběji a extrahují komplexnější informace o kontextu, vztazích mezi prvky, hierarchii a dynamických změnách na obrazovce. Jsou navrženy tak, aby dokázaly přesně popsat celou strukturu a interaktivitu uživatelského rozhraní nevidomému uživateli.
  • Chybějící funkce pro nevidomé:
    • Braillské řádky: ZoomText standardně nepodporuje Braillské řádky, což je klíčový nástroj pro nevidomé uživatele.
    • Pokročilé navigační příkazy: Plnohodnotné screen readery nabízejí desítky, někdy i stovky, klávesových zkratek a navigačních příkazů pro rychlý pohyb po stránce (např. přeskok na další nadpis, tabulku, odkaz, formulářové pole), což ZoomText v takovém rozsahu nemá.
    • Skripty pro komplexní aplikace: Zatímco ZoomText může mít základní skriptování, plnohodnotné screen readery mají sofistikované skriptovací jazyky a rozsáhlé komunity, které vytvářejí komplexní skripty pro specifické aplikace (např. Microsoft Office, Outlook, různé programovací IDE), aby kompenzovaly jejich nedostatečnou přístupnost. Tyto skripty umožňují plnohodnotnou interakci bez zraku.
  • Zaměření vývoje:
    • Vývojáři ZoomTextu se soustředí na zlepšování zvětšení, vizuálních filtrů, odezvy myši a základní hlasové podpory.
    • Vývojáři JAWS a NVDA se soustředí na co nejlepší interpretaci uživatelského rozhraní pro nevidomé uživatele, rychlost odezvy, podporu Braille a kompatibilitu s co nejširším spektrem aplikací.

Co skripty v ZoomTextu mohou (a nemohou) dělat?

Skripty v ZoomTextu jsou užitečné pro automatizaci opakujících se úkolů, zjednodušení práce s určitými aplikacemi nebo přizpůsobení chování hlasové podpory v konkrétních situacích. Mohou například:

  • Spouštět určité funkce ZoomTextu klávesovou zkratkou.
  • Automaticky změnit nastavení zvětšení nebo barvy pro konkrétní aplikaci.
  • Číst určité prvky, které by jinak nemusely být automaticky přečteny.
  • Simulovat stisky kláves nebo myši.

Nemohou však:

  • Přepsat základní model fungování ZoomTextu a jeho zaměření na vizuální interakci.
  • Vybudovat virtuální buffer pro komplexní navigaci, jak to dělají plnohodnotné screen readery pro web nebo dokumenty.
  • Přidat podporu pro Braillský řádek, pokud ji ZoomText v dané verzi nemá.
  • Poskytnout kontextuální informace o prvcích tak podrobně a komplexně, jak to dělají plnohodnotné screen readery pro nevidomé uživatele.

Shrnutí: Skripty v ZoomTextu jsou výkonným nástrojem pro přizpůsobení a automatizaci v rámci jeho funkcionality lupy a hlasové podpory. Nikdy z něj ale neudělají plnohodnotný screen reader navržený pro nevidomé uživatele, protože tyto dva typy programů mají odlišnou základní filozofii a architektonické zaměření.