Na jakém principu pracuje hlasová podpora v programu ZoomText nebo Supernova
Základní princip hlasové podpory v ZoomTextu a Supernově
Stejně jako u JAWS nebo NVDA, i tyto programy primárně využívají přístupnostní API Windows (MSAA a UI Automation) k získávání informací o prvcích na obrazovce. Díky tomu vědí, co je textové pole, tlačítko, odkaz, jaký text se v nich nachází, a jakou mají roli a stav.
Klíčový rozdíl oproti čistým screen readerům je, že ZoomText a SuperNova jsou optimalizovány pro slabozraké uživatele, kteří ještě částečně vidí a spoléhají se především na zvětšení obrazovky. Hlasová podpora je pro ně doplňkem k vizuálnímu vjemu, který:
- Potvrzuje a upřesňuje vizuální informace: Uživatel vidí zvětšený text, ale hlas mu ho přečte, aby si ověřil, že čte správně, nebo aby mu pomohl s orientací, když se zrovna nedívá přesně na správné místo.
- Oznamuje události, které by vizuálně nemusel postřehnout: Například otevření dialogového okna, změnu zaměření na nový prvek, psaní textu (ozvěna znaků a slov).
- Umožňuje plynulé čtení delších pasáží: Pro čtení celých dokumentů nebo webových stránek by jen zvětšení nebylo dostatečné. Hlasová podpora umožňuje nepřerušované čtení, často s vizuálním zvýrazněním aktuálně čteného slova nebo řádku.
- Zpřístupňuje prvky mimo aktuální zvětšený pohled: I když má uživatel zvětšenou jen část obrazovky, screen readerová část programu ví o celém obsahu obrazovky a může na něj uživatele upozornit nebo ho k němu navigovat.
Jak konkrétně funguje hlasová podpora:
- Získávání informací:
- Přístupnostní API (MSAA, UIA): Toto je hlavní zdroj dat. Programy se "ptají" Windows a aplikací na informace o všech prvcích uživatelského rozhraní.
- Vnitřní modely aplikací: Pro komplexní aplikace jako webové prohlížeče (např. Google Chrome, Firefox) nebo Microsoft Office, programy využívají speciální techniky a skripty k získání bohatšího a strukturovanějšího obsahu. To zahrnuje DOM (Document Object Model) u webu nebo vlastní API Office aplikací.
- OCR (Optical Character Recognition): V omezené míře, a to především pro "nepřístupné" aplikace nebo obrázky s textem, mohou ZoomText a SuperNova použít OCR k rozpoznání textu z obrazových dat. To je ale vždy až poslední možnost a není tak spolehlivá jako API.
- Zpracování informací a generování řeči:
- Získaný text a informace o prvcích jsou předány do hlasového syntetizátoru (TTS - Text-to-Speech). ZoomText i SuperNova podporují různé syntetizátory, včetně těch vestavěných ve Windows (např. Microsoft OneCore hlasy) a často i vlastní nebo komerční syntetizátory (např. RealSpeak, Vocalizer Expressive od Nuance), které mohou nabídnout kvalitnější a přirozenější hlasy (včetně českých, jako je Zuzana nebo Iveta).
- Výřečnost (verbosity): Uživatel si může nastavit úroveň detailů, které mu program bude číst. Například zda má číst jen text, nebo i typ prvku (tlačítko, zaškrtávací políčko), jeho stav (zaškrtnuto), klávesové zkratky apod. Toto je klíčové pro uživatele lupy, kteří často chtějí méně "mluveného" feedbacku než nevidomí uživatelé.
- Odezva klávesnice a myši: Programy čtou znaky nebo slova, která uživatel píše, a mohou oznamovat text pod ukazatelem myši (Mouse Echo).
- Čtecí nástroje (např. AppReader v ZoomTextu, Doc Reader v Supernově): Tyto nástroje umožňují plynulé čtení delších textů (dokumenty, webové stránky, e-maily). Často nabízejí funkce jako zvýraznění aktuálně čteného slova/řádku, automatické posouvání textu a navigaci po textu.
Rozdíly mezi "lupou s hlasovou podporou" a "plnohodnotným screen readerem" v Supernově:
Jako příklad Supernova má obvykle tři hlavní verze/edice:
- SuperNova Magnifier (pouze lupa): Zaměřuje se výhradně na vizuální zvětšení, filtry barev, vylepšení kurzoru atd. Nemá hlasovou podporu ani funkce screen readeru.
- SuperNova Magnifier & Speech (lupa s hlasovou podporou): Toto je ta "jedna větev programu jen o hlasové podpoře", o které mluvíš. Obsahuje všechny funkce lupy a přidává k nim:
- Základní hlasovou odezvu pro orientaci na obrazovce (čtení prvků, textu, ozvěna psaní).
- Schopnost číst webové stránky, e-maily a dokumenty.
- Podporu pro skenování a čtení papírových dokumentů (OCR).
- Je to pro slabozraké, kteří potřebují zvětšení, ale hlas jim pomáhá s efektivitou a přesností. Mnozí slabozrací uživatelé by bez hlasového doprovodu nebyli schopni efektivně pracovat.
- SuperNova Magnifier & Screen Reader (plnohodnotný screen reader): Toto je "plnohodnotný screen reader" větev. Obsahuje všechny funkce Magnifier & Speech, ale navíc přidává:
- Kompletní odečítání obrazovky: Plná navigace po obrazovce pomocí klávesnice pro nevidomé uživatele.
- Podrobnější oznámení: Mnohem podrobnější oznamování interpunkce, formátování, pravopisných chyb a změn na obrazovce.
- Podpora Braillských řádků: Klíčová funkce pro nevidomé uživatele.
- Je to řešení pro uživatele s velmi těžkým zrakovým postižením nebo úplnou slepotou, kteří primárně používají klávesnici a hlasový/braillský výstup, ale ocení i možnost vizuálního zvětšení (např. pro spolupráci s vidícími kolegy).
Shrnutí pro kamaráda:
"ZoomText a SuperNova jsou trochu jiné než jen ty klasické screen readery jako JAWS nebo NVDA. Představ si je jako kombinaci lupy a mluvícího asistenta.
Princip je stejný jako u NVDA nebo JAWS: Programy se od Windows a jiných aplikací dozvídají, co je na obrazovce za text a jaké tam jsou ovládací prvky (tlačítka, políčka atd.). Nepřečtou to z 'obrázků', ale dostanou to přímo popsané.
Rozdíl je v tom, co s tím dělají a pro koho jsou určeny:
- Zvětšení je hlavní: Především zvětšují obrazovku, aby slabozrací uživatelé viděli lépe.
- Hlas je doplněk: Hlasová podpora je tu k tomu, aby ti potvrdila, co vidíš, přečetla ti dlouhé texty, abys nemusel scrollovat a namáhat oči, nebo ti řekla, co se děje, když se zrovna nedíváš na to správné místo na obrazovce.
- Supernova je navíc ve verzích:
- Jedna verze (Magnifier & Speech) je primárně lupa s přidaným hlasem pro slabozraké. Funguje jako takový 'čtenář na požádání' a automaticky oznamuje důležité věci.
- Druhá verze (Magnifier & Screen Reader) je pak plnohodnotný screen reader, který umí všechno jako JAWS nebo NVDA (tedy kompletně vést nevidomého uživatele po celém systému jen hlasem a klávesnicí), ale navíc má i ty funkce zvětšení pro ty, co ještě něco vidí.
Takže i když tyhle programy zvětšují, jejich hlasová podpora se neopírá o to, že by 'četly z obrázku', ale o to, že se chytře zeptají systému, co se na obrazovce nachází a pak ti to řeknou nahlas."
Proč skripty neudělají ze ZoomTextu plnohodnotný screen reader?
ZoomText je primárně navržen jako lupa s integrovanou hlasovou podporou, určená pro slabozraké uživatele, kteří částečně vidí a spoléhají se na vizuální zvětšení. Zatímco jeho hlasová podpora je velmi užitečná a umožňuje například čtení textu pod myší, odezvu při psaní nebo plynulé čtení dokumentů, jeho architektura a zaměření se zásadně liší od plnohodnotných screen readerů, jako jsou JAWS nebo NVDA.
Zde jsou hlavní důvody:
- Filozofie a model interakce:
- ZoomText: Jeho interakce je postavena na vizuálním modelu. Uživatel vidí zvětšenou část obrazovky a hlas mu poskytuje doplňující informace k tomu, co vidí. Prioritou je zvětšení a vizuální zpřístupnění.
- Plnohodnotný Screen Reader (JAWS/NVDA): Jejich interakce je postavena na objektovém modelu a nevizuální navigaci. Uživatel, který nevidí vůbec, se spoléhá pouze na hlasový nebo Braillský výstup a klávesnici. Screen reader v mysli uživatele vytváří jakousi "virtuální mapu" obrazovky, po které se navigují bez ohledu na to, co je vizuálně k vidění.
- Šíře a hloubka API integrace:
- Zatímco ZoomText využívá přístupnostní API (MSAA, UIA) k získávání textu a informací o prvcích, jeho primární interpretace těchto dat je zaměřena na doplnění vizuálního zážitku.
- Plnohodnotné screen readery se do API "zanořují" mnohem hlouběji a extrahují komplexnější informace o kontextu, vztazích mezi prvky, hierarchii a dynamických změnách na obrazovce. Jsou navrženy tak, aby dokázaly přesně popsat celou strukturu a interaktivitu uživatelského rozhraní nevidomému uživateli.
- Chybějící funkce pro nevidomé:
- Braillské řádky: ZoomText standardně nepodporuje Braillské řádky, což je klíčový nástroj pro nevidomé uživatele.
- Pokročilé navigační příkazy: Plnohodnotné screen readery nabízejí desítky, někdy i stovky, klávesových zkratek a navigačních příkazů pro rychlý pohyb po stránce (např. přeskok na další nadpis, tabulku, odkaz, formulářové pole), což ZoomText v takovém rozsahu nemá.
- Skripty pro komplexní aplikace: Zatímco ZoomText může mít základní skriptování, plnohodnotné screen readery mají sofistikované skriptovací jazyky a rozsáhlé komunity, které vytvářejí komplexní skripty pro specifické aplikace (např. Microsoft Office, Outlook, různé programovací IDE), aby kompenzovaly jejich nedostatečnou přístupnost. Tyto skripty umožňují plnohodnotnou interakci bez zraku.
- Zaměření vývoje:
- Vývojáři ZoomTextu se soustředí na zlepšování zvětšení, vizuálních filtrů, odezvy myši a základní hlasové podpory.
- Vývojáři JAWS a NVDA se soustředí na co nejlepší interpretaci uživatelského rozhraní pro nevidomé uživatele, rychlost odezvy, podporu Braille a kompatibilitu s co nejširším spektrem aplikací.
Co skripty v ZoomTextu mohou (a nemohou) dělat?
Skripty v ZoomTextu jsou užitečné pro automatizaci opakujících se úkolů, zjednodušení práce s určitými aplikacemi nebo přizpůsobení chování hlasové podpory v konkrétních situacích. Mohou například:
- Spouštět určité funkce ZoomTextu klávesovou zkratkou.
- Automaticky změnit nastavení zvětšení nebo barvy pro konkrétní aplikaci.
- Číst určité prvky, které by jinak nemusely být automaticky přečteny.
- Simulovat stisky kláves nebo myši.
Nemohou však:
- Přepsat základní model fungování ZoomTextu a jeho zaměření na vizuální interakci.
- Vybudovat virtuální buffer pro komplexní navigaci, jak to dělají plnohodnotné screen readery pro web nebo dokumenty.
- Přidat podporu pro Braillský řádek, pokud ji ZoomText v dané verzi nemá.
- Poskytnout kontextuální informace o prvcích tak podrobně a komplexně, jak to dělají plnohodnotné screen readery pro nevidomé uživatele.
Shrnutí: Skripty v ZoomTextu jsou výkonným nástrojem pro přizpůsobení a automatizaci v rámci jeho funkcionality lupy a hlasové podpory. Nikdy z něj ale neudělají plnohodnotný screen reader navržený pro nevidomé uživatele, protože tyto dva typy programů mají odlišnou základní filozofii a architektonické zaměření.