Jdi na obsah Jdi na menu
 


Abby FineReader 11 a několik nejnovějších zkušeností s digitalizací obecně

4. 12. 2011

Nedávno vyšla nová verze FineReaderu 11. Mám s ní první zkušenosti:

Prvotní zkušenost:

Lépe zpracovává poznámky pod čarou - umisťuje je tam, kde mají být ... (samozřejmě, ani v této verzi to není úplně na 100% ...), což samozřejmě oceňuji, protože zpracovávám studijní literaturu pro nevidomé /otázka je, zda toto umisťování poznámek pod čarou je pro všechny ideální - lepší někdy do samostatného souboru nebo přímo do textu);

Sekundární zkušenost a z toho odvozena současná praxe:

Dalšími zkušenostmi jsem došel k tomu, že velmi záleží na grafické podobě knihy a že tak, jak jsem to viděl lépe na začátku, při prvních pokusech s verzí 11, tak, že to ideální zdaleka není - přešli jsme k metodě umisťovat poznámky pod čarou do samostatných souborů - buď txt nebo doc (rtf). Odkazy na poznámky označuji v textu (poznámka @ 5) a v samostatném souboru pak dávám každou poznámku pod čarou na samosatný řádek s označením

@ 5 text poznámky, případně další řádek odražen a zarovnán až pod text (v případě doc, rtf).

Text (poznámka @5) je důležitý proto, že když čtete plynule screen readerem, nečte se @.

Formát ukládání:

Defaultním formátem při ukládání do Wordu se stal formát docx - otevře se ve Wordu2007 a vyšším ... (raději ale ukládám do doc a nebo pro studenty užívající WinMenu do rtf). Pokud je kniha objemější nebo v každé kapitole jsou poznámky pod čarou číslovány od 1, ..., volím rozdělení kapitol do více souborů - cílový balíček zip je uložen ve složce, která je pojmenována podle minimuilně názvu knihy a nebo i autora (názvy kapitol je nutné někdy zkracovat - WinXP hlásí, že nemůže takto dlouhý název vůbec uložit - počítá se i s cestou, tuším asi 125 znaků nejdelší? nevím, ale dá se to dost často přetáhnout).

Zobrazení ve FineReaderu

Přibylo flexibilní zobrazení - vhodné pro ukládání do cílového html formátu - soubor html + podsložka s dalšími soubory, např. věrnější zobrazení seznamů s odrážkami a čísly, přesto je nutné upravovat; Pokud chcete přepnout na prostý text a používáte ZoomText, stačí umístit kurzor na rozbalovací seznam a dát šipku dolů - pokud byste zukoušeli rozbalit seznam a vybírat myší, je to dost ekvilibristika, nedaří se vybrat správnou položku ...

Většinou při opravování využívám zobrazení Prostý text či Formátovaný, je dobré zvolit písmo, v kterém lze vizuálně rozlišit mezi l a 1, tedy ne Arial ale Times New Roman. Po uložení do Formátovaného textu se změní i zobrazení na Formátovaný text. Do Formátovaného textu ukládám hlavně pro slabozraké studenty - je zachováno tučné písmo, kurzíva - může a nemusí vyhovovat. Ve Wordu je potřeba zvětšit písmo /zachovává původní velikost písma, která z knih bývá tak cca 8 dpi), tedy Ctrl+A - změna velikosti písma na cca 12, ale je nutné změnit i řádkování na jednoduché, protože řádkování se přenáší jako pevně nastavené - byly by slity řádky, namačkány na sebe.

Nejlepší výsledky dle mého jsou při uložení do PDF nebo PDF/A (archivníhoú, alespoň co se týče rozložení grafiky - je nutné v Možnostech nastavit Text nad obrázek - defaultně je nastaveno pod obrázkem - pak to screen readery nečtou! Bere celou stránku jako obrázek, i když nejsou obrázky nazonovány a do tohoto obrazu stránky umisťuje rozpoznaný text z textových zon, vhodné hlavně pro slabozraké, sám si takto někdy skenuji časopisy.

Problém je ovšem se znaky - symboly z tabulek Unicode - neumí Windings, například napodobení symbolů v odrážkových seznamech - problém!

Záhlaví a zápatí

Dobře nastaví záhlaví a zápatí. Po dalších zkušenostech jsem skeptičtější - ano, ale naopak přibere někdy do záhlaví i poslední řádku textu, poznámky pod čarou, není úplně rozhodující, zda je text či číslo stránky, které mají být v záhlaví, v samostatných zonách (oproti nižším verzím FineReaderu).

Je možné si pak vybrat při ukládání, zda uložit bez záhlaví/zápatí nebo s ním. (většinou už neukopádám s volbou zápatí, protože je stejně screen readery nedostupné jejich snadné přečtení). Volby by se musela uplatnit i s nastavením ponechání konce stran, aby se čísla stránek nerozlezla se skutečností.

Pro texty pro nevidomé studenty využívám to, že čísla stránek přepisuji do textu a nezaškrtávám uchovat záhlaví - čísla stránek by v e-textu být nemusela (viz Metodika zpracování textů podle Tereza MUNI.cz) ale spíše hlavně z důvodů potřeby citace z textu je uvádím už vždy v horní části stránky, ač jsou třeba v knize v zápatí, v složených závorkách {25} - { ASCII alt+numerická 123, } ASCII alt+numerická 125 - dobré si zapamatovat.

Ve FineReaderu se časo setkáváme s tím, že některé znaky jako V v i I o O zalomí na nový řádek s tím, že je chápe jako římská čísla - při ukládání do formátovaného textu (možná i do prostého) je vloží jako pole a za nimi vloží tabulátor. Někdy O převede dokonce na nulu, I na jedničku ... Snažím se toto opravit už ve FineReaderu (je dobré přitom mít zapnuté zobrazování skrytých znaků (symbol pí - obrácené P bříškem doleva - v panelech nástrojů), pokusil jsem se i o vytovření makra ve Wordu k odstranění těchto "falešných tabulátorů" a zařazení tohoto makra, které postupně nahrazuje například tvrdý konec řádku - i - tabulátor následujícími znaky mezera - i - mezera, v dalším průběhu pak o O nebo 0 a v nebo V, někdy chápe io jako 10, může jít o spojení ve větě i o {kom čem}. Použití makra předchází Převod číslovaných a odrážkových seznamů na znaky - viz hned dále.

Následné úpravy ve Wordu (už o nich byla zčásti zmíňka výše)

Po vyexportování do Wordu používám makra Knížka od Santiaga - Základní úprava textu a Převod číslovaných a odrážkových seznamů na znaky - převede pole s těmito znaky na textové znaky a pak další úpravy: Také využívám volbu vymazání tabulátorů.

Vyberu celý text do bloku, v rozbalovacím seznamu Styly na panelu nástrojů Formát vyberu Vamazt formátování.

Ponechám vybraný celý dokument a změním font Courier na Arial. (většinou exportuji text z AFR do Wordu 2003 jako Nešifrovaný text a tam se mě objevuje Courier - neproporcionální písmo).

Zalomení stránek (dříve jsem využíval možnosxti AFR Zachovat konce stránek, ale ten dává opačně znak konce stránky a pak teprve Enter - dá se to změnit Nahrazením - využívám makro, které jsem si vytvořil. Je možné využít i ruční zalomení stránek. V případě zalomení stránek je spíše o orientační věc pro digitalizátora než nějakou věc, které by využil nevidomý čtenář/student), ale slab ozraký si toho určitě všimne a může to také pomoci v orientaci.

Přepnu zë Zobrazení při tisku na Koncept (Normální).

Dodržuji, aby zalomení stránky nepřišlo doprostřed věty, aby oznámení čísla stránky nebylo vysloveno uprostřerd věty, takže buď část věty přesunu na další stranu nebo obráceně.

  • ostyluji nadpisy a z nich pak tvořím obsah - případně nechám naformátované tak, jak jsou a jejich úroveň v struktuře knihy - kapitoly nastavím v panelu nástrojů Osnova (ne v Zobrazení - Osnova;
  • někdy, pokud je na začátku kapitoly seznam témat, je možné využít k vytvoření osahu z tohoto seznamu i záložek a hypertextových odkazů na tyto záložky

Skener

Pro oskenování knih, časopisů se mi velmi osvědčil skener Plustek 3600, který umožňuje položit jednu stránku knihy do skeneru a druhá stránka visí dolů z boku skeneru - důležitgé je, že skenovaná stránka knihy celá leží na snímací desce, nejde pod ní světlo, že skener skeuje až do okraje plochy, je velmi rychlý ...

Ke skenování využívám výběr části plochy - POZOR! nespoléhat se na to, že v průběhu skenování knihy se velikost výběru nemění, právě naopak - mění se: největší jsou desky knihy, pak samozřrejmě jde o to, jak jsou jednotlivé stránky svázány, slepeny k jiné stránce. Skener je určitě šetrnější ke knihám, ale i tak se mi podařilo brožované knize rozlepit vazbu.

Před skenováním je dobré knihu prohlédnout, zda není podškrtaná - podškrtání tužkou pokud možno opatrně /aby nedošlo k natržení stránky!) vymazat a očistit od drobků knihy - nesmí se dostat na sklo skeneru a když se dostane, očistěte jemným ubrouskem,  hadříkem ... aby se drobek nepřipletl do obrazu, pak OCR dělá v tomto místě chyby ...

Nový FineReader umí ukládat i do formátu Kindle a jiných formátů elektronických knih epub. Pokud někdo pociťuje nedostatek e-knih a chce si sám nějakou pro svou čtečku, tablet ... vyrobit, FineReader vřele doporučuji.