Historie úprav

Avatar uživatele

Odpověděl/a – 7.srpen 13:12

Členové ebook komunity u nás používají pro proces OCR téměř vždy ABBYY FineReader (někteří možná nejnovější verze OmniPage). Ostatní OCR mají většinou nízkou úspěšnost rozpoznání: je třeba si uvědomit, že pokud má OCR úspěšnost 99,9%, není to dost. Každé sté písmeno bude špatně, tzn: pokud bude mít knížka 700000 znaků („baj voko“ průměrná knížka), bude se v ní nacházet 700 chyb!
OCR ale neni jediná fáze, další je formátování: Na to opět většina lidí používá jednotný nástroj – Santiagova makra. Jedná se o makra do Wordu, která ulehčí mnoho úkonů.
A nakonec závěrečná fáze: korektura. Aby výsledek za něco stál, je třeba celou knihu přečíst a opravit všechny chyby.

Podrobnější postup se dočteš na http://www.ebo­okforum.sk/ .

Avatar uživatele

Odpověděl/a – 7.srpen 13:16

Členové ebook komunity u nás používají pro proces OCR téměř vždy ABBYY FineReader (někteří možná nejnovější verze OmniPage). Ostatní OCR mají většinou nízkou úspěšnost rozpoznání: je třeba si uvědomit, že pokud má OCR úspěšnost 99,9%, není to dost. Každé sté písmeno bude špatně, tzn: pokud bude mít knížka 700000 znaků („baj voko“ průměrná knížka), bude se v ní nacházet 700 chyb!
OCR ale neni jediná fáze, další je formátování: Na to opět většina lidí používá jednotný nástroj – Santiagova makra. Jedná se o makra do Wordu, která ulehčí mnoho úkonů.
A nakonec závěrečná fáze: korektura. Aby výsledek za něco stál, je třeba celou knihu přečíst a opravit všechny chyby.

Podrobnější postup se dočteš na http://www.ebo­okforum.sk/ .
Doplňuji:
Chybička se vloudila: Při úspěšnosti 99,9% bude špatně jeden znak z tisíce (v průměru).