Odpověděl/a – 7.srpen 13:12
Členové ebook komunity u nás používají pro proces OCR téměř vždy
ABBYY FineReader (někteří možná nejnovější verze OmniPage). Ostatní OCR
mají většinou nízkou úspěšnost rozpoznání: je třeba si uvědomit, že
pokud má OCR úspěšnost 99,9%, není to dost. Každé sté písmeno bude
špatně, tzn: pokud bude mít knížka 700000 znaků („baj voko“
průměrná knížka), bude se v ní nacházet 700 chyb!
OCR ale neni jediná fáze, další je formátování: Na to opět většina
lidí používá jednotný nástroj – Santiagova makra. Jedná se o makra do
Wordu, která ulehčí mnoho úkonů.
A nakonec závěrečná fáze: korektura. Aby výsledek za něco stál, je
třeba celou knihu přečíst a opravit všechny chyby.
Podrobnější postup se dočteš na http://www.ebookforum.sk/ .
Odpověděl/a – 7.srpen 13:16
Členové ebook komunity u nás používají pro proces OCR téměř vždy
ABBYY FineReader (někteří možná nejnovější verze OmniPage). Ostatní OCR
mají většinou nízkou úspěšnost rozpoznání: je třeba si uvědomit, že
pokud má OCR úspěšnost 99,9%, není to dost. Každé sté písmeno bude
špatně, tzn: pokud bude mít knížka 700000 znaků („baj voko“
průměrná knížka), bude se v ní nacházet 700 chyb!
OCR ale neni jediná fáze, další je formátování: Na to opět většina
lidí používá jednotný nástroj – Santiagova makra. Jedná se o makra do
Wordu, která ulehčí mnoho úkonů.
A nakonec závěrečná fáze: korektura. Aby výsledek za něco stál, je
třeba celou knihu přečíst a opravit všechny chyby.
Podrobnější postup se dočteš na http://www.ebookforum.sk/
.
Doplňuji:
Chybička se vloudila: Při úspěšnosti 99,9% bude špatně jeden znak
z tisíce (v průměru).