Optické rozpoznávání znaků
Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.
Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.
OCR software
Jméno | Licence | Operační systém | Poznámky |
---|---|---|---|
ABBYY FineReader OCR | Komerční | Microsoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2).. | |
Adobe Acrobat | Komerční | Windows, Mac OS X | |
PDF-XChange Viewer | Freeware | Windows | |
PDF-XChange Viewer Pro | Komerční | Windows | |
GOCR | GPL | (open source) | |
Microsoft Office Document Imaging | Komerční | Windows, Mac OS X | |
NovoDynamics VERUS | Komerční? | ? | |
Ocrad | GPL | Unix-like, OS/2 | |
OCRopus | Apache | Linux | |
OmniPage | Komerční (Nuance EULA) | Windows | Produkt Nuance Communications |
Readiris | Komerční | Windows, Mac OS | Produkt I.R.I.S. |
ReadSoft | Komerční | ? | |
SimpleOCR | Freeware a komerční | Windows | |
SmartScore | Komerční | Windows, Mac | |
Tesseract | Apache | Windows, Mac OS X, Linux, OS/2 | Vyvíjeno Googlem |
Nicomsoft OCR | Komerční | Windows, Linux | |
Externí odkazy
- Obrázky, zvuky či videa k tématu OCR na Wikimedia Commons
- Slovníkové heslo OCR ve Wikislovníku
- Optické rozpoznávání znaků v České terminologické databázi knihovnictví a informační vědy (TDKIV)