Optické rozpoznávání znaků

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

OCR software

Jméno Licence Operační systém Poznámky
ABBYY FineReader OCRKomerčníMicrosoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe AcrobatKomerčníWindows, Mac OS X
PDF-XChange ViewerFreewareWindows
PDF-XChange Viewer ProKomerčníWindows
GOCRGPL(open source)
Microsoft Office Document ImagingKomerčníWindows, Mac OS X
NovoDynamics VERUSKomerční? ?
OcradGPLUnix-like, OS/2
OCRopusApacheLinux
OmniPageKomerční (Nuance EULA)WindowsProdukt Nuance Communications
ReadirisKomerčníWindows, Mac OSProdukt I.R.I.S.
ReadSoftKomerční ?
SimpleOCRFreeware a komerčníWindows
SmartScoreKomerčníWindows, Mac
TesseractApacheWindows, Mac OS X, Linux, OS/2Vyvíjeno Googlem
Nicomsoft OCRKomerčníWindows, Linux

Externí odkazy

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.