RECAPTCHA

reCAPTCHA je bezplatná služba, která pomáhá s digitalizací tištěných médií jako jsou knihy nebo časopisy. ReCAPTCHA systém byl vyvinut na Carnegie Mellon univerzitě v USA, která používá jako základ CAPTCHA systém. reCAPTCHA aktuálně pomáhá s digitalizací archívu New York Times. Dvacet let archivu New York Times již bylo zdigitalizováno a zbývajících 110 let má být zdigitalizováno pomocí reCAPTCHA do roku 2010.

reCAPTCHA
VývojářGoogle
První vydání27. května 2007
Webwww.google.com/recaptcha
Některá data mohou pocházet z datové položky.

Systém uvádí, že zobrazuje 30 milionů OCR obrázků každý den (údaj z prosince 2007) a systém reCAPTCHA je používán weby jako Twitter, Facebook nebo TicketMaster.

Vlastní činnost systému

Příklad reCAPTCHA, obsahující slova “following finding”.

Naskenovaný text je podroben analýze dvou OCR programů – v případě, že se programy neshodnou, je nejasné slovo převedeno do CAPTCHA. Toto slovo je poté zobrazeno pro kontrolu se slovem již známým. Systém je nastaven tak, že pokud člověk napíše kontrolní slovo v pořádku, nejasné slovo je poté také správné. Identifikace OCR programem je ohodnocena hodnotou 0,5 bodu a každá interpretace člověkem má hodnotu jednoho bodu. Jakmile hodnota identifikace slova dosáhne 2,5 bodu, je poté slovo považované za správně identifikované.

Externí odkazy

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.