Web search engine
Web search engine alebo WWW search engine (do slovenčiny prekladané ako webový/internetový prieskumový stroj, webový/internetový vyhľadávač, webový/internetový vyhľadávací nástroj, webový/internetový vyhľadávací prostriedok, webový/internetový vyhľadávací stroj, webová/internetová vyhľadávacia služba, webový/internetový vyhľadávací program, v bežnom jazyku len webový/internetový vyhľadávač) alebo skrátane search engine (slovenské názvy pozri v článku search engine) je search engine, ktorý vyhľadáva na WWW. V širšom zmysle zahŕňa aj web metasearch engines.
Najznámejšíe web search engines sú Google, Yahoo, AltaVista a Bing.
Fungovanie search engines
Search engine je zložený z týchto základných častí:
- Robot (spider, crawler, web wanderer a pod.) - monitoruje webové sídla a ich obsah a sťahuje informácie z jednotlivých serverov do databázy stroja
- Vlastná databáza internetových zdrojov vytvorená prácou robota.
- Indexačný program - spracúva informácie získané robotmi
- Vyhľadávací program - program (algoritmus a súvisiace programy), ktorý na základe požiadavky vyhľadá relevantné stránky v databáze search enginu
- Grafické/používateľské rozhranie - zbiera dopyty od používateľa, odovzdáva ich vyhľadávaciemu stroju a zobrazuje výsledky hľadania používateľovi
V praxi funguje search engine tak, že používateľ zadá požiadavku a vyhľadávací program mu vypíše relevantné stránky, ktoré nájde z vlastnej databázy internetových zdrojov, vytvorenej na základe činnosti robota prehľadávajúceho hypertextovú štruktúru všetkých webových stránok.
Vlastnú databázu zdrojov tvorí spider overovaním frekvencie používania, aktualizácie a miery vhodnosti ktorú vykonáva, naberajú stránky v jeho databáze na kredibilite, teda vyhľadávací program vyberá už len z kvalitných, hodnotných zdrojov. Výber je navyše rýchly, keďže úplné skenovanie webu sa vykonáva sústavne a nielen keď používateľ zadá požiadavku.
Počas používania prieskumových strojov je veľmi dôležité správne voliť kľúčové slová, s ktorými pracuje tzn. na základe ktorých je v konečnom dôsledku aj spiderom prehľadaný celý WWW. Mali by byť úzko prepojené s témou, ktorú sa používateľ snaží vyhľadať a vhodné je používať i synonymá a booleovské operátory (&, +, -,...).
Spider prechádza po už známych stránkach a cez ne hyperlinkami na ďalšie a ďalšie stránky, v čom prakticky spočíva celý systém, akým je WWW vytvorený – ako obrovská sieť, spájajúca všetko so všetkým. Databáza search enginu je zase ako pomyselná kniha, z ktorej je používateľovi umožnené prečítať si určitý úsek, ktorý ho zaujíma – spider vytvorí zoznam stránok, ktoré pravidelne aktualizuje a obnovuje, databáza ich zapíše a vyhľadávací program ich cez požiadavky rozhrania používateľa zobrazí.