do strony glownej wydziału  strona główna wydziału   English version | Adresy i telefony na wydziale
Działalność Naukowo Badawcza
O czasopiśmie

Rada Naukowa

Recenzenci

Redakcja

Aktualny numer

Numery archiwalne

Wymogi dla autorów

Procedura recenzowania

Prenumerata

Kontakt z redakcją

 
Prace i Materiały Wydziału Zarządzania

Kazimierz Worwa

Jerzy Stanik

 

On Some Challenges in Web Information Retrieval

 

 

 

Summary

         In this article the main challenges in Web information retrieval are discussed. There are three main problems that are overviewed: the meaning of importance, how a crawler operates, and how a crawler guesses good pages to visit. The large size and the dynamic nature of the Web highlight the need for continuous support and updating of Web based information retrieval systems. Crawlers facilitate the process by following the hyperlinks in Web pages to automatically download a partial snapshot of the Web. While some systems rely on crawlers that exhaustively crawl the Web, others incorporate “focus” within their crawlers to harvest application or topic specific collections. We overview the basic issues related with developing a crawling infrastructure.


wstecz


  do strony glownej wydziału  strona główna UG Adresy i telefony na UG   Biblioteka główna UG   Pytania  
kontakt z webmasterem   kontakt z webmasterem
 
do strony głównej UG do strony głównej wydziału do strony głównej wydziału