Robô de Pesquisa na Web
O ConteXpress Search Web é um motor de busca que se lança regularmente na Internet, na tentativa de obter dados sobre o maior número possível de documentos para integrá-los, posteriormente, a sua base de dados.
Os documentos encontrados pelos robôs sao encaminhados aos indexadores que extraem a informaçao das páginas HTML e as armazenam em uma base de dados. A forma como os indexadores extraem a informaçao poderá ser configurada de acordo com parâmetros a definir.
O robô contem um motor que localiza e busca documentos na Web; um indexador, que extrai a informaçao dos documentos e constrói a base de dados; um motor de busca textual; e a interface, que é utilizada pelos usuários.
|