você está aqui: Home  → Arquivo de Mensagens

Novo Site de Busca Nacional - TodoBR

Colaboração: Edleno Silva de Moura

Data de Publicação: 25 de Novembro de 1999

O Departamento de Ciencia da Computacao da Universidade Federal de Minas Gerais esta lancando uma maquina de busca para a web brasileira, o TodoBR (http://www.todobr.com.br).

Aqui vao algumas das caracteristicas e vantagens da Maquina de Busca TodoBR:

Ao se concentrar na Web brasileira, TodoBR focaliza o conjunto de documentos a pesquisar, retornando respostas precisas e de maior relevancia para o usuario.

TodoBR coleta e armazena permanentemente toda a Web brasileira, cerca de 5 milhoes de paginas, o que garante cobertura completa de todos os sites ".BR".

TodoBR coleta e disponibiliza para pesquisa documentos em formatos variados tais como texto, HTML, Postscript (PS), Doc (Word) e PDF.

O sistema de coleta de paginas do TodoBR representa o estado da arte e, por isto, e' capaz de revisitar todos os documentos da Web brasileira em poucos dias.

A maquina de busca do TodoBR tem outra caracteristica exclusiva, que permite ao usuario buscar informacao focalizando qualquer estado ou regiao do Brasil, aumentando dramaticamente a qualidade das respostas. Pode-se, por exemplo, localizar pessoas mais rapidamente e evitar encontrar muitos homonimos informando o estado onde moram.

A maquina de busca do TodoBR permite a formulacao de consultas utilizando acentos, melhorando a qualidade das respostas. Pode-se, por exemplo, buscar paginas sobre o passaro sabia' ou sobre o estado do Para'. Esta e' outra caracteristica exclusiva da tecnologia desenvolvida.

TodoBR permite que o usuario procure por frases exatas como "regiao metropolitana de Belo Horizonte". A busca por frases exatas pode ser combinada com a busca por estados (ou regioes) e a busca por acentos, levando diretamente à informacao desejada.

TodoBR utiliza algoritmos originais de compressao no estado da arte, acelerando extraordinariamente o processamento de consultas. TodoBR utiliza algoritmos originais que tiram proveito de hardware distribuido e paralelo, proporcionando ganhos diferenciados em desempenho. Em sua versao beta, o TodoBR utiliza 4 maquinas conectadas por uma rede a 1 Gbps (gigabits por segundo), com 2.8 Gbytes em memoria e 280 Gbytes de capacidade de armazenamento em disco.



 

 

Veja a relação completa dos artigos de Edleno Silva de Moura

Opinião dos Leitores

Seja o primeiro a comentar este artigo
*Nome:
Email:
Me notifique sobre novos comentários nessa página
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script