YaCy: um sistema de buscas na web descentralizado, baseado em P2P

Quando se fala em buscas na internet logo vem à mente o Google, além do Bing, Yahoo e alguns outros menores ou específicos. Mas com todos eles há um problema: o controle é centralizado. Dependem de uma empresa ou grupo, normalmente grande, que tem poderes absolutos sobre seu conteúdo. Se algo não for do agrado do grupo, pode simplesmente sumir do índice. Dependendo do local, o governo pode proibir certos termos ou aplicar uma censura rígida, como na China. Isso tira a liberdade de poder encontrar informações livres na internet: informações públicas, disponíveis em sites que qualquer um pode acessar abertamente.

Um grande projeto aberto pretende mudar esse cenário, apresentando uma solução de buscas descentralizadas. Em desenvolvimento há mais de 5 anos, só agora saiu a versão 1.0 do YaCy: um buscador P2P. Isso mesmo: cada computador conectado pode ser uma fonte de dados, colaborando com o sistema.

Dessa forma a plataforma atinge diversos objetivos, essencialmente a liberdade. Os usuários não são rastreados nem forçados a verem anúncios relacionados ao que procuram. Não é possível censurar o índice, evitando que certos tipos de páginas sejam removidas a pedidos de empresas ou governos. E tudo isso numa aplicação P2P, livre (GPL).

Confira um pouco no vídeo abaixo:

FSCONS: YaCy Demo from Michael Christen on Vimeo.

O programa roda em Windows, Mac e Linux (requer o OpenJDK 6). Se interessar, veja mais informações e baixe em http://yacy.net/en/. A instalação é bem simples. Quem for colaborar com o índice precisa ter muito espaço em disco, mas para começar não é necessário se preocupar com isso.

Aparentemente tem pouca coisa em português indexada. No painel de administração é possível incluir URLs para o crawler, que depois poderão ser replicadas nos outros pontos, passando a fazer parte do índice. Para buscas em inglês parece algo razoavelmente funcional. Naturalmente, quanto mais usuários, melhor será a qualidade do serviço e o tempo de resposta na entrega dos resultados. Não dá para comparar a qualidade dos resultados com os do Google por enquanto, mas dados os objetivos e a filosofia do sistema, vale a pena experimentar.

Segundo mensagem no site do projeto o YaCy já tem cerca de 1,4 bilhão de documentos no índice, e cerca de 130 mil pesquisas são feitas na rede diariamente.

Além do próprio sistema no localhost (ele roda como um servidor web) é possível aproveitar a tecnologia de outras formas, como por exemplo a Sciencenet – uma página de busca do Instituto de Tecnologia Karlsruhe focada em conteúdo científico. O projeto tem uma API, pode fornecer os resultados via RSS e também pode ser otimizado para uso local ou numa intranet.

Se bem utilizado, o YaCy parece promissor – pelo menos entre os entusiastas de software livre, ou para aqueles que precisam de resultados censurados nos grandes sites comerciais.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X