Se você estiver usando alguma distribuição com suporte ao apt-get (Debian, Kurumin, Knoppix, Lycoris e outras distirbuições baseadas no Debian), pode instalá-lo com o comando:
# apt-get install webalizer
No final da instalação o pacote executa um script que pergunta em qual pasta serão armazenadas as páginas com as estatísticas. Por padrão elas ficarão na pasta /var/www/webalizer, ou seja, disponíveis na pasta webalizer/ do seu servidor web. Se você não quiser que os visitantes tenham acesso a ela, basta mudar a pasta para um diretório fora do diretório com as páginas.
O webalizer gera as páginas com as estatísticas sozinho, a partir do log do Apache. Tudo o que você precisa fazer é chamá-lo com o comando:
# webalizer
Você pode automatizar o processo, fazendo com que o Cron execute o comando todos os dias ou uma vez por hora por exemplo ou então executar o comando manualmente sempre que quiser conferir as estatísticas.
O webalizer é rápido em gerar as estatísticas. Ele consegue analisar mais de 500 MB de arquivos de log do Apache (o que corresponderiam a meses de acessos de um site movimentado) em um minuto, rodando sobre um Pentium III de 1 GB. As estatísticas são geradas de forma incremental, ou seja, ele sabe até que ponto do arquivo de log ele analisou da última vez e processa só o que for novo. Ou seja, mesmo num servidor que hospeda 500 sites, a máquina não perderá mais que alguns minutos por dia para gerar as estatísticas. 🙂
Se o pacote não estiver disponível na sua distribuição, você pode baixar um arquivo binário que funciona em qualquer distribuição no: https://www.mrunix.net/webalizer/download.html (procure pelo Link “Linux ELF, Intel x86 – A static binary is available here”). Basta descompactar e executar o arquivo que está dentro. Não se esqueça de marcar a permissão de execução para ele.
O arquivo de configuração do webalizer é o /etc/webalizer.conf. Este é o lugar certo para procurar erros caso o webalizer não esteja funcionando. As opções mais importantes são:
LogFile /var/log/apache/access.log
– o diretório aonde vão os arquivos de log do Apache. Se por acaso você mudou o diretório na configuração do Apache, deve mudar também aqui).
OutputDir /var/www/webalizer
– a pasta onde vão as estatísticas, a mesma que o pacote do Debian pergunta durante a instalação).
#TopSites 30
#TopURLs 30
#TopReferrers 30
#TopAgents 15
#TopCountries 50
– aqui você pode aumentar o número de campos dentro das páginas de estatísticas, visualizando mais informação, basta alterar o número e descomentar a linha correspondente. Por exemplo, a linha “TopURLs” mostra o número de páginas mais acessadas, por padrão são mostradas apenas as 30 mais. Se você aumentar o número para 10000 por exemplo, vai poder ver uma longa lista com todas as páginas do seu site e o número de visitar que cada uma recebeu.
As alterações no arquivo são processadas da próxima vez que você gerar as estatísticas.