Contributo para a discussão sobre estatísticas
publicado 23 Agosto 2005 em Sem categoria.Críticas aos sistemas de medição de visitas e leituras dos blogues, há para todos os gostos. Como contributo para a quente discussão que por aí vai — e que surge recorrente — aqui ficam três links para outros tantos sistemas de medição de um mesmo blogue, o meu.
Este contributo nada adianta sobre outros aspectos do blogging também alvo da curiosidade pública, como a importância de blogues (e de conjuntos de blogues), o(s) seu(s) papel(éis) na sociedade, e ptá ptá ptá. É apenas sobre formas de descobrir, medir e avaliar quem e o quê visita e lê os blogues.
Era bom que houvesse maior cuidado por parte dos bloggers a quem apeteça disparar sobre as “audiências”, seja na eleição do objecto de crítica, seja no fornecimento de argumentos (não basta afirmar que “o pqstats é uma merda”, é necessário fundamentar porquê), seja na apresentação de alternativas.
Como se pode observar (sugiro que abram três janelas, uma com cada link, basta carregar que cada um aparecerá em janela nova), os três dão leituras diferentes, como é de esperar. Como se pode avaliar comparando qualquer dia entre 10 e 22 de Agosto dos mesmos logs processados pelo webalizer, aqui, e pelo Awstats aqui. Ora, os mesmos dias podem ser vistos, em gráfico, no mapa do Sitemeter aqui.
No dia 19 terei tido (+-) 220 visitas segundo o Sitemeter, 604 segundo o Awstats ou 1038 pelo Webalizer, o mais “generoso” destes três?
É bom que o leitor (e o autor) médio (ou mesmo alto…) percebam que estes sistemas instantâneos e sem ponderação (ou com ponderação mecânica somente) não são de confiança quanto ao que gostávamos que eles medissem (as audiências dos nossos blogues). Desde o primeiro minuto porque não está definido — e muito menos consensualmente aceite pela comunidade — o que é a audiência de um blogue.
Recordo que noutros meios, como os jornais, a rádio e a televisão, há também dificuldades em estabelecer o que é um leitor, um ouvinte e um espectador. Mas pelo menos há plataformas consensuais estabelecidas e metodologias que são aceites por uma maioria alargada (nunca por todos, evidentemente).
Antes mesmo de irmos às metodologias de análise dos dados, há que perceber, para poder aferir, as diferentes formas de receber os dados. (Na verdade podíamos ir mais atrás, aos dados que se recolhem, mas é melhor deixar isso!).
Um sistema como o Sitemeter tem uma virtude: pode “medir” os mesmos dados de diversas proveniências e tratá-los da mesma forma, o que um sistema como o Webalizer não pode, pois só mede os alojados numa mesma máquina (melhor usarmos servidor, pois várias máquinas podem constituir um “único” servidor).
E tem um defeito: a informação recolhida não é recolhida em condições de igualdade. Os dados passam por seis a 18 ou mais hops intermédios, entre quem pede (ou “toca” a página) e quem recebe (a informação necessária a avaliar se é leitor ou não, se é o mesmo leitor de antes, etc). Devemos ainda levar em conta que o ambiente de rede é uma autêntica selva, e estou a ser benévolo. Entre proxies, caches, políticas diversas de aluguer dos endereços IP de ISP para ISP (exemplo no mesmo grupo, o Sapo aluga-os por poucas horas, a Netcabo aluga-os por dias, às vezes semanas) e a própria diversidade dos protocolos TCP/IP, bem como dos meios físicos (uma página do Blogspot, nos EUA, pode vir por satélite e as imagens nela contidas chegam pelo cabo submarino, e isto é mais que uma mera hipótese académico-teórica).
Estes sistemas terão de levar em conta muitos factores externos, nem todos eles conhecidos ou facilmente programáveis.
Sistemas como o Webalizer ou o Awstats, que está desde ontem em testes no meu blogue antes de o poder passar à plataforma weblog.com.pt, assentam nos ficheiros de registo, ou logs do próprio servidor que serviu as páginas do blogue. A recolha é assegurada em condições infinitamente melhores, no ambiente tranquilo e protegido dos discos rígidos.
Não há a mínima dúvida sobre a capacidade de estes sistemas residentes serem melhores na recolha. Uma vez chegados a consenso sobre o que é uma visita, uma página, um contacto, um leitor, e qual a metodologia indicada para processar os dados (quanto tempo dura uma visita, que tipos de ficheiros são “vistos” e quais servem apenas finalidades de design, por exemplo), o sistema ideal será o que processe logs locais e não pacotes enviados de um lado para o outro do mundo numa rede aberta.
Mas estes sistemas têm o grande defeito de só poderem medir (isto é: comparar) com alguma eficácia os resultados de blogues alojados no mesmo servidor. O mesmo sistema instalado noutra máquina pode produzir resultados díspares, dependendo da forma como foi instalado (levantando o problema de uma entidade aferidora). Assim, não servem (a não ser como indicadores, para observadores experientes ou que avaliem ponderadamente uma quantidade de dados significativa) para comparar as “audiências” na “blogosfera” (e, aviso à navegação, não foi nada disso que fiz no Expresso, nem mesmo ao escrever, cito perigosamente porque sem contexto, «Hoje, o blogue mais lido do espaço português será provavelmente o Hollywood, extrapolados os dados disponíveis sobre o acesso de leitores a esse e aos outros blogues de que são conhecidos registos públicos».)
No dia 19 terei tido (+-) 220 visitas segundo o Sitemeter, 604 segundo o Awstats ou 1038 pelo Webalizer, o mais “generoso” destes três?
Pessoalmente a questão não me interessa: os meus objectivos com este blogue passam por ter um bloco de apontamentos online com uma parte partilhada com família, amigos e algum transeunte, não tenho uma estratégia (talvez noutro blogue, um dia). Profissionalmente, sim: leio e informo-me o suficiente (espero) para poder avaliar os resultados e evitar as armadilhas óbvias. É como hobby que mais invisto na aquisição de conhecimento e ainda nos testes efectivos, instalando sistemas para aprofundar conhecimentos sobre eles, ao mesmo tempo que me divirto a aprender programação.
O tema não se esgota aqui, pelo contrário. Na melhor das hipóteses, este texto servirá de ponto de partida, nunca de chegada. Devem os bots dos motores de pesquisa ser considerados leitores? Não — é a resposta óbvia e imediata. Mas cada link para um post rende leitores… E há as caches dos motores. E um feedreader, como deve ser tratado? É um mecanismo - mas pode originar a leitura do texto por olhos humanos e levar à consulta do blogue. Há mais duas dúzias de questões.
Uma nota final: o Awstats, que está em observação, assim à primeira vista é mais bem apresentadinho, arrumado e tal; também me parece de código mais moderno, na forma como “lê” os dados e nos parâmetros que permite ao instalador. Mas o melhor, de caras, é que tem muito mais informação útil ao blogger, como as referências e as palavras de pesquisa. Pela parte do weblog, tem outra vantagem: nunca consegui instalar no webstats o subsistema para identificar as redes de origem com vista à diferenciação das visitas por países, que no Awstats coloquei desde logo.
Em princípio o Awstats será disponibilizado no weblog.com.pt apenas para os blogues de subscrição e a pedido.
[ Update: Statistics are meaningless, de Rui Carmo, vai mais longe. Curto excerto para vos obrigar a ir ler: There seems to be a decrease in the signal-to-noise ratio regarding the ego trips in the Portuguese “blogosphere” (i.e., the noise is increasing), and almost everyone seems to be missing the point that whatever the stats counters you use, technically they’re all meaningless, because all of them are fallible and (this is the bit that politicians really don’t get), none of them have any real relationship to actual eyeballs (there’s caching, browser variants, NAT, proxies, you name it)»


Últimos comentários