Pesquisar este blog

sábado, 2 de julho de 2011

Transformando Casualidades em Causalidades

Todo feriado prolongado é sucedido pela divulgação das estatísticas sobre acidentes nas estradas, acompanhadas de comentários de especialistas que explicam as causas de eventuais variações nas quantidades de acidentes e/ou mortos em relação aos valores do histórico. Em geral, comparam-se os dados obtidos no feriado em questão com os valores observados no mesmo feriado em anos passados, ou então com outros feriados do ano corrente. Mas será que toda e qualquer variação nos números é conseqüência direta de uma ou mais causas?

O que mais me chamou a atenção neste último feriado de Corpus Christi foi uma análise das estatísticas para o estado de São Paulo, onde se demonstrou certa preocupação com o aumento no número de acidentes de 1256 para 1302, em relação ao mesmo feriado no ano de 2010. Houve também uma redução no número de mortes de 53 para 35, e a justificativa dada por um representante da Polícia Rodoviária Estadual (PRF) foi de que “a chuva e a neblina fizeram os motoristas aumentarem a atenção nas estradas, o que contribuiu para a queda das mortes”.

Por discordar dessa justificativa, resolvi pesquisar reportagens semelhantes publicadas após outros feriados. Em uma delas, referente às estatísticas do período de carnaval de 2011 no estado de São Paulo, relatou-se um aumento de 47,9% no número de mortos nas estradas federais em relação ao mesmo período no ano anterior. Dentre as causas divulgadas pela mesma PRF na época para explicar esse acréscimo, constam “a imprudência, a chuva e a quantidade crescente de veículos nas estradas brasileiras”. É evidente que um mesmo fator, a chuva, não pode ao mesmo tempo ter contribuído positivamente para diminuir a quantidade de mortos no feriado de Corpus Christi e ser um dos fatores negativos que fizeram aumentar o número de mortos no Carnaval.

O grande problema na análise destas estatísticas é a necessidade que os órgãos públicos sentem, talvez pressionados pela opinião pública e a imprensa, de encontrar de forma rápida e precisa uma justificativa para toda e qualquer variação dos resultados em relação aos valores verificados em uma estatística anterior. No entanto, certas variações podem não ter absolutamente nenhuma causa determinante, tendo sido frutos apenas da aleatoriedade. Ainda assim, busca-se um “bode expiatório” que possa fornecer a explicação desejada, e corre-se o risco de transformar meras casualidades em causalidades.

O que muitos ignoram é que o aspecto aleatório (a “sorte” ou o “azar”, no jargão comum) está presente não apenas nos jogos de azar, como o bingo e a Loto, mas em praticamente todas as atividades humanas. A diferença fundamental é que, enquanto nos primeiros exemplos a aleatoriedade é o único fator determinante, no segundo caso ela é apenas um dos fatores que influenciam no resultado das estatísticas.

Imagine uma situação em que, no feriado de Corpus Christi, todas as estradas e veículos estejam exatamente nas mesmas condições de conservação em relação ao mesmo feriado no ano anterior. Suponha também que as condições de tempo e o número de veículos e pessoas viajando nesses dois feriados tenham sido idênticos. Ainda que estejam sob as mesmas condições, é muito pouco provável que as estatísticas sejam iguais em ambos os casos1. Portanto, um ou outro ano apresentará um número maior de mortes e/ou acidentes, não tendo havido nenhuma causa que justificasse, de forma determinante, esta variação.

Para ilustrar esse conceito, considero o exemplo de uma pessoa que transita sozinha de madrugada em numa estrada de mão dupla, em um estado de profunda sonolência. De forma extremamente imprudente, esse indivíduo insiste em prosseguir viagem, adormecendo no meio de uma curva e tendo acordado apenas com um barulho de uma colisão. Não é possível prever, a priori, qual será a contribuição dessa situação em particular para as estatísticas de acidentes nas estradas.

O veículo pode colidir com o guarda corpo do outro lado da estrada, e o motorista pode morrer sozinho ou até mesmo sobreviver. Uma outra possibilidade seria uma colisão com um veículo ocupado por quatro pessoas e, dependendo da forma como o acidente ocorrer, pode haver de 1 a 5 mortos. Finalmente, pode ocorrer uma situação mais catastrófica de colisão com um ônibus lotado, que originaria um acidente com dezenas de mortos. Embora as probabilidades para cada um desses três desfechos sejam influenciadas pelo volume de tráfego na estrada e pelo percentual de ônibus entre os veículos que a transitam, não se pode prever qual deles irá ocorrer.

Expandindo essa situação particular para o todo, entende-se o porquê de as estatísticas estarem sujeitas, em parte, a aspectos aleatórios que não podem ser previstos a priori ou explicados a posteriori. Não acredito, por exemplo, que as estradas de São Paulo tenham ficado definitivamente mais perigosas este ano porque houve 46 acidentes a mais em relação ao ano passado, em relação a um valor anterior de 1256 acidentes. Quanto à estatística do número de mortes, apesar do percentual de redução ter sido grande (33,9%), é importante observar que a base de cálculo de comparação, que é o número de mortos no ano anterior (53) é pequena. Se houvesse um único acidente a mais com 10 mortos em um ou outro ano, por exemplo, o percentual de redução iria saltar para 44,4% ou diminuir pela metade, respectivamente.

Na Semana Santa, por exemplo, houve uma redução de 50% nos mortos nas estradas federais no RJ em relação ao Carnaval: de 16 para 7. Esta comparação não leva a muitas conclusões, ainda mais levando-se em consideração a diferença no número de dias e de viajantes em relação aos dois feriados. Certa vez, uma reportagem alertou para o índice impressionante de crescimento no número de mortes nas estradas em Goiás em determinado feriado: 700%. Em números absolutos, a variação foi de 1 para 8 mortes, sendo que 6 destas mortes foram provocadas por um único acidente.

Mas isso não significa que resultados das estatísticas sejam obras completas do acaso. É evidente que fatores como uma fiscalização mais rigorosa contra motoristas embriagados, serviços de manutenção e melhoria das estradas e, principalmente, a atenção e boa conduta das pessoas são preponderantes para a redução no número de acidentes. Mas não se pode achar que qualquer variação seja causada por uma mudança estrutural ocorrida em algum desses aspectos. Um outro exemplo deste último feriado foi o balanço dos acidentes em Minas Gerais, a partir do qual a Polícia Rodoviária Federal comemorou o bom resultado da campanha que incentivou os motoristas a andarem com os faróis acesos mesmo durante o dia. Esta campanha teria sido um dos principais fatores, segundo a PRF, para a diminuição de 28 para 15 no número de mortos nas rodovias federais. Entretanto, nas rodovias estaduais, o número de mortos saltou de 20 para 29. Considero pouco provável que os motoristas só tenham andado com faróis acesos nas rodovias federais, até porque muitas vezes os condutores não sabem a esfera responsável pela jurisdição da estrada.

Diante desse quadro de dúvida se um determinado resultado é de fato causado por certo fator ou se é apenas fruto da aleatoriedade é que se devem utilizar técnicas apuradas de Estatística para tentar eliminar as flutuações aleatórias e identificar os reais fatores que tenham provocado variações nos resultados. Mas isso não é uma tarefa fácil. Em primeiro lugar, são necessários volumes razoáveis de dados para que o aspecto aleatório seja “diluído”, conforme discuti em um post anterior. Em seguida, é preciso identificar quais são as variáveis explicativas que podem influenciar no resultado a ser analisado e, posteriormente, aplicar modelos – em geral, envolvendo diversas variáveis - que possam quantificar essas relações causais. Como se vê, não se pode exigir que essa análise mais detalhada seja feita de um dia para o outro para dar uma resposta ao publico na velocidade natural que a notícia de um jornal pede.


1 é semelhante ao exemplo de duas pessoas que lançam 10 vezes um mesmo dado, sob condições idênticas. Os resultados obtidos por ambos dificilmente serão iguais, e o fato de uma delas ter eventualmente tirado mais vezes o número 6 não teria sido determinado por nenhuma causa em particular.

Um comentário:

  1. Mas análises aprofundadas levam tempo e dão trabalho... E custam caro! Ou seja, tudo contra o pensamento político predominante.

    ResponderExcluir