Pesquisar este blog

domingo, 18 de setembro de 2011

Para Entender as Estatísticas

A fuga do rebaixamento do Fluminense em 2009 ficou conhecida como um caso emblemático em que os estatísticos erraram feio por apontarem, a muitas rodadas antes do fim, apenas 1% de chances de o time carioca se manter na primeira divisão em 2010. No entanto, esta situação pode ser vista como um acerto dos estatísticos, pois enquanto o público e a crítica em geral davam como certo o rebaixamento do tricolor, aquele percentual era um sinal de que nem tudo estava perdido. Os estatísticos consideraram, sim, a hipótese de o time não ser rebaixado, mas com a probabilidade que cabia na época, de acordo com os dados que tinham no momento da análise.

Afinal de contas, dos 7 jogos finais daquele campeonato, o Fluminense ganhou 6 e empatou 1, conquistando 19 pontos dos 21 possíveis e, mesmo com um desempenho tão impressionante, escapou do rebaixamento por apenas 1 ponto. Qual seria a probabilidade de um time na última colocação dar tal guinada, que originou até a publicação de um livro?1. Provavelmente dessa ordem de 1%, ou menor.

Esse fato ilustra bem como os resultados do meu estudo sobre as chances de cada time no Brasileirão, publicados no post anterior2, devem ser encarados. Por exemplo, se as chances de título do Flamengo, segundo as hipóteses que adotei, foram de apenas 1,7%, isso não significa que o time rubro-negro não tenha chances. Apenas indica que elas são reduzidas, considerando que o seu desempenho, daqui para frente, não irá ser muito diferente do desempenho dos outras equipes que classifiquei como sendo do tipo A (os 12 clubes chamados grandes). E esta hipótese básica foi adotada porque não tenho elementos para “prever” que determinada equipe deste tipo terá um desempenho bem superior ao dos outros no futuro. Como enfatizei no programa “Redação Sportv”, onde os resultados foram apresentados, estatístico não é vidente.

E se o torcedor do Flamengo estiver confiante de que o time irá engatar 4 vitórias consecutivas nas próximas rodadas, como já fez duas vezes nesse campeonato? Se isto acontecer, após a 28ª rodada, suas chances de conquistar o título ou ir para a Libertadores certamente subirão, e deverão ser bem maiores do que as apontadas ao final desta 24ª rodada (vide resultados mais adiante). Raciocínio análogo pode ser aplicado a qualquer outro time, seja na disputa pelo título como na luta contra o rebaixamento.

É importante que se entenda, portanto, que as chances de cada time são recalculadas a cada rodada, e eventuais mudanças no seu desempenho (para melhor ou para pior) irão se refletir nas suas possibilidades futuras de título, de vaga na Libertadores ou de não cair. No exemplo citado do Fluminense em 2009, a chance de fuga do rebaixamento foi crescendo ao longo das últimas rodadas do campeonato. A sete rodadas do fim, consistia daquele histórico 1%, e na última rodada atingiu um valor que indicava algo bem mais provável de acontecer: bastava não perder para o Coritiba no último jogo, no estádio Couto Pereira.

Essa mudança nos prognósticos ao longo do campeonato é inevitável, e não significa que o estatístico “errou” nos cálculos anteriores, a partir das hipóteses adotadas. Ela se dá simplesmente pela impossibilidade de o estatístico prever o futuro. Por exemplo, ontem, pela 24ª rodada do campeonato, o Vasco venceu bem o Grêmio em São Januário, por 4 a 0. Segundo a tabela de probabilidades para um jogo entre equipes do tipo A, mostrada no post anterior, considerei que a probabilidade de vitória do time mandante era de 0,40. Isto significa que, em média, apenas 40% das 100.000 simulações que realizei anteriormente apontaram o Vasco vitorioso neste jogo.

Já no estudo atualizado que realizei ao final desta 24ª rodada, 100% das simulações consideraram vitória do Vasco nesse mesmo jogo (uma vez que ele já ocorreu), e assim os novos prognósticos foram mais favoráveis ao clube da colina, em relação aos da rodada anterior. Como não é possível um time ganhar 40% de um jogo após a sua realização, os cálculos só seriam os mesmos, nesse caso, se eu tivesse considerado, na simulação para a rodada anterior, 100% de chance de vitória do Vasco neste confronto. Evidentemente, isso seria um absurdo do ponto de vista tanto estatístico como futebolístico.

Com base nos resultados revelados para esta 24ª rodada que terminou hoje, fiz novas simulações, com a mesma metodologia e hipóteses adotadas no estudo do post anterior, que havia sido realizado após a 23ª rodada. A única modificação, portanto, foi a inclusão dos resultados ocorridos nesta rodada, que se constituíram, para o programa, em jogos já realizados e não mais passíveis de simulação. As novas chances de título, vaga na Libertadores e risco de rebaixamento são mostradas na tabela abaixo. A figura na seqüência mostra a variação ocorrida nas chances de título em relação à simulação anterior.

#
Equipe
Classificação do Campeonato,
após a 24ª rodada
Chances
de Título (%)
Chances de Libertadores
(%)
Risco de Rebaixamento
(%)
PG
J
V
E
D
GP
GC
SG
1
Vasco
45
24
13
6
5
37
27
10
23,72
0,00
0,00
2
São Paulo
44
24
13
5
6
39
28
11
25,54
88,77
0,00
3
Corinthians
43
24
13
4
7
36
26
10
25,94
88,87
0,00
4
Botafogo
41
23
12
5
6
37
26
11
17,72
81,17
0,00
5
Fluminense
37
24
12
1
11
30
29
1
2,40
42,07
0,02
6
Flamengo
37
24
9
10
5
39
32
7
1,34
32,03
0,04
7
Internacional
36
24
9
9
6
40
31
9
1,11
27,07
0,10
8
Palmeiras
35
24
8
11
5
30
24
6
0,76
23,54
0,14
9
Atlético-GO
33
24
9
6
9
30
27
3
0,01
0,80
8,95
10
Coritiba
33
24
9
6
9
40
30
10
0,02
2,82
2,74
11
Santos
32
22
9
5
8
32
33
-1
1,30
0,00
0,21
12
Figueirense
32
24
8
8
8
28
30
-2
0,00
0,49
13,90
13
Grêmio
30
23
8
6
9
27
31
-4
0,13
8,99
1,24
14
Cruzeiro
29
24
8
5
11
30
28
2
0,03
3,12
3,83
15
Ceará
27
24
7
6
11
30
41
-11
0,00
0,03
46,39
16
Bahia
27
24
6
9
9
28
32
-4
0,00
0,02
49,62
17
Atlético-MG
24
24
7
3
14
30
41
-11
0,00
0,21
24,13
18
Atlético-PR
23
24
5
8
11
24
36
-12
0,00
0,00
66,27
19
Avaí
22
24
5
7
12
28
49
-21
0,00
0,00
86,50
20
América-MG
19
24
3
10
11
30
44
-14
0,00
0,00
95,93


Verifica-se uma significativa redução na chance do Corinthians, de 36,4% para os atuais 25,94%, e um grande aumento das chances de Vasco e São Paulo. Esse comportamento era esperado, devido à derrota do Corinthians para o Santos e às vitórias expressivas dos outros dois adversários. Entretanto, um fator que contribuiu para a magnitude desta variação foi o fato de as três equipes estarem muito próximas entre si, e os 3 pontos ganhos a mais por Vasco e São Paulo nesta rodada podem fazer muita diferença no final. Por exemplo, os campeões das três últimas edições do campeonato – Fluminense, Flamengo e São Paulo – terminaram o campeonato com diferença menor ou igual a 3 pontos para o segundo colocado. Verificou-se também uma leve redução nas chances do Botafogo, que empatou com o Flamengo na rodada.

O time do parque São Jorge continua com mais chances que os demais, porém esta diferença é estatisticamente desprezível em relação ao São Paulo e muito pequena em relação ao Vasco. Apesar de estar na liderança, o clube de São Januário ainda tem contra si o fato de já ter descartado, neste 2º turno, uma quantidade maior de jogos com times de menor expressão.

Na luta contra o rebaixamento, destaca-se a aproximação entre as chances de Ceará (46,39%) e Bahia (49,32%), devido à derrota sofrida pelo primeiro e a vitória do segundo, diante do Fluminense, que é uma equipe classificada como do tipo A. Finalmente, na zona de classificação para a Libertadores, houve uma aproximação entre o candidato mais provável para a última vaga, o Fluminense (42,07%), e os seus adversários mais diretos, Flamengo (32,03%) e Internacional (27,07%). Apesar de estes dois últimos terem empatado suas partidas, o Flamengo obteve uma vantagem maior em relação ao Internacional por ter descartado um clássico, enquanto o time do Sul deixou de ganhar um jogo em casa, contra uma equipe que havia sido classificada como do tipo B.


1) "Do Inferno ao Céu - A História de um Time de Guerreiros", Paulo Roberto Andel,  Ed. 7 letras, 2011.

2) Post “chances do Brasileirão”, publicado em 16/09/2011.

3 comentários:

  1. Grande André Diniz, parabéns pelo blog, e depois coloca o link ou posta os videos de sua participação no redação sportv! Achei muito interessante e muito lúcida os seus cálculos..

    ResponderExcluir
  2. Ótimo texto!

    Acho que tem um erro na tabela. O Internacional aparece com 38 pontos. Na verdade o Inter está com 36.

    ResponderExcluir
  3. Obrigado pela observação!

    Foi feito o ajuste da posição do Inter na tabela.

    Ressalto que as simulações haviam sido feitas com a pontuação correta do Inter (36 pontos) então não houve mudança nos prognósticos.

    Abraço!

    ResponderExcluir