Pesquisar este blog

quarta-feira, 25 de maio de 2011

A sorte não se compensa, mas se dilui

“Uma moeda não viciada foi lançada 10 vezes, ocorrendo 7 caras e 3 coroas. Portanto, nos próximos lançamentos, o número de coroas deverá ser maior do que o de caras, para que, no futuro, haja uma tendência de igualdade entre as quantidades de vezes em que saiu cada face. Caso contrário, haveria um indício de que a moeda é viciada”.

O raciocínio acima é muito comum quando se analisa um experimento aleatório onde todos os resultados possíveis têm a mesma probabilidade de ocorrência. Embora o considere bastante pertinente do ponto de vista intuitivo, essa lógica erra ao ignorar um aspecto fundamental da aleatoriedade: a de que uma eventual fase de sorte (ou de azar, dependendo do ponto de vista) não se compensa com o tempo, mas sim se dilui.

Vamos estudar o experimento de se lançar N vezes uma moeda e observar a quantidade de caras obtidas. Para explorar o aspecto aleatório, considerarei 100 pessoas realizando esse mesmo procedimento, onde cada um deles anotará o número de caras obtidas nos seus N lançamentos. Apesar de o experimento ter sido simulado através do Excel,* suponho daqui em diante que ele foi realizado na prática, para não perder o sentido concreto.

Começarei com a situação de 10 lançamentos da moeda (N=10). De posse do número de caras obtidas por cada uma dessas 100 pessoas, construí um histograma (gráfico à esquerda abaixo) que indica quantas vezes se observou cada quantidade de caras. Por exemplo, 20 pessoas obtiveram um total de 6 caras, e apenas 5 pessoas obtiveram 2 caras. O gráfico da direita mostra o mesmo histograma, porém indicando no eixo horizontal o desequilíbrio entre o número de caras e o de coroas. Por exemplo, o valor “3” no eixo x à esquerda corresponde ao valor “-4” (= 3 caras – 7 coroas) no eixo x à direita. Essa segunda escala será bem mais útil na análise que segue.
Pelo histograma, verifica-se que:
(1) há certa simetria do número de caras em relação à quantidade esperada em média (N/2=5), indicando que a moeda não tem vício a favor de cara ou de coroa;
(2) situações com grandes discrepâncias entre o número de caras e coroas são mais raras, como é de se esperar;
(3) o mais importante: é mais provável que haja um desequilíbrio quanto ao número de caras e coroas do que um perfeito equilíbrio. O equilíbrio perfeito (número de caras = número de coroas) só foi verificado para 28% das pessoas.

Em seguida, simulei o mesmo experimento com N = 100 e N = 1000 lançamentos para cada uma das 100 pessoas. De acordo com o raciocínio ilustrado no início do texto, nessas duas novas situações deveria haver uma concentração maior em torno do valor zero no histograma de desequilíbrio, em relação ao caso com N=10. Isto indicaria uma compensação entre o número de caras e coroas no longo prazo, em direção à situação de perfeito equilíbrio. Entretanto, veja como se comporta esse histograma de desequilíbrio entre o número de caras e o número de coroas, para esses dois casos:


Comparando esses dois gráficos com o anterior, à direita, percebe-se nitidamente que a discrepância entre o número absoluto de caras e de coroas cresce quando se aumenta N. E o mais curioso: o percentual de pessoas para as quais ocorreu a situação de perfeito equilíbrio, que seria a mais esperada pela “lei da compensação”, é bem menor nesses dois casos, chegando a irrisórios 5% (5 pessoas) para o caso em que N = 1000.**

Neste ponto, os que já tem um conhecimento mais aprofundado em Estatística devem estar se perguntando o que há de errado com a Lei dos Grandes Números de Bernoulli. Quando há um maior número de repetições (N), os resultados estatísticos não tenderiam à situação de equilíbrio evidenciada pelo fato da moeda ser não viciada? A resposta é que esse equilíbrio será atingido em termos percentuais, para a ocorrência de aproximadamente 50% de caras e 50% de coroas, e não em quantidades absolutas. Para confirmar isso, o gráfico abaixo mostra os histogramas do percentual de caras obtido pelas mesmas 100 pessoas nos N lançamentos da moeda, para os três casos com N = 10, 100 e 1000.


Percebe-se agora a concentração do percentual de caras para valores em torno de 50% à medida que N cresce. Para o caso com apenas 10 lançamentos, não é raro obter valores extremos, como 10% e 90% de caras. Quando N aumentou para 100, o percentual de ocorrências de caras se manteve em uma faixa menor, entre 35% e 65%. Finalmente, para N=1000 esse percentual esteve sempre entre 45 e 55%, para todas as 100 pessoas.

De forma geral, em experimentos aleatórios onde há vários resultados possíveis com a mesma probabilidade de ocorrência, não espere que haja uma “compensação” do número absoluto de vezes em que cada resultado será verificado. O que irá acontecer é uma convergência, no longo prazo, dos percentuais de ocorrências de cada resultado para valores iguais. De forma equivalente, fazendo referência ao título deste post, eventuais desequilíbrios a favor de algum resultado nas primeiras realizações do experimento não serão necessariamente compensados em números absolutos a favor dos outros resultados ao longo do tempo, mas sim diluídos, em termos percentuais.

É devido a esse princípio de não compensação que a probabilidade de sair cara no próximo lançamento da moeda continuará sendo 50%, independentemente do fato de já ter ou não saído mais caras no passado. Esse resultado também se aplica ao percentual de vezes em que cada número já saiu na Mega-Sena, assunto que discutirei em um futuro post. Um número não terá mais chances de sair no próximo sorteio porque ele está “atrasado” há vários concursos, como se costuma crer. Finalmente, em uma situação em que dois jogadores de tênis tecnicamente empatados disputaram 5 partidas e o primeiro venceu 4 confrontos, não espere que a sorte necessariamente vire de lado nas próximas partidas para o outro jogador. Naturalmente, quando a quantidade de confrontos aumentar, essa fase inicial de “sorte” do primeiro jogador irá se diluir no tempo, e o percentual de vitórias de cada tenista (mantendo-se a hipótese deles serem tecnicamente equivalentes) tenderá a 50%.


* através da geração de números aleatórios binários (1: cara; 0: coroa) no Excel, ao longo de 100 colunas.
** Cabe ressaltar que, se as 100 pessoas realizarem novamente esse experimento, os resultados serão outros, pelo fato do experimento ser aleatório. Entretanto, o “jeitão” dos gráficos será semelhante.


3 comentários:

  1. A ordem dos gráficos da primeira figura (direita/esquerda) foi corrigida, pois estava trocada na versão anterior, postada na quarta.

    ResponderExcluir
  2. E qual é a probabilidade de você passar ao meu lado no Rock in Rio entre 100 mil pessoas, no mesmo dia do show, depois de 20 anos sem nos vermos?

    ResponderExcluir
  3. Pois é, Daniela. Quando pensava em um tema relacionado ao Rock In Rio, cogitei falar da probabilidade de uma pessoa encontrar algum conhecido.

    Na verdade, deve haver muitas pessoas que você não vê há muito tempo. A probabilidade de você encontar uma pessoa específica é pequena, claro, mas a de você encontrar ALGUMA dessas pessoas talvez não seja, ainda mais em um lugar onde você irá ver muita gente.

    ResponderExcluir