Pesquisar este blog

quarta-feira, 25 de maio de 2011

A sorte não se compensa, mas se dilui

“Uma moeda não viciada foi lançada 10 vezes, ocorrendo 7 caras e 3 coroas. Portanto, nos próximos lançamentos, o número de coroas deverá ser maior do que o de caras, para que, no futuro, haja uma tendência de igualdade entre as quantidades de vezes em que saiu cada face. Caso contrário, haveria um indício de que a moeda é viciada”.

O raciocínio acima é muito comum quando se analisa um experimento aleatório onde todos os resultados possíveis têm a mesma probabilidade de ocorrência. Embora o considere bastante pertinente do ponto de vista intuitivo, essa lógica erra ao ignorar um aspecto fundamental da aleatoriedade: a de que uma eventual fase de sorte (ou de azar, dependendo do ponto de vista) não se compensa com o tempo, mas sim se dilui.

Vamos estudar o experimento de se lançar N vezes uma moeda e observar a quantidade de caras obtidas. Para explorar o aspecto aleatório, considerarei 100 pessoas realizando esse mesmo procedimento, onde cada um deles anotará o número de caras obtidas nos seus N lançamentos. Apesar de o experimento ter sido simulado através do Excel,* suponho daqui em diante que ele foi realizado na prática, para não perder o sentido concreto.

Começarei com a situação de 10 lançamentos da moeda (N=10). De posse do número de caras obtidas por cada uma dessas 100 pessoas, construí um histograma (gráfico à esquerda abaixo) que indica quantas vezes se observou cada quantidade de caras. Por exemplo, 20 pessoas obtiveram um total de 6 caras, e apenas 5 pessoas obtiveram 2 caras. O gráfico da direita mostra o mesmo histograma, porém indicando no eixo horizontal o desequilíbrio entre o número de caras e o de coroas. Por exemplo, o valor “3” no eixo x à esquerda corresponde ao valor “-4” (= 3 caras – 7 coroas) no eixo x à direita. Essa segunda escala será bem mais útil na análise que segue.
Pelo histograma, verifica-se que:
(1) há certa simetria do número de caras em relação à quantidade esperada em média (N/2=5), indicando que a moeda não tem vício a favor de cara ou de coroa;
(2) situações com grandes discrepâncias entre o número de caras e coroas são mais raras, como é de se esperar;
(3) o mais importante: é mais provável que haja um desequilíbrio quanto ao número de caras e coroas do que um perfeito equilíbrio. O equilíbrio perfeito (número de caras = número de coroas) só foi verificado para 28% das pessoas.

Em seguida, simulei o mesmo experimento com N = 100 e N = 1000 lançamentos para cada uma das 100 pessoas. De acordo com o raciocínio ilustrado no início do texto, nessas duas novas situações deveria haver uma concentração maior em torno do valor zero no histograma de desequilíbrio, em relação ao caso com N=10. Isto indicaria uma compensação entre o número de caras e coroas no longo prazo, em direção à situação de perfeito equilíbrio. Entretanto, veja como se comporta esse histograma de desequilíbrio entre o número de caras e o número de coroas, para esses dois casos:


Comparando esses dois gráficos com o anterior, à direita, percebe-se nitidamente que a discrepância entre o número absoluto de caras e de coroas cresce quando se aumenta N. E o mais curioso: o percentual de pessoas para as quais ocorreu a situação de perfeito equilíbrio, que seria a mais esperada pela “lei da compensação”, é bem menor nesses dois casos, chegando a irrisórios 5% (5 pessoas) para o caso em que N = 1000.**

Neste ponto, os que já tem um conhecimento mais aprofundado em Estatística devem estar se perguntando o que há de errado com a Lei dos Grandes Números de Bernoulli. Quando há um maior número de repetições (N), os resultados estatísticos não tenderiam à situação de equilíbrio evidenciada pelo fato da moeda ser não viciada? A resposta é que esse equilíbrio será atingido em termos percentuais, para a ocorrência de aproximadamente 50% de caras e 50% de coroas, e não em quantidades absolutas. Para confirmar isso, o gráfico abaixo mostra os histogramas do percentual de caras obtido pelas mesmas 100 pessoas nos N lançamentos da moeda, para os três casos com N = 10, 100 e 1000.


Percebe-se agora a concentração do percentual de caras para valores em torno de 50% à medida que N cresce. Para o caso com apenas 10 lançamentos, não é raro obter valores extremos, como 10% e 90% de caras. Quando N aumentou para 100, o percentual de ocorrências de caras se manteve em uma faixa menor, entre 35% e 65%. Finalmente, para N=1000 esse percentual esteve sempre entre 45 e 55%, para todas as 100 pessoas.

De forma geral, em experimentos aleatórios onde há vários resultados possíveis com a mesma probabilidade de ocorrência, não espere que haja uma “compensação” do número absoluto de vezes em que cada resultado será verificado. O que irá acontecer é uma convergência, no longo prazo, dos percentuais de ocorrências de cada resultado para valores iguais. De forma equivalente, fazendo referência ao título deste post, eventuais desequilíbrios a favor de algum resultado nas primeiras realizações do experimento não serão necessariamente compensados em números absolutos a favor dos outros resultados ao longo do tempo, mas sim diluídos, em termos percentuais.

É devido a esse princípio de não compensação que a probabilidade de sair cara no próximo lançamento da moeda continuará sendo 50%, independentemente do fato de já ter ou não saído mais caras no passado. Esse resultado também se aplica ao percentual de vezes em que cada número já saiu na Mega-Sena, assunto que discutirei em um futuro post. Um número não terá mais chances de sair no próximo sorteio porque ele está “atrasado” há vários concursos, como se costuma crer. Finalmente, em uma situação em que dois jogadores de tênis tecnicamente empatados disputaram 5 partidas e o primeiro venceu 4 confrontos, não espere que a sorte necessariamente vire de lado nas próximas partidas para o outro jogador. Naturalmente, quando a quantidade de confrontos aumentar, essa fase inicial de “sorte” do primeiro jogador irá se diluir no tempo, e o percentual de vitórias de cada tenista (mantendo-se a hipótese deles serem tecnicamente equivalentes) tenderá a 50%.


* através da geração de números aleatórios binários (1: cara; 0: coroa) no Excel, ao longo de 100 colunas.
** Cabe ressaltar que, se as 100 pessoas realizarem novamente esse experimento, os resultados serão outros, pelo fato do experimento ser aleatório. Entretanto, o “jeitão” dos gráficos será semelhante.


terça-feira, 17 de maio de 2011

O Jogo da Estratégia

Em 1972, quando o jogo War foi lançado no Brasil, o panorama internacional ainda era dividido entre comunistas e capitalistas. Hoje, depois de quase três décadas de mudanças geopolíticas que levaram à criação de novos países, um dos mais clássicos jogos de tabuleiro continua entretendo várias gerações e já conta até com uma versão online. Há uma longa discussão sobre até que ponto a sorte e a estratégia contribuem para definir o vencedor em uma partida de War.

É evidente que o fator sorte é essencial, desde o sorteio do objetivo, passando pela retirada das cartas e, sobretudo, durante os ataques. Porém, se um jogador utilizar o cálculo de probabilidades para identificar as alternativas de ataque onde as chances de ganhar são maiores, terá certa vantagem em relação aos demais adversários, o que pode até compensar um eventual azar no lançamento dos dados.

Utilizo como exemplo a situação ilustrada abaixo, onde um jogador, representado pelas peças brancas, está a dois territórios de atingir seu objetivo de conquistar a Ásia e a América do Sul. A configuração do tabuleiro no início de sua jogada é esquematizada a seguir, onde as peças dos adversários são indicadas pela cor preta.


Se o jogador tem direito de colocar 7 peças antes de realizar os ataques, qual é a melhor forma de distribuí-las nos dois territórios? Seria colocar 4 peças no Brasil e 3 na Índia, tentando conquistar a Colômbia em um confronto 5x3 e o Vietnã com um confronto 4x2? Ou é melhor passar uma peça a mais para a Índia, realizando um confronto 4x3 no Brasil e outro 5x2 no Vietnã?  Em situações como esta, deseja-se descobrir, dentre todas as alternativas possíveis, aquela que leva à maior chance de vencer os confrontos.

Para entender a análise que segue, será necessário conhecer as regras dos ataques do War, além da nomenclatura por mim adotada ao longo do texto:

- um confronto do tipo AxD corresponde à tentativa de um jogador, com A peças no território de ataque, conquistar um território inimigo ocupado com D peças. Um confronto evolui através de uma sequência de “ataques”, que persistirão até que a defesa perca todas as suas peças (e o território é conquistado) ou o atacante fique só com uma peça, dita de “ocupação” (quando fracassa a tentativa de conquista do território).

- Cada ataque de “X dados contra Y” consiste no lançamento de X dados pelo atacante e Y dados pelo defensor, onde X e Y correspondem ao número de peças restantes nos territórios de ataque e defesa, descontando-se a peça de ocupação do atacante e limitando ambos os valores a um máximo de 3. Os valores obtidos nos dados do atacante e do defensor são ordenados de forma decrescente e comparados um a um, eliminando-se os valores mais baixos que sobram quando X Y. Em cada comparação, o jogador com menor valor no dado perde uma peça do território, sendo o defensor o ganhador quando ocorrer um empate. A tabela abaixo exemplifica alguns ataques:

Ataque
(X × Y)
Dados do atacante
Dados do defensor
Resultado
3 × 3
{6,3,2}
{3,3,1}
Atacante perde 1 peça e o defensor perde 2 peças.
3 × 1
{4,4,1}
{6,4}
Atacante perde 2 peças e o defensor, nenhuma.
1 × 2
{6}
{5,5}
Defensor perde 1 peça e o atacante, nenhuma.

Há diversas formas de o defensor ser derrotado. Por exemplo, em um confronto do tipo 5x3, que se inicia com um ataque de “3 dados contra 3”, o atacante pode conquistar o território adversário das seguintes formas:

A) eliminando as três peças do defensor logo no 1º ataque;
B) eliminando duas peças do defensor e perdendo uma peça no 1º ataque, e em seguida, vencendo um confronto 4x1 (que se inicia com um ataque de 3 dados contra 1);
C) eliminando uma peça do defensor e perdendo duas peças no 1º ataque, e em seguida vencendo um confronto 3x2 (que se inicia com um ataque de 2 dados contra 2)
D) perdendo 3 exércitos no 1º ataque, e em seguida vencendo um confronto 2x3 (que se inicia com um ataque de 1 dado contra 3).

Ressalta-se que cada um dos confrontos remanescentes nas opções B a D pode ainda se desdobrar em novos ataques. Além disso, em cada ataque devem ser avaliadas todas as combinações possíveis de valores para os dados lançados. Por exemplo, no ataque de 3 dados contra 3, há 66 = 46.656 combinações possíveis de resultados para os dados.

Portanto, o cálculo das probabilidades de conquista de um território requer um esforço considerável, já que a quantidade de combinações é muito grande. Tentei inicialmente realizar os cálculos no EXCEL, mas tive que recorrer a um código estruturado, com loops que permitissem varrer todas as possíveis opções e calcular as probabilidades exatas associadas a cada uma delas1. A tabela abaixo mostra as probabilidades de conquista de território pelo atacante, para 18 possíveis confrontos entre atacante e defensor, variando de 2 até 7 peças para o atacante e de 1 até 3 peças para o defensor.1

nº peças de ataque
X
nº peças de defesa
Probab. Conquista
(%)
nº peças de ataque
X
nº peças de defesa
Probab. Conquista
(%)
nº peças de ataque
X
nº peças de defesa
Probab. Conquista
(%)
2
X
1
41,67%
2
X
2
10,61%
2
X
3
1,84%
3
X
1
75,42%
3
X
2
36,27%
3
X
3
9,99%
4
X
1
91,64%
4
X
2
65,60%
4
X
3
32,76%
5
X
1
97,15%
5
X
2
78,55%
5
X
3
43,74%
6
X
1
99,03%
6
X
2
88,98%
6
X
3
55,81%
7
X
1
99,67%
7
X
2
93,40%
7
X
3
68,36%

Esta tabela serve como um “guia” para auxiliá-lo nas estratégias de ataque ou de remanejamento de peças para defesa. Através dela descobre-se que:

- No ataque 4x1 típico de início de jogo, caso um jogador persista nos ataques até conquistar o território (ou ficar com apenas 1 peça), sua chance de conquista é de 91,64%. Estas chances se reduzem para 75,42% no confronto 3x1 e, na situação mais ousada, onde se tenta conquistar o território com apenas uma peça de ataque alem da peça de ocupação (2x1), é mais provável que o atacante não conquiste o território.

- Se, ao término de sua jogada, um jogador deixar 2 peças de defesa protegendo um território, a chance de se resistir a um ataque 5x2 do próximo adversário é de 21,45%.

- Se um jogador adicionar mais uma peça de ataque em um confronto que seria originalmente do tipo 4x1, suas chances de conquista aumentarão em cerca de 5,5%. Se ele irá realizar um confronto 5x2 em outra parte do tabuleiro, seria melhor utilizar essa peça adicional de ataque nesse outro confronto, onde essa peça teria um valor “marginal” maior, pois aumentaria suas chances de conquista em mais de 10%.

Volto ao exemplo do início do texto. Como os confrontos mencionados estão localizados em diferentes partes do tabuleiro, seus resultados são independentes. Assim, a probabilidade do jogador vencer ambos os confrontos (e tornar-se o vencedor do jogo) é feita multiplicando-se as probabilidades de conquista em cada confronto. A tabela a seguir mostra as chances de se ganhar o jogo para diversas alternativas de colocação das peças.

Colocação das peças
Ataque Brasil X Colômbia
Ataque Índia X Vietnã
Probabilidade de vencer ambos os confrontos
(1)
´ (2)
Tipo de confronto
Chance de conquista (1)
Tipo de confronto
Chance de conquista (2)
4 no Brasil e
3 na Índia
5x2
78,55%
4x3
32,76%
25,73%
3 no Brasil e
4 na Índia
4x2
65,60%
5x3
43,74%
28,69%
2 no Brasil e
5 na Índia
3x2
36,27%
6x3
55,81%
20,24%

Percebe-se que a estratégia mais intuitiva, que seria a de se colocar 3 exércitos no Brasil e 4 na Índia (para, desta forma, ter uma superioridade de 2 exércitos sobre a defesa em ambos os confrontos) é, de fato, a mais adequada. Mas veja como que nem sempre a intuição ajuda: a terceira estratégia listada na tabela, onde a maior diferença entre o número de peças do atacante e do defensor (6x3) foi utilizada para atacar o território de defesa mais fortalecido, é pior do que a primeira estratégia, onde essa diferença é utilizada para atacar o outro território, menos fortalecido (5x2). Portanto, utilizando a teoria das probabilidades pode-se chegar a estratégias de jogo que sejam mais interessantes e que normalmente não seriam seguidas na prática.


1Posso enviar aos interessados os detalhes desses cálculos. Por exemplo, para cada tipo de confronto, identifiquei a probabilidade da conquista do território ocorrer perdendo-se nenhuma, 1, 2 ou 3 peças, e assim por diante. Isto pode ser útil caso queiramos responder à seguinte pergunta: “qual a probabilidade de conquistar um território em um confronto 4x1 perdendo-se no máximo 1 peça?” Neste exemplo específico, esta probabilidade é de 88,42%.

Obs: No site da Wikipédia, são listadas probabilidades de vitória para diversos ataques do jogo de War. Os valores listados nessa página NÃO são iguais aos mostrados na tabela deste texto, pois aqui calculo a probabilidade de conquista completa do território (ou seja, considerando uma série de ataques em seqüência), enquanto lá as probabilidades correspondem apenas aos ataques individuais. As probabilidades calculadas por mim para esses ataques conferem com os valores desse site.