Pesquisar este blog

quarta-feira, 20 de julho de 2011

Coincidências de Alta Incidência

Há duas semanas minha filha fez aniversário. No mesmo dia, comemoramos também a data de nascimento de duas pessoas da família da minha mulher. Do meu círculo de amigos mais próximos, duas pessoas fazem aniversário dia 23 de outubro, e duas no dia 10 de abril, que, aliás, foi a data em que meu sobrinho de 2 anos nasceu.

Tenho certeza de que boa parte das pessoas pode citar coincidências como essas em relação a datas de aniversário de pessoas na família, colegas de trabalho ou amigos mais próximos. A princípio, se o ano tem 365 dias, seria razoável esperar que fossem raras as coincidências nas datas de aniversários em grupos de, por exemplo, cerca de 50 pessoas. A resposta natural de um cálculo preliminar que dividisse 365 por 50 seria menos de 1/7 de chance. Entretanto, essa é uma das curiosas situações em que a teoria da probabilidade revela valores que não são nada intuitivos.

A análise que segue utiliza o mesmo conceito da diferença entre uma repetição específica e uma repetição qualquer, que introduzi no post de 03/05, “A Mega em Cena”, onde analiso a probabilidade de saírem números repetidos em concursos consecutivos da Mega-Sena. Nesta questão da coincidência de aniversários, é natural pensarmos na probabilidade de NÓS fazermos aniversário no mesmo dia de alguém do grupo, quando na verdade o que se deve avaliar é a probabilidade de ALGUÉM fazer aniversário no mesmo dia de OUTRO ALGUÉM do grupo. Como veremos, a segunda probabilidade é muito maior do que a primeira.

Pense no caso com apenas duas pessoas, “A” e “B”. A primeira pode fazer aniversário em qualquer dia, mas, para que haja coincidência, a segunda teria que fazer aniversário necessariamente no mesmo dia da primeira. Ignorando daqui pra frente os anos bissextos (nada contra os que nascem nesse dia, mas é para facilitar os cálculos), a probabilidade de ambas fazerem aniversário no mesmo dia será de 1/365, ou pouco mais de 0,27%. Considero nesse cálculo que não há nenhuma afinidade a priori entre essas pessoas quanto à data de nascimento, como por exemplo fazerem parte de um grupo de encontro de capricornianos, ou seus pais terem se conhecido na maternidade onde nasceram.

Adicionando uma nova pessoa “C” ao grupo, temos três possibilidades de coincidências: “A e B”, “A e C”, e “B e C”. Ou seja, apesar de o número de possibilidades em que a pessoa “A” faz aniversário no mesmo dia de outra pessoa ter apenas dobrado em relação à situação onde havia apenas duas pessoas, o número de possibilidades de haver ALGUMA coincidência triplicou. Com quatro pessoas, há 6 coincidências possíveis de duas pessoas fazendo aniversário no mesmo dia (que corresponde, em Análise Combinatória, à “combinação de 4 dois a dois”, C24), e com cinco pessoas esse número é de 10 (ou C25 , a “combinação de 5 dois a dois”). Ao adicionarmos sucessivamente uma pessoa por vez, esse número de combinações segue crescendo.

A tabela abaixo indica a probabilidade (Pr) de haver ALGUMA coincidência de aniversário em um grupo de N pessoas, com N variando até 50. Os cálculos são detalhados no apêndice 2, e não são exatamente proporcionais aos números de combinações C2N, pelo fato de poder haver múltiplas coincidências. Por exemplo, em um grupo de 10 pessoas, pode haver uma coincidência envolvendo 3 pessoas, ou duas coincidências envolvendo 2 pessoas cada, e assim por diante.

Probabilidade de haver alguma coincidência nas datas de aniversário, em um grupo de N pessoas.
N
Pr (%)
N
Pr (%)
N
Pr (%)
N
Pr (%)
N
Pr (%)
1
-
11
14,11%
21
44,37%
31
73,05%
41
90,32%
2
0,27%
12
16,70%
22
47,57%
32
75,33%
42
91,40%
3
0,82%
13
19,44%
23
50,73%
33
77,50%
43
92,39%
4
1,64%
14
22,31%
24
53,83%
34
79,53%
44
93,29%
5
2,71%
15
25,29%
25
56,87%
35
81,44%
45
94,10%
6
4,05%
16
28,36%
26
59,82%
36
83,22%
46
94,83%
7
5,62%
17
31,50%
27
62,69%
37
84,87%
47
95,48%
8
7,43%
18
34,69%
28
65,45%
38
86,41%
48
96,06%
9
9,46%
19
37,91%
29
68,10%
39
87,82%
49
96,58%
10
11,69%
20
41,14%
30
70,63%
40
89,12%
50
97,04%


O valor da célula destacada surpreende: basta juntar um grupo de 23 pessoas (que equivale à quantidade de participantes de uma partida de futebol, incluindo o juiz) para que seja mais provável haver alguma coincidência nas datas de aniversário do que não haver coincidência nenhuma. E num grupo de 40 pessoas, quantidade quase 10 vezes menor do que o número de dias no ano, as chances de coincidência são de quase 90%, chegando a impressionantes 97% para um grupo de 50 pessoas. Esses resultados são influenciados por dois fatores: pelo aumento do número de combinações “dois a dois” com o aumento de N e também, de forma importante, pelo aumento na quantidade das múltiplas coincidências mencionadas no parágrafo anterior (vide apêndice 2).

Para verificar empiricamente esse resultado, dividi o conjunto de meus 200 amigos que têm datas de aniversário declaradas no Facebook em grupos de 23 pessoas. O agrupamento foi realizado em ordem alfabética, supondo que não houvesse nenhuma correlação entre a letra inicial do nome e a época do ano em que a pessoa nasceu1. Foram gerados, dessa forma, 8 grupos completos de 23 pessoas, e as quantidades de coincidências de datas de aniversários em cada grupo estão indicadas na tabela abaixo. Todas as coincidências são de duas pessoas, não tendo havido em nenhum grupo coincidência de três ou mais pessoas nascendo no mesmo dia.

Coincidências nos aniversários em subconjuntos de 23 pessoas dos meus amigos no Facebook
Grupo
Número de coincidências
Grupo
Número de coincidências
0
1
2
0
0
0
0
3


Como se vê, em 3 dos 8 grupos houve alguma coincidência, sendo que em 2 grupos houve mais do que uma coincidência. No 9º grupo, não mostrado na tabela e que não chegou a ser formado por ter apenas 16 pessoas, já houve 1 coincidência. É importante ressaltar que essa proporção (3/8) de número de grupos onde houve coincidência não é uma boa estimativa para o valor teórico de 50,73% indicado na primeira tabela, pois o número de observações (8) é muito pequeno. Entretanto, esses resultados ilustram como a incidência de coincidências de aniversários é grande, mesmo em grupos com um número de pessoas muito menor do que o número de dias no ano.

 
1) Exceções seriam os casos de gêmeos com nomes parecidos, como Leandro e Leonardo, Bernardo e Bianca, etc... Entretanto, na minha lista só havia uma situação desse tipo, que foi eliminada da análise.

2) Detalhe dos cálculos da primeira tabela

Para calcular a probabilidade de haver ALGUMA coincidência em um grupo de N pessoas, é muito mais fácil tomar o complementar da probabilidade de não haver nenhuma coincidência. Isso porque há diversas combinações de coincidências. Por exemplo, em um grupo de 5 pessoas, pode-se ter:

- as 5 fazendo aniversário no mesmo dia;
- 4 fazendo aniversário no mesmo dia e a outra em um dia diferente;
- 3 fazendo aniversário no mesmo dia e os outros dois em dias diferentes;
- 3 fazendo aniversário no mesmo dia e os outros dois em um mesmo dia, diferente do primeiro;
- 2 fazendo aniversário no mesmo dia e os outros três em dias diferentes;
- 2 fazendo aniversário no mesmo dia, outros dois em um mesmo dia, diferente do primeiro, e o último em um dia diferente.

A expressão da probabilidade para cada caso é diferente, o que torna o cálculo bastante tedioso, e praticamente inviável quando N aumenta.

Por outro lado, o cálculo de não haver nenhuma coincidência é bastante simples. O primeiro pode fazer aniversário em qualquer dia (Pr=1), mas o segundo tem que fazer em um dia diferente do primeiro (Pr=364/365). O terceiro tem que fazer aniversário em um dia diferente dos outros dois (Pr=363/365), e assim por diante, até chegar ao número N. Multiplicando-se todas essas probabilidades (pois tem que acontecer uma coisa “E” outra), chega-se então à seguinte expressão:

Pr (nenhuma coincidência ) = 1 ´(364/365) ´(363/365) ´(362/365) ´... ´(365-(N-1))/365

e assim a probabilidade de haver ALGUMA coincidência em um grupo com N pessoas será:

1 - [(364´363´362´...´(364-N)) / (365)N-1]

6 comentários:

  1. Andrezito,
    Logo no início da fiscalização de excesso de velocidade por radar nas vias expressas aqui de Fortaleza, fiquei impressionado com a quantidade de multas que eu recebia durante o ano. Como os sensores de velocidade são sinalizados, a probabilidade de ser multado deveria ser muito pequena, orque então eu não conseguia escapar de receber pelo menos uma multa por ano? Como bom aluno do Prof. Kelman, fiz as contas e descobri que o segredo estava no espaço amostral: entre minha casa e o trabalho eu passava por três sensores de velocidade e, como vinha almoçar em casa, fazia esse percurso no mínimo 4 vezes por dia, sem contar os finais de semana quando o etanol (no motorista) diminuia ainda mais minha capacidade de passas incólume pelo pardal. A partir do resultado na análise do problema percebi que a única solução era mudar meu itinerário, evitando passar pelos pardais, uma vez que seria impossível mudar de local de trabalho ou deixar de tomar uma no final de semana.
    Segue essa historinha ai como sugestão de assunto para seu Blog.
    Parabéns pelo trabalho, ainda vai virar um livro.

    ResponderExcluir
  2. Grande mestre! Esse é um problema clássico, mas que sempre surpreende. Além disso, ficou muito melhor explicado do que eu tinha visto antes. O problema, assim como o comentário acima, mostra a importância do problema de testes múltiplos, quase sempre esquecido ou ignorado mesmo pelos "entendidos". O exemplo mais recente e famoso é o polvo Paul. Será que sai um post? :D

    ResponderExcluir
  3. Valeu pelo comentário, Samuca!

    De fato, um evento, mesmo que bastante improvável, acaba acontecendo com certa frequência, quando o número de realizações do experimento que pode ocasioná-lo é grande. Veja o exemplo da aviação: a probabilidade de um aviâo cair é muito, muito baixa, mas de vez em quando tem um acidente, pois o número de vôos comerciais acontecendo no mundo, todos os dias, é muito grande.

    No futuro vou abordar essa sua sugestão, abraço!

    ResponderExcluir
  4. Obrigado, Sandro.

    Se esse blog já existisse durante a Copa, com certeza eu comentaria sobre o Paul, falei muito sobre ele na época...

    Mas vou puxar algum gancho pra falar disso em breve.

    Grande abraço e valeu pela sugestão.

    ResponderExcluir
  5. Lembrei deste post neste final de semana! Cheguei mesmo a indicar para alguns que estavam postando, no facebook, a incrível coincidência da grande quantidade de astros da música que morreram com 27 anos... :D

    ResponderExcluir
  6. Qual a probabilidade de 2 pessoas fazerem aniversário no mesmo dia?

    Me ajude

    ResponderExcluir