Pesquisar este blog

terça-feira, 3 de maio de 2011

A Mega em Cena

Há muitos mitos e curiosidades envolvendo os jogos lotéricos, especialmente a Mega-Sena, o mais famoso deles. Este será um tema recorrente em meu blog, e inicio seu estudo com uma situação curiosa que chamou a atenção de muita gente em outubro de 2010: em um determinado concurso, houve repetição de QUATRO dezenas em relação ao concurso anterior. Seria isso um indício de que o sorteio tem algum vício, privilegiando dezenas que saíram mais recentemente?

Houve na época discussões em alguns fóruns na internet questionando a idoneidade do jogo e até sugerindo que se investigasse o mecanismo de sorteio das dezenas. Surgiu também uma corrente de email, que até hoje circula no meio cibernético, acusando a Caixa Econômica de fraude. Uma mensagem com essa corrente foi repassada a mim há alguns dias, acompanhada da recorrente pergunta, que motivou o nome deste blog: “Qual é a probabilidade disso ocorrer?”.

Confirmei a veracidade da coincidência relatada na mensagem e listo abaixo os concursos onde ela ocorreu, destacando em negrito as dezenas que se repetiram:

Sorteio
Data
Dezenas sorteadas
1225
27/10/2010
32 / 55 / 34 / 31 / 50 / 40
1226
30/10/2010
31 / 55 / 56 / 50 / 40 / 10


É evidente que uma repetição desse tipo causaria espanto quaisquer que fossem os concursos consecutivos envolvidos. Isto poderia ter acontecido, por exemplo, entre os concursos 800 e 801 ou entre os concursos 1240 e 1241. Portanto, deve-se calcular a probabilidade de tal coincidência ter ocorrido em qualquer par de concursos consecutivos na história da Mega-Sena, desde o primeiro, em março de 1996, até o último, de número 1279, realizado em 30/04/2011.

Antes de entrarmos nos cálculos, considere um jogador fictício que tenha apostado em todos os concursos desde o início da história da Mega-Sena até hoje, com um cartão simples de seis dezenas. Será que as pessoas estranhariam o fato de esse apostador já ter feito pelo menos uma quadra (ou seja, ter acertado quatro dezenas) até hoje? Muito provavelmente, não.

Suponha agora que a regra de escolha da aposta desse jogador seja a seguinte: assinalar sempre as 6 dezenas que saíram no concurso imediatamente anterior. Desta forma, a probabilidade dessa pessoa ter feito pelo menos uma quadra até hoje seria a mesma de já ter saído, na história da Mega Sena, quatro dezenas iguais em sorteios consecutivos*. Isto ajuda a entender porque não é tão difícil assim que, em algum concurso, tenha acontecido a coincidência relatada acima.

Calculei as probabilidades de haver, em um concurso específico (por exemplo, o concurso da próxima quarta, dia 04/05/2011), uma repetição de 1, 2, 3, 4, 5 ou 6 dezenas em relação ao concurso imediatamente anterior. Com base nessas probabilidades, calculei a chance de que, em qualquer par de concursos consecutivos ao longo dos 1279 já realizados, tenha ocorrido pelo menos uma vez essas quantidades de repetições (ou uma maior) de um concurso para o outro. Os resultados, cujos cálculos detalhados são mostrados no apêndice desse texto, estão resumidos na tabela abaixo.

Quantidade de dezenas repetidas
Chance de que o próximo concurso (04/05) tenha essa quantidade de dezenas repetidas em relação ao concurso anterior (30/04) (%)
Chance de haver essa quantidade de repetições (ou uma maior) pelo menos
uma vez em concursos consecutivos,
ao longo de 1279 concursos (%)
1
37,90%
100,0000%*
2
9,48%
100,0000%*
3
0,99%
99,9998%
4
0,04%
42,67%
5
0,001%
0,83%
6
0,000002%
0,002%

 * a probabilidade não é exatamente 100%, mas a precisão utilizada pelo EXCEL nos cálculos não foi capaz de distingui-la desse valor.

Note que a chance do próximo concurso repetir 4 ou mais dezenas em relação ao último concurso é de apenas 0,04%. Entretanto, quando se considera a realização de 1279 concursos em sequência, a probabilidade de que isso venha a ocorrer pelo menos uma vez entre dois concursos consecutivos é de 42,67%.

Não é de se estranhar, portanto, que na história da Mega-Sena já tenha ocorrido esta coincidência, e a acusação de fraude no mecanismo de sorteio não tem apoio na teoria da probabilidade.

Mergulhando mais no histórico, notei algo, de fato, curioso: no concurso 309, de 31/10/2001, houve repetição de 5 números em relação ao concurso anterior**. Como também se mostra na tabela, a chance de que isso viesse a acontecer pelo menos uma vez até hoje na história é de apenas 0,83%. É uma chance pequena, mas longe de ser impossível. Se você estiver na classe econômica de um vôo com 120 passageiros e fosse sorteada uma pessoa dessa classe para fazer um upgrade para a classe executiva, seria a mesma chance de você vir a ser a pessoa escolhida.

Para finalizar, observe como as probabilidades muitas vezes não seguem o pensamento intuitivo: somando-se todos os valores na segunda coluna da tabela, verifica-se que a chance de, no próximo concurso da Mega-Sena, haver repetição de pelo menos algum número em relação ao concurso anterior é de 48,41%, ou seja, quase 50%. De fato, um estudo estatístico que fiz com todo o histórico da Mega-Sena (extraído no endereço http://www1.caixa.gov.br/loterias/loterias/megasena/download.asp) mostra que, em 48,16% dos concursos, houve repetição de pelo menos um número em relação ao concurso anterior.  Discutirei este resultado pouco intuitivo em um futuro post.***

Notas:

* Qualquer aposta de seis dezenas tem a mesma probabilidade de ser premiada. Por exemplo, tanto a aposta (1, 2, 3, 4, 5, 6) como a aposta (4, 12, 17, 25, 38, 47, 54) ou a aposta que utiliza as mesmas dezenas do concurso anterior têm a mesma chance de ganhar a quadra, quina ou sena. Isso pode parecer estranho, já que nunca, na história da Mega-Sena, saíram números em seqüência ou a mesma combinação do concurso anterior. Futuramente, discutirei essa questão e apresentarei argumentos que ajudam a entender porque isso é verdade.

** Neste concurso 309, coincidentemente houve o recorde histórico de quinas, com 3001 acertadores, onde se pagou um prêmio de apenas R$122,53 para cada ganhador. O segundo concurso da história com mais ganhadores na quina teve pouco mais da metade (1561) de premiados, mas esse outro concurso teve ainda a seu favor o fato de ter sido o sorteio da “virada” de 31/12/2010, onde o número de apostadores foi mais de 10 vezes superior ao dos concursos regulares. Discutirei também esse fato intrigante em um futuro post.

***Outro problema semelhante, cujo resultado também é bastante surpreendente, é o da quantidade de pessoas que é necessário reunir para que, dentre elas, haja mais de 50% de chance de haver pelo menos duas pessoas aniversariando na mesma data.



Detalhe do cálculo da probabilidade de já ter havido repetição de N ou mais números em sorteios consecutivos, em um total de T concursos já realizados:

Considere o conjunto das 6 dezenas que saíram no concurso anterior. Para que haja N dezenas repetidas em relação a esse concurso, é preciso que sejam sorteadas N dezenas dentro desse conjunto e (6-N) dezenas dentre as 54 dezenas restantes. Portanto, para o próximo concurso, a quantidade de combinações que possuem exatamente N dezenas repetidas em relação ao concurso anterior é dada por CN6 C546-N, e a probabilidade respectiva (pn) será de:

                        PN =( CN6 C546-N / C606),                                    (1)

onde o símbolo Cnk indica o número de combinações de k elementos dentro de um conjunto com n elementos.

Calculando (1) para os valores de N = 1 até 6, a probabilidade de haver pelo menos N dezenas repetidas de um determinado concurso específico para o imediatamente anterior (Pn) é dada pela soma acumulada:

                        PN =(pN + pN+1+...+p6).                                                (2)

Considere agora todos os T concursos já realizados. A probabilidade de que, em todos esses concursos, NUNCA tenha havido pelo menos N dezenas repetidas em relação ao concurso imediatamente anterior será de (1-PN)T-1, já que é preciso que em T-1 concursos NÃO tenha havido essa repetição, cuja probabilidade em cada um dos concursos é de (1-PN).

Finalmente, a probabilidade de que, nestes T concursos, tenha havido pelo menos uma vez uma repetição de N dezenas em relação ao concurso anterior será o complementar da probabilidade calculada no parágrafo acima, ou seja, 1 - (1-PN)T-1. Substituindo, por exemplo, os valores T = 1279 e N = 4 nesta fórmula e em (2), obtém-se o valor de 42,67%.
Obs: o expoente T-1 é devido ao fato de que a repetição só pode ocorrer a partir do concurso de número 2.

12 comentários:

  1. Mais uma vez, arrasou! Que tal um sobre a clássica estratégia de usar os números anteriores da sena para selecionar núemros de aposta?

    ResponderExcluir
  2. Valeu, Sandro, e obrigado pela sugestão. Vou tratar disso daqui a alguns posts, com certeza...

    ResponderExcluir
  3. Muito bom o post!!!
    Um dado curioso, tirando esses sorteios citados por ti, a grande maioria dos resultados dos sorteios, não alcança uma quadra ou quina, antes de ser sorteado como sena. E para tu ter uma idéia, o número de ternos alcançados fica entre 15-20, para daí sim, ser sorteado como sena. Se tu comparar os números do 1º sorteio da mega com os subsequentes, verás que só saiu 1 sena e 15 ternos. Da mesma forma, os números do sorteio 1279, antes de ser sorteado como sena, os resultados são de 17 ternos. Do concurso 1280, além de haver a repetição do número 29, antes de ser sorteado como sena, houveram apenas 10 sorteios em que conseguiu, no máximo, terno.

    ResponderExcluir
  4. Obrigado pela observação, bastante pertinente.

    Veja como esses números são bastante aderentes às probabilidades que mostrei na tabela. Se a chance de fazer o terno é de 0,99% por jogo, em média um jogo simples faria um terno aproximadamanete a cada 100 sorteios. Ou seja, 12,8 vezes até hoje.

    E, como a probabilidade da quadra é de 0,04% por concurso, cada jogo faria, em média, uma quadra a cada 2332 sorteios. Portanto, não é de se estranhar que, até hoje, não tenha saído nenhuma quadra para esses jogos.

    Finalmente, para a quina, a média é de uma a cada 154 mil sorteios, aproximadamente, muito mais difícil ainda.

    ResponderExcluir
  5. Não é por acaso que acertar 3 dezenas não paga nada... O pessoal não é bobo! hehehehe

    ResponderExcluir
  6. André,
    infelizmente sou ruim em matemática, então não repare na pergunta:

    Você escreveu:

    “Mergulhando mais no histórico, notei algo, de fato, curioso: no concurso 309, de 31/10/2001, houve repetição de 5 números em relação ao concurso anterior**. Como também se mostra na tabela, a chance de que isso viesse a acontecer pelo menos uma vez até hoje na história é de apenas 0,83%”

    Quando você diz "até hoje", você está se referindo até o concurso 309 (31/10/2001) ou até algum concurso de 2011?
    O calculo deveria ser feito até o concurso 309, certo?! Ou seja 309 tentativas de a caixa acertar as 5 dezenas?!

    Já no caso das 4 dezenas repetidas, olhando o histórico, (Não estou com a planilha aqui para conferir), mas me parece que isso ocorreu 10 ou 11 vezes até hoje (16/05/2012). Você fez o calculo para uma ocorrência(42,67%) Qual a probabilidade neste caso com este número de repetições?

    E se juntar a probabilidade das 5 dezenas de 2001 (agora puxando até a presente data) com as probabilidades das 4 dezenas repetidas 11 vezes?

    agradeço a atenção.

    ResponderExcluir
    Respostas
    1. Caro Hiro,

      Desculpe a longa demora em responder, estive desligado do blog por um bom tempo e agora estou voltando para responder aos comentários.

      Muito obrigado pelas considerações, seguem as respostas aos seus questionamentos.

      1)O "até hoje" que me referi foi até o sorteio 1279, de quando escrevi o texto. Não fiz até o 309 porque quanto maior o número de concursos já realizados (ou seja, quanto maior o número de realizações do experimento aleatório considerado), melhor será a avaliação se a frequência de determinado evento foge ao esperado do ponto de vista teórico. Ou seja, se um evento muito raro acontecer em uma quantidade pequena de concursos, pode parecer que esse evento não seja tão raro quanto se espera, mas isso só pode ser melhor avaliado quando o número de realizações do experimento aleatório aumentar.

      2) Na verdade, até o concurso 1279 só ocorreu 1 vez o fato de repetir 4 dezenas em concursos sucessivos (assim como o de 5 repetidas). O que já havia ocorrido 10 vezes até o concurso 1279 é a repetição de 3 dezenas consecutivas. A probabilidade dessa quantidade (ou uma maior) de repetições de 3 dezenas já ter ocorrido até o concurso 1279 é de aproximadamente 0,16%.

      Excluir
  7. Achar que 01-02-03-04-05-06 é uma combinação menos provável é um engano de gente simples sem conhecimento de estatística. Estranho é que uma vez saiu uma Scientific American Brasil dizendo exatamente isso.

    ResponderExcluir
  8. Desculpe... vc está errado.
    A probabilidade é a mesma... e
    É sim menos provável do que uma série não sequencial (que tem muito mais ocorrência).

    ResponderExcluir
  9. Nossa seria uma conta que iria muito longe para descobrir qual a probprobabilidadeade um e do outro, mas a probabilidade e muito complicada de se entender se fosse facil todo mundo estaria rico.

    ResponderExcluir
  10. Este comentário foi removido pelo autor.

    ResponderExcluir
    Respostas

    1. A sequencia com os numeros 50 51 56 57 58 59 já cairam juntos uma vez no concurso 2052 e como podemos imaginar niguem chutou só uma casa decimal e a mega sena foi acumulada

      Excluir