Pesquisar este blog

terça-feira, 7 de junho de 2011

Fraudando as Estatísticas

Apesar de ter surgido no século XVII com o objetivo principal de estudar jogos e apostas, a Teoria da Probabilidade - e posteriormente, a Estatística - tem aplicações interessantes nas mais distintas áreas, como Medicina, Criptografia, Esportes, Atuária, Psicologia, entre muitas outras. Neste post, mostrarei como ela já pode ser aplicada na prática para estudar fraudes em balanços financeiros1.

Nos Estados Unidos, em 2003, um jovem empreendedor chamado Kevin Lawrence levantou 91 milhões de dólares em investimentos para criar uma cadeia de fitness clubs. Entretanto, ao invés de utilizar o dinheiro dos investidores exclusivamente para este fim, boa parte do dinheiro foi utilizada na compra de bens pessoais. Nos balanços financeiros da recém criada empresa, ele precisou inventar uma série de compras e transações financeiras envolvendo outras empresas de fachada, para dar a impressão de que o negócio estava em plena evolução.

Tudo ia aparentemente bem, até que um contador resolveu realizar uma comparação entre as freqüências em que cada algarismo (de 1 a 9) aparecia no primeiro dígito dos valores desses balanços e as freqüências determinadas pela chamada “Lei de Benford”2. Segundo esta lei, existe um padrão logarítmico na freqüência em que cada algarismo aparece no primeiro dígito (à esquerda) de valores associados a muitos fenômenos naturais e humanos, tais como comprimentos de rios, populações de grandes cidades, circulações de jornais, e balanços financeiros. A freqüência aproximada de cada algarismo é mostrada na tabela abaixo:

Algarismo
1
2
3
4
5
6
7
8
9
Frequência
30,1%
17,6%
12,5%
9,7%
7,9%
6,7%
5,8%
5,1%
4,6%

Percebe-se que a freqüência diminui progressivamente à medida que o valor do algarismo aumenta. Há também padrões para as frequências de cada algarismo no segundo, terceiro e demais dígitos (sempre da esquerda para a direita) dos valores associados aos fenômenos mencionados acima, no entanto esses padrões são menos notáveis em relação ao do primeiro dígito.

Testes estatísticos aplicados na análise de mais de 70.000 valores que constavam nos cheques e transações bancárias de Kevin Lawrence rejeitaram a hipótese de que os algarismos seguissem a lei de Benford, o que indicava a fraude no balanço. Ou seja, havia um forte indício de que os números do balanço não teriam sido originados de forma natural, fruto de transações financeiras reais, mas sim teriam sido gerados artificialmente. É evidente que, do ponto de vista jurídico, essa constatação não seria suficiente para condenar Kelvin, mas ela foi a motivação inicial para se realizar uma investigação que culminou com sua condenação a 20 anos de prisão. Além da fraude em si contra os investidores, um grande erro de Kelvin foi fraudar também as estatísticas associadas ao estudo das probabilidades.

De forma a também comprovar empiricamente a lei de Benford, realizei o mesmo tipo de análise nas minhas transações bancárias e itens da fatura de meus cartões de crédito em um período de até 6 meses. O histograma abaixo compara as freqüências em que cada algarismo aparece no primeiro dígito dos valores nas minhas contas com as fornecidas pela lei de Benford.


Devido ao aspecto aleatório, os dois histogramas jamais serão idênticos, mas percebe-se uma grande semelhança nos seus perfis. Para se ter uma análise quantitativa global das diferenças entre as freqüências dos algarismos nos dois casos, realizei um teste estatístico do tipo qui-quadrado. Seu resultado indicou uma probabilidade de 1,08% de se encontrarem discrepâncias semelhantes ou maiores do que as verificadas, na hipótese nula dos primeiros dígitos nas minhas contas seguirem a lei de Benford. Essa hipótese seria então rejeitada pelo nível de significância clássico de 5% em Estatística, porém não seria descartada caso um nível mais conservador de 1% fosse adotado. De qualquer forma, as freqüências de cada algarismo no primeiro dígito de minhas transações financeiras não diferem muito do padrão ditado pela lei de Benford.

Há muitas outras situações na história em que a lei de Benford pode ser empregada. Em meados de 1920, os organizadores de uma loteria clandestina no bairro de Harlem, Nova York, necessitavam de um gerador de números aleatórios para determinar os números que seriam sorteados em seu jogo. Decidiram tomar como base os dígitos do saldo do tesouro do governo americano publicado oficialmente, acreditando que a freqüência em que cada algarismo aparecia nesses valores fosse totalmente aleatória. Entretanto, os contraventores ignoraram a lei de Benford, e um apostador dessa loteria que a conhecesse poderia concentrar suas apostas nos algarismos de menor valor, tendo maiores chances de vitória que os demais.

A lei de Benford tem originado um número grande de publicações (vide o site http://www.benfordonline.net/) e tem sido considerada uma ferramenta útil para a identificação de fraudes em balanços financeiros3. Em 1995, um escritório de advocacia no Brooklyn, Nova York, a utilizou para checar fraudes em operações de diversas empresas4. Esta lei foi utilizada também para examinar 30 anos de declaração fiscal do ex-presidente americano Bill Clinton. Os números passaram no teste. Não seria interessante fazer o mesmo tipo de análise nas contas do Palocci?


1 Alguns exemplos citados neste texto foram retirados do ótimo livro de Leonard Mlodinow, “The Drunkard´s Walk – how Randomness Rules our Lives”.  Este livro foi lançado no Brasil com o nome “O andar do bêbado”, pela editora Zahar.

2 Esta lei foi sugerida inicialmente em 1881 por Newcomb (“Note on the frequency of use of the different digits in natural numbers”, publicado na  American Journal of Mathematics), ao perceber que as páginas dos livros de logarítmicos estavam mais gastas na consulta de algarismos de menor valor. Posteriormente, esta lei foi demonstrada de forma empírica em 1938 por Frank Benford (“The law of anomalous numbers”, publicado na Proceedings of the American Philosophical Society).

3 Entretanto, tal análise deve ser realizada com cautela, pois pode haver outros fatores – que não propriamente fraude –  que façam com que a distribuição dos algarismos do primeiro dígito não sigam a lei de Benford. Este aspecto é discutido por Andreas Diekmann e Ben Jann no trabalho “Benford’s Law and Fraud Detection: Facts and Legends”, publicado em 2010 na revista German Economic Review, volume 11, nº 3, pág. 397–401.

4 Estudo reportado por B. D. Burns, professor da Universidade de Sidney, em “Sensitivity to Statistical Regularities: People (largely) follow Benford’s law”.

2 comentários:

  1. Andei afastado, mas to de volta! O texto está excelente, como sempre! Só discordo da distribuição dos dígitos da sua conta... Um professor/pesquisador só deve ter 9 na conta... :D

    A idéia do Pagliacci... Quer dizer, do Palocci, também é ótima!

    ResponderExcluir
  2. O P é muito I... ele conhece a lei Benford... não daria essa touca :D

    ResponderExcluir