terça-feira, 4 de junho de 2019

O Teorema do Macaco Infinito

O teorema do macaco infinito afirma que um macaco digitando aleatoriamente em uma máquina de escrever por toda a eternidade reproduz qualquer texto já escrito na cultura humana e reproduz até os textos ainda não escritos.

Esse teorema de autor desconhecido, se fundamenta no lema de Borel-Cantelli da teoria das probabilidades e num artigo clássico de Émile Borel onde a metáfora do macaco foi mencionada pela primeira vez. 

O referido lema garante que qualquer coisa que tem uma chance ínfima de ocorrer por acaso vai ocorrer com certeza se for tentada um número infinito de vezes. 

Algumas formulações do teorema admitem vários macacos com várias máquinas de escrever. Portanto, a forma específica de apresentação, não muda o argumento central.

Uma ideia semelhante foi desenvolvida por Jorge Luis Borges no seu conto fantástico "Biblioteca de Babel", sobre uma biblioteca cabalística existente ab aeterno que comporta todo o conhecimento humano do passado, do presente e do futuro na forma de coleções de livros com todas as cadeias de caracteres imagináveis.

O significado do teorema não é que podemos obter Hamlet aleatoriamente, bastando deixar muitos macacos digitando por um tempo suficiente. Nada poderia ser mais irracional do que essa conclusão precipitada e fora de contexto.

Vamos calcular o número de teclas que devem ser pressionadas, para termos no mínimo uma chance de acertar a sequência correta dos primeiros vinte símbolos de Hamlet.

27^20 (vinte e sete na potência vinte)  = 42.391.158.275.216.203.514.294.433.201 textos possíveis

42.391.158.275.216.203.514.294.433.201 textos possíveis
             x 
20 teclas\texto  =
847.823.165.504.324.070.285.888.664.020 
teclas que devem ser pressionadas aleatoriamente

Se uma tecla for pressionada por segundo, um macaco levaria 847.823.165.504.324.070.285.888.664.020 segundos para produzir todas as combinações, ou seja, levaria 26.884.296.217.158.931.706.173 anos, um tempo que é aproximadamente 1,9 trilhões de vezes maior do que a idade do universo de 13,7 bilhões de anos.

Logo, os primeiros 20 símbolos do texto de Hamlet não podem ser obtidos por acaso, nem que os macacos fossem imortais e digitassem compulsoriamente sem descanso desde o Big Bang (o texto completo é ainda mais difícil). 

E isso nada tem a ver com as limitações do nosso poder computacional, como muitos sugerem erroneamente na internet. Digitar mais rápido ou multiplicar o número de digitadores não faz diferença alguma, pois nenhuma dessas coisas permite computar o infinito.

A probabilidade de milhões de macacos digitarem um trabalho completo como o Hamlet de Shakespeare é tão pequena que a chance de ocorrer durante um período de tempo de trilhões de ordens de magnitude maior do que a idade do universo é extremamente baixa.

A prova do teorema é realizada diretamente pela teoria estatística ou indiretamente por softwares de demonstração como o Demonstration Wolfram Project, cujo link indico no final do post.

O Macaco Infinito e os dígitos de PI

Os primeiros vinte dígitos de PI
3,1415926535897932384626433832...

Se PI é um número normal de Borel, então a distribuição dos seus dígitos depois da vírgula não segue nenhuma lei especial e a ocorrência de qualquer dígito é equiprovável em qualquer base de numeração. 

Vamos supor que PI é um número normal de Borel. E vamos supor o texto simplificado de Hamlet com os 26 caracteres latinos e o espaço em branco, sem os sinais de pontuação.

Segundo o lema de Borel-Cantelli, podemos encontrar o texto completo de Hamlet na expansão dos dígitos de PI. Basta utilizar uma base de numeração que suporte os caracteres alfabéticos e o espaço em branco, como a base de numeração 27 proposta no projeto do site ATRACTOR.

Base de numeração 27
0 1 2 3 4 5 6 7 8 9 
A B C D E F G H I J K L M N O P Q
https://www.atractor.pt/mat/fromPI/pib27.html

O passo final seria procurar o texto no meio da sequência binária da expansão de PI. O que não é uma tarefa fácil, mesmo com o conhecimento de mais de 31,4 trilhões de dígitos de PI que foram obtidos pela japonesa Emma Haruka Iwao no último recorde mundial registrado no Guinness Book. O lema diz que o texto de Hamlet deve estar em alguma parte dos dígitos de PI, mas não diz onde.

Encontre palavras nos dígitos de PI
https://www.atractor.pt/mat/fromPI/PIalphasearch.html

O texto completo de Hamlet pode aparecer somente depois de 50 trilhões de dígitos ou apenas a metade do texto pode aparecer depois de 100 trilhões de dígitos, não sabemos. 

Pense em todas as possibilidades, sobre o texto integral, sobre as partes do texto, o texto ao contrário, frases em ordem invertida e qualquer outra transposição maluca de caracteres ou traduções para outros idiomas.

Além disso, como vocês devem ter suspeitado, os macacos infinitos também podem reproduzir os dígitos corretos do número PI. Seria fácil para essa equipe fabulosa realizar tal façanha e sempre marcar presença no livro dos recordes.

Infelizmente, nunca veremos os seus nomes publicados nos livros dos recordes porque os macacos infinitos não existem. : )

A Simulação da Seleção Natural

Richard Dawkins, num livro bem interessante publicado em 1986, nos mostrou como a evolução darwiniana baseada na seleção natural é bem diferente do puro acaso. 

Utilizando um truque chamado de seleção cumulativa, ele se dedicou a testar suas ideias num programa de computador compilado em Basic e depois em Pascal, usando um trecho curto de Hamlet com 28 caracteres: Methinks it is like a weasel (Acho que parece uma doninha)

A seleção cumulativa memoriza os caracteres certos do texto base sempre que uma replicação aleatória da cadeia de caracteres é produzida pelo computador.

Segundo ele, o computador levou 11 segundos para obter o texto correto de 28 caracteres, usando a seleção cumulativa. Caso fosse usada a seleção aleatória de um só passo o computador levaria mais do que a idade do universo, mesmo com os melhores computadores atuais.

O argumento ilustra como a seleção natural é o motor evolucionário da vida, pois o acaso puro demanda quantidades incomensuráveis de tempo para produzir qualquer estrutura biológica complexa.

Dawkins foi um dos pioneiros no uso de algoritmos genéticos, tendo inclusive inventado o programa de computador O Relojoeiro Cego (o mesmo título do livro), para simular a seleção natural biológica.

Conforme essa lógica, um olho não se forma sozinho de forma randômica na natureza, porém esse órgão complexo e funcional é formado numa série de passos evolucionários ao longo das eras pela seleção natural. 

A prova da versão fake do teorema 

A versão fake do teorema do macaco infinito, alega:
Milhões de macacos digitando ao acaso, podem eventualmente digitar as obras de Shakespeare num tempo finito e dentro do tempo de vida de um supervisor humano comum (que checa e valida o que é digitado pelos macacos). 

Nessa versão equivocada, bastante disseminada na internet, qualquer pedaço de palavra digitado aleatoriamente e que se encaixa com o texto base é selecionado e fica de fora da randomização. 

Acontece que essa trapaça não é nova, é o mesmo artifício que Richard Dawkins propôs no seu livro O Relojoeiro Cego, para explicar de forma didática aos proponentes do Design Inteligente, como a evolução biológica difere radicalmente da aleatoriedade pura. 
Então é falso que o Teorema do Macaco Infinito foi provado na prática pelo programador Jesse Anderson após ele se inspirar num episódio dos Simpsons com salas cheias de milhões de símios digitando em máquinas de escrever.
                     
Anderson parece não entender que a paródia dos Simpsons faz piada com a impossibilidade de obter uma obra literária a partir do acaso na prática, levando ao ridículo o Sr. Burns ou qualquer outro que tentasse fazer a mesma coisa. 

Nas palavras de Jesse Anderson fica clara a sua confusão: "A piada é uma brincadeira com a teoria de que um milhão de macacos com um milhão de máquinas de escrever eventualmente produzirá Shakespeare. E foi isso que eu fiz. Eu criei milhões de macacos na nuvem da Amazon e os coloquei em máquinas de escrever virtuais (aka  Teorema do Macaco Infinito)."
http://www.jesse-anderson.com/2011/08/a-few-more-million-amazonian-monkeys/

A pegadinha é que não existe nenhuma teoria que um milhão de macacos com um milhão de máquinas de escrever eventualmente produzirá Shakespeare. Essa proposição apenas alude ao comentário do matemático francês Émile Borel num artigo clássico de 1913 intitulado "Mécanique Statistique et Irréversibilité". 

No texto, Borel menciona ironicamente a chance de um milhão de macacos digitadores produzirem todos os livros das melhores bibliotecas do mundo, somente para ilustrar que improbabilidades como essa equivalem ao impossível. 

"É mais fácil dizer que essas improbabilidades ​​são puramente impossíveis." 
Émile Borel, "Mécanique Statistique et Irréversibilité", Journal of Physics, 5(3), 1913, páginas 189–196.

Essa anedota da internet é uma demonstração contundente da importância do contexto em qualquer análise crítica da informação, no contexto correto do teorema do macaco infinito a palavra eventualmente significa nunca! Nunca no nosso universo físico ordinário.

Já noutro contexto, o contexto da falta de rigor, da autopromoção midiática, da galhofa e do histrionismo delirante da internet a palavra eventualmente é uma chance capciosa para "provar" algo impossível.

Assim, a paródia apresentada nos Simpsons pode no máximo ser chamada de engodo do macaco finito. Com o seu projeto de bots na nuvem da Amazon, o programador provou a paródia, não o teorema.

E muitos internautas foram enganados pela repercussão do alarde dessa "prova" na internet em 2011, sendo que nem a ideia para acelerar o processo é original. Richard Dawkins implementou  a ideia em 1986 num computador Macintosh primitivo, antes de criar o seu programa de simulação da seleção natural.

A notícia distorcida e seus múltiplos click baits em sites brasileiros não passa de uma fake news de matemática. Pelo visto nem a matemática escapa desse tipo de notícia e isso prova sem sombra de dúvida que muitas pessoas não entendem o sarcasmo dos Simpsons.

Para saber mais:

Meta Mat!, Gregory Chaitin
O Relojoeiro Cego, Richard Dawkins

A Biblioteca de Babel, Jorge Luis Borges
http://agrutadolou.com.br/livros/Biblioteca%20de%20Babel.pdf
Demonstração do Teorema do Macaco Infinito
http://demonstrations.wolfram.com/InfiniteMonkeyTheorem/

6 comentários:

  1. Ótimo artigo, esclarece bem a questão. O americano Jesse Anderson não fez sua lição de casa, não fez a análise crítica da informação, além de interpretar erroneamente o que leu sobre o tema. Realmente triste ver brasileiros aplaudindo tamanha falácia só por ele ser americano, típico num país onde o conhecimento é totalmente desvalorizado. O melhor de tudo é que mesmo assim o conhecimento não perde a sua importância ou sua força para mudar realidades. Prova que precisamos buscar os fundamentos do que estamos lendo, vendo ou ouvindo. O Brasil já está cheio de reprodutores de informações falsas, tudo o que não precisamos é que um americano venha fazer isso em solo brasileiro.

    ResponderExcluir
    Respostas
    1. Pois é, ele esqueceu de levar em conta a Física e foi totalmente contra o espírito do argumento do teorema.

      Quando Borel mencionou a metáfora dos macacos em 1913, ele visava macacos que existem no universo físico real, é isso que se interpreta pela leitura do texto dele. E no universo físico produzir por acaso qualquer obra literária é impossível.

      Provavelmente um matemático espirituoso, teve a ideia de imaginar um "macaco infinito" ideal e não-físico, que não se cansa nunca, que é imortal e que ultrapassa a duração do universo para brincar com o dito de Borel. Assim surgiu o teorema.

      O fato de algo ser possível matematicamente, não significa que é possível fisicamente. Essa é a pegadinha.

      Matematicamente, existe uma chance não nula de reproduzir os textos de Shakespeare por acaso, mas fisicamente é impossível, nem recorrendo a bots de computador ou processadores super velozes.

      Excluir
  2. As questões levantadas com o teorema do macaco infinito são bem sérias e são pertinentes para a reflexão filosófica sobre as diferenças que existem entre a realização matemática e a realização física.

    As leis da física acrescentam uma camada de "lógica física" que restringe o formalismo da matemática pura.

    ResponderExcluir
  3. Vim parar aqui graças a imagem do macaco, procurando ela pelo Google, uma imagem que me representa de maneira profunda.

    ResponderExcluir
  4. Vim parar aqui graças a imagem do macaco, procurando ela pelo Google, uma imagem que me representa de maneira profunda.

    ResponderExcluir