domingo, 13 de fevereiro de 2011

De novo, o grande bla bla blá

O caderno “Ciência” da Folha de S. Paulo , em 11 de fevereiro, trouxe reportagem com o título “DNA individual tem mais dados que todos os HDs”. A matéria reporta-se a artigo publicado na revista Science, que analisou os dados produzidos e armazenados entre 1986 e 2007, tanto em meios analógicos (livros, fitas VHS, discos de vinil, etc.) quanto digitais (HDs, CDs, DVDs, dentre outros). Os cientistas chegaram à conclusão que em 2007 todos os dados armazenados pela humanidade chegaram ao montante de 295 exabytes (ou 295 bilhões de gigabytes). Isso equivale, ainda segundo a reportagem, a 314,1 bilhões de músicas em MP3 ou a um 1,8 bilhão de horas de vídeo com qualidade de DVD. Disso tudo, 94% estariam armazenados em formato digital.

A matéria não dá muitos detalhes sobre o grau de redundância que há nisso tudo, isto é, quanto do material analisado não seria mera cópia de outros dados. Diz apenas que “ (...) devido à grande quantidade de fontes, os pesquisadores não se preocuparam se as informações eram inéditas ou repetidas”. Informa, todavia, que “(...) para uniformizar a medição, os cientistas fizeram algo parecido com os softwares de compactação de arquivos – como os do tipo ZIP: diminuíram o tamanho dos arquivos retirando os trechos redundantes das mensagens”.

Em outras palavras, aplicada essa metodologia, os bytes de poemas como “No meio do caminho” de Carlos Drummmond, ou “Kipling revisitado”, caracterizados justamente por uma alta repetição vocabular, necessariamente são muito reduzidos. Um plágio deles, por outro lado, é considerada informação nova.

De qualquer modo, desconsideradas as limitações naturais que há em qualquer abordagem meramente matemática da informação, os números levantados são acachapantes. Minha pobre cabeça não consegue lidar com eles. Todavia, ainda assim, sempre de acordo com a mesma reportagem, há cerca de cem vezes mais informação codificada no DNA humano que em todos os sistemas de armazenamento criados até 2007. Mantida a atual taxa de crescimento, apenas por volta de 2039 a humanidade conseguiria atingir a marca que a natureza imprimiu ao DNA.

Vejam só o espanto: se, até a mesma data, uma equipe de bioinformática conseguisse transcrever, na forma de um programa de computador, as mesmas informações contidas no DNA, tal programa teria tanta informação quanto toda aquela que os pobres homens teriam conseguido armazenar até então! Decodificar todo o genoma humano seria, então, fazer um mapa borgeano, tão completo que pode não servir para nada?

A respeito disso, a Folha informa que "(...) os cientistas ainda debatem se toda a informação contida no DNA humano é fundamental para construir e mantero organismo. Pesquisadores propuseram o conceito de ´DNA lixo´, resquícios no genoma que não serviriam para nada, mas ele tem sido bastante atacado".

Vejam só. Esse "lixo" é redundância ou informação supostamente inútil, "ruído". Como saber? As repetições vocabulares de Drummond e Paes contribuem para dar vida aos seus poemas. Sem elas, a mensagem se perde. Como dar conta disso, de verdade? No meio de tantos dados do DNA, como fazer a exegese "correta"?

Em 23 de março de 2009, portanto há quase dois anos, estimulado por uma nota rapidamente lida na publicação de bordo da TAM, publiquei um comentário sob o título “O grande bla bla blá”. Naquela ocasião, dizia-se que toda a informação digital a ser produzida até 2010 deveria equivaler a 75 pilhas de livros entre a Terra e o Sol. Agora, o artigo da Folha fala que, se toda a informação produzida até 2007 fosse colocada em uma pilha de CDs, ela equivaleria à distância da Terra à Lua. Quem tiver tempo, pode confrontar os dados, para verificar se “batem”...

Nessa coisa toda, não se computaram os bilhetes em portas de geladeira, os recados com batom nos espelhos de banheiro, os poemas xerocados distribuídos em portas de teatros, as cartas dos suicidas, os CDs riscados que alguém vai recuperar, as pobre gravações que candidatos a artistas sertanejos vendem nos botecos de Brasília.

"É o primeiro trabalho a quantificar como seres humanos lidam com a informação". Segundo a Folha é o que teria dito Martins Hilbert, da Universidade da Carolina do Sul, líder do estudo. Interessante, sem dúvida. Esse não deixa de ser o velho e bom sonho da Teoria Matemática da Informação. Mas é preciso qualificar também como esses mesmos seres humanos lidam com essa informação - inclusive como apanham dela, como se perdem em seus meandros e ainda como do lixo fazem brotar obras de arte e conhecimento novo. E esse é um trabalho de Sísifo.

Dá um certo cansaço. Sei agora que meu quinhão em todos os dados armazenados pela humanidade equivaleria a cerca de 61 CDs. Como tenho pelo menos vinte vezes isso, sem contar DVDs, livros e acesso à Internet banda larga e à TV a cabo, sou uma pessoa bem informada? Por que diabos não escrevi, então, um novo Ulisses?

Num CD do Sérgio Mallandro, se eu o tivesse, encontraria tanta informação quanto num LP, digamos, de John Coltrane ou da Badi Assad?

Acho que vou ler o último livro do Gullar. Ou um haikai de Bashô.

Nenhum comentário:

Postar um comentário