A mesma estrutura de códigos une sequências de DNA e comunicação digital
© PASIEKA / SCIENCE PHOTO LIBRARY / SPL DC / Latinstock
“A teoria da informação é uma ferramenta adequada para o intercâmbio com a biologia molecular, diz Gérard Battail“
Explicar os fenômenos da natureza com equações matemáticas é uma tarefa rotineira e incorporada aos estudos da física, da química e da própria matemática. A biologia tem uma tradição menor nesse sentido. Essa relação é perseguida por vários grupos de estudo na Europa e nos Estados Unidos que buscam uma vinculação dos genomas de seres vivos com estruturas matemáticas para tentar compreender melhor a formação da vida no planeta. Mas a primazia de encontrar tal vínculo coube a um grupo de pesquisadores da Universidade Estadual de Campinas (Unicamp) e da Universidade de São Paulo (USP) que encontraram uma relação matemática entre um código numérico e a sequência do DNA, a sigla em inglês do ácido desoxirribonucleico que carrega os genes dentro das células. Outros pesquisadores já haviam sugerido essa relação, mas não conseguiram provar. Os brasileiros descobriram que as bases nitrogenadas timina (T), guanina (G), citosina (C) e adenina (A) se organizam segundo uma lógica numérica. “A distribuição dessas bases possui um código matemático que prevaleceu ao longo da evolução dos seres vivos”, diz o professor Márcio de Castro Silva Filho, da Escola Superior de Agricultura Luiz de Queiroz, da USP. “Descobrimos que uma proteína ao perder a função biológica devido a uma mutação, por exemplo, deixa de ser representada por uma estrutura matemática”, diz Silva Filho, um dos coordenadores do grupo.
Os pesquisadores não desenvolveram um código novo para explicar a sequência do DNA. Eles verificaram que existe uma relação entre certas sequências de DNA com o código corretor de erros (ECC, sigla de error-correcting code), que são equações matemáticas utilizadas em todo processo digital, usado em sistemas de comunicação e de telecomunicações, em memórias de computador e memórias flash de pen-drives para corrigir ruídos ou defeitos que surjam nas transmissões. O código também é conhecido pelas letras BCH, que são as iniciais de seus descobridores – os indianos Raj Chandra Bose e Dwijendra Kumar Ray-Chaudhuri e o francês Alexis Hocquenghem –, e não apenas identifica o erro mas também faz a correção. A atribuição da associação de códigos de correção de erros com sequências de DNA não é nova. É objeto de pesquisa desde a década de 1980 e um dos principais estudiosos é o professor Hubert Yockey, que trabalhou na Universidade da Califórnia em Berkeley, nos Estados Unidos, e publicou dois livros: Information theory and molecular biology, em 1992, e Information theory, evolution, and the origin of life, em 2005, ambos editados pela Cambrigde University Press. Outro pesquisador da área é Gérard Battail, professor aposentado da Escola Nacional Superior de Telecomunicações, da França, que tem escrito artigos propondo a relação entre código corretor de erros e o genoma. Eles têm demonstrado o processo e levantado hipóteses, mas não apresentaram as relações matemáticas com o DNA. Os brasileiros conseguiram estabelecer essa relação nas sequências do ácido ribonucleico mensageiro (RNAm) que geram as proteínas.
“Ao conhecermos a estrutura matemática da proteína é possível alterar a ordem das bases e também corrigir as mutações ou erros que possam acontecer para voltar à condição normal de uma proteína”, diz o professor.
Problema molecular – A capacidade de corrigir uma mutação ou um erro celular poderia, por exemplo, no futuro utilizar uma solução matemática para atuar sobre a falta de produção de insulina pelas células do pâncreas, corrigindo erros em um gene específico. “Seria possível identificar a estrutura matemática das mutações e onde elas ocorreram e talvez corrigir esse problema molecular para o organismo voltar a produzir insulina, revertendo as estruturas anteriores. Outra possibilidade seria fabricar proteínas a partir do código matemático ou ainda encontrar proteínas não conhecidas existentes nas células”, diz o professor Reginaldo Palazzo Júnior, da Faculdade de Engenharia Elétrica e de Computação (Feec) da Unicamp, outro coordenador do grupo. “A correção ou a forma de reverter o erro nas células acontece da mesma forma que num disco rígido (HD), que tem um setor danificado e o ECC reconstitui as informações.”
Com tantas possibilidades de uso na indústria, além do significado científico importante da descoberta, os pesquisadores resolveram, antes de publicar a novidade em periódicos científicos, depositar uma patente internacional pelo Tratado de Cooperação em Patentes (PCT, na sigla em inglês), em vários países, e outra nos Estados Unidos, com financiamento da FAPESP e gerenciamento da Agência de Inovação da Unicamp e da Agência USP de Inovação. Laboratórios do mundo poderão usar, se licenciarem a patente, as estruturas matemáticas descobertas pelo grupo, possivelmente na forma de um software, para testar proteínas em um amplo leque de produtos. “Essas informações são importantes para desenvolver vacinas, medicamentos ou proteínas para elaboração de queijos e amaciantes de roupa, por exemplo”, diz o professor Silva Filho. Hoje se faz uma alteração na sequência de DNA que codifica uma proteína e depois são feitos os testes em laboratório para verificar a eficácia da reação num experimento de tentativa e erro. Com as equações matemáticas será possível testar a afinidade e a estabilidade da proteína em um trabalho preliminar de forma a verificar mutações e, posteriormente, testá-las a partir de experimentos de laboratório para confirmar se a mutação na sequência de DNA deu o resultado esperado. “Se a estrutura matemática não se mantiver, a alteração não vai ser efetivada e não produzirá os resultados esperados.”
(Fasesp - Marcos de Oliveira)
0 Comentários
Olá, agradecemos sua visita. Abraço.