Hereditariedade
Este texto reproduz o capítulo 8 do livro de César Benjamin “Além de Darwin: ensaio sobre ciência e vida”. (Rio de Janeiro, Contraponto Editora, janeiro de 2024)
78. Durante muito tempo, a hereditariedade foi mais um problema prático de agricultores e criadores de animais do que um objeto de pesquisa acadêmica. Sem compreendê-la, o darwinismo permaneceu incompleto, mesmo depois da síntese moderna. A solução do enigma demandou muito tempo: começou com a descoberta de um ácido nucleico e foi até a compreensão da síntese das proteínas, quase cem anos depois, com a criação da biologia molecular nesse ínterim. Foi um dos maiores desafios intelectuais da ciência, vencido com a participação de gerações de pesquisadores, muitos passos intermediários e diferentes técnicas. Nesse processo, a biologia do século XX se consolidou como um grande empreendimento coletivo, assim como ocorrera com a física.
Em 1869, estudando a fecundação, Johann Friedrich Miescher encontrou um ácido que estava presente em todos os núcleos celulares de plantas e de animais, que denominou “nucleína”. Ele não dispunha da química necessária para compreendê-lo, mas percebeu sua importância: “Minha histoquímica é apenas um trabalho preliminar. […] Cheguei a um fator novo, válido tanto para a vida dos organismos inferiores quanto para a dos superiores.”81 Espantosamente, a função desse ácido, adiante denominado nucleico, só foi estabelecida oitenta anos depois.
Em 1920, verificou-se que há dois tipos de ácidos nucleicos – RNA e DNA –, ambos formados por sequências de quatro compostos nitrogenados básicos. Adenina (A), guanina (G) e citosina (C) repetem-se nos dois casos, enquanto o uracilo (U) aparece no RNA e a timina (T) no DNA. Boa parte da química elementar de ambos foi estabelecida nessa época. No primeiro momento, afastou-se a possibilidade de que fossem portadores da informação genética, pois têm poucos componentes, o que aparentemente impossibilitava que pudessem conter as especificações de um organismo completo. As pesquisas sobre hereditariedade continuaram a se concentrar nas proteínas, muito mais complexas, variadas e versáteis, presentes em todos os tecidos vivos e participantes de quase todos os processos vitais. Muitos hormônios, como a insulina, são moléculas proteínicas; a hemoglobina, os anticorpos, a maioria dos antígenos e as enzimas, também. Em 1939, Linus Pauling e Carl Niemann demonstraram que elas são longas cadeias de aminoácidos. A importância da hereditariedade parecia demandar a complexidade das proteínas, em mais uma associação intuitiva, supostamente evidente, mas equivocada. Para lembrar Bachelard, um obstáculo epistemológico.
79. Sem se conhecerem, Erwin Schrödinger e Oswald T. Avery produziram paralelamente, em 1944, duas abordagens decisivas, mas completamente diferentes, sobre o problema da hereditariedade – uma teórica e especulativa, baseada na física; outra experimental e prática, baseada na química.
Schrödinger escreveu Que é vida?, um pequeno livro que introduziu conceitos novos e inspirou uma geração de cientistas de diversas áreas a se voltar para os organismos vivos. Físicos jovens – como Max Delbrück, Francis Crick e Maurice Wilkins, futuros ganhadores do Prêmio Nobel – foram atraídos para essa área. Crick viu duas lições fundamentais no livro: (a) era possível pensar os problemas biológicos em termos físicos; (b) aproximavam-se descobertas importantes em biologia. Em 1947, ao solicitar uma bolsa de estudos ao Medical Research Council, escreveu:
O domínio que me interessa é a linha divisória entre os organismos vivos e a matéria inerte, tipificada, por exemplo, nas proteínas, nos vírus, nas bactérias e na estrutura dos cromossomos. A meta é descrever essas atividades em termos de suas estruturas, ou seja, da distribuição espacial dos átomos que as constituem. Isso pode ser denominado físico-química da biologia.82
Schrödinger foi certeiro em concentrar a atenção em dois temas essenciais, com um olhar mais físico que biológico: o mecanismo da hereditariedade, que denominou “criação de ordem a partir da ordem”, pois os organismos surgem sempre de organismos anteriores, e a manutenção das estruturas corporais organizadas, ou “criação de ordem a partir da desordem”, que denominou “neguentropia”, ou entropia negativa. A referência implícita à termodinâmica não foi casual: há muito se sabia que a organização e o desenvolvimento dos organismos são uma aparente inversão da entropia em partes mínimas do Universo. Schrödinger viu como isso se tornava possível: “O estratagema que o organismo usa para se manter estacionário em um nível bastante alto de ordenação (= nível bastante baixo de entropia) consiste em sugar continuamente ordenação do ambiente.”83
80. Diferentemente de Mendel, Schrödinger não tratou o gene como uma unidade algébrica, mas como uma substância física que devia abrigar “um código compactado de instruções hereditárias”. Os cromossomos, escreveu, “contêm, em algum tipo de código-instrução, o padrão completo do futuro indivíduo”.84 O material da hereditariedade não poderia ser formado por cristais, com suas estruturas moleculares rígidas e monótonas, em que toda informação está contida em uma única unidade que se repete, pois uma estrutura assim não poderia codificar um organismo. Se a transmissão da informação fosse inflexível demais, a vida permaneceria estagnada nas suas formas primitivas, incapaz de se adaptar a ambientes cambiantes, ou evoluiria muito mais lentamente, de modo que nós não estaríamos aqui. Por outro lado, se o material estivesse inserido em sistemas fluidos e amorfos, a informação original logo se perderia em transmissões intergeracionais instáveis, inviabilizando a continuidade da mensagem. Era preciso encontrar um cristal aperiódico dotado de estruturas suficientemente ordenadas (para abrigar de modo confiável um código microscópico) e suficientemente irregulares (para conter muita informação). A natureza das interações moleculares impediria que a reprodução de uma célula fosse absolutamente precisa. Os efeitos quânticos produziriam flutuações, com mudanças discretas, e a seleção natural escolheria as mutações favoráveis, conforme Darwin previra. O armazenamento da informação, por sua vez, deveria depender menos da quantidade de componentes desse cristal e mais de suas possibilidades de recombinação. Ouçamos o próprio Schrödinger:
Muitas vezes nos perguntamos como uma matéria tão diminuta, como o núcleo de um ovo fertilizado, pode conter um complexo texto codificado, capaz de especificar todo o futuro desenvolvimento de um organismo. Uma associação bem ordenada de átomos, dotada de resistibilidade suficiente para conservar sua ordem, parece ser a única estrutura material capaz de oferecer uma variedade de disposições suficientemente grande para incorporar um complicado sistema de determinações dentro de estreitos limites espaciais. O número de átomos dessa estrutura não precisa ser muito grande para produzir um número quase ilimitado de disposições possíveis. Pensemos no código Morse. Os dois sinais, ponto e traço, em grupos ordenados de até quatro, permitem trinta especificações diferentes. Se fosse possível contar com só mais um sinal, usando-se grupos de até dez, seria possível formar 88.572 ‘letras’ diferentes. Com cinco sinais e grupos de até 25, o número de ‘letras’ chegaria a 372.529.029.846.191.405.85
81. O conceito de código contribuiu decisivamente para afastar a ideia de que só as moléculas maiores e mais diversificadas, como as proteínas, poderiam transmitir a herança genética. Antes mesmo que Claude Shannon publicasse seu trabalho seminal (1949) que fundou uma teoria, Schrödinger trouxe a informação para o centro da biologia: o material hereditário das células estava organizado como um texto cifrado. Ele propôs, pela primeira vez, que a natureza usava o procedimento típico da escrita: poucos elementos, organizados na forma de palavras e frases, permitiam um número ilimitado de variações de significado. Assim, o biólogo precisaria trabalhar como o filólogo que tenta decifrar um documento antigo, escrito em uma língua desconhecida. Primeiro, era preciso descobrir onde estava esse “documento”.
A pura bioquímica tornou-se insuficiente para descrever a vida no nível molecular, pois não se tratava mais de estudar apenas as trocas de matéria e energia, mas de compreender também os fluxos de informação. Se havia um código inscrito nos organismos, se os processos químicos serviam para transportar informação, então o estudo da vida deveria transcender um substrato específico, tornando-se mais abstrato, mais matemático. Estava aberto o caminho para que os conceitos da futura teoria da informação – ruído, mensagem, código, diferenciação, complexidade, redundância – penetrassem de forma profunda e definitiva na biologia, abrindo possibilidades novas.
Em 1944, como se vê, Schrödinger teve pelo menos três insights muito importantes. Tratou o gene como objeto físico, definindo-o como um “cristal aperiódico”; intuiu que o cromossomo continha uma mensagem codificada; criou o conceito de “neguentropia” para se referir à entropia negativa que predomina nos organismos vivos. Era uma antecipação da estrutura e da função do DNA, ainda desconhecidas.
82. No mesmo ano, o bioquímico Avery causou surpresa ao publicar que características herdáveis, como a resistência à penicilina em pneumococos, podiam passar de um microrganismo a outro mediante uma transposição de DNA. Feita a primeira transposição, as novas características persistiam nos descendentes. Afrontando o senso comum, ele afirmou que o DNA era o responsável por transmitir a herança genética, o “princípio transformador” dos organismos. Sua contribuição foi negligenciada durante alguns anos.
Em maio de 1950, Erwin Chargraff resgatou o trabalho de Avery em um texto breve na revista Experientia com o título “Especificidade química dos ácidos nucleicos e mecanismo de sua degradação enzimática”. Anunciou que as proporções das quatro bases variavam conforme o DNA de cada espécie, o que sepultava a ideia de que a molécula se resumia a uma rotação repetitiva das bases, uma depois da outra. Cada espécie tinha seu próprio DNA, definido por sequências específicas das quatro bases nas células dos organismos. Comportando uma quantidade “verdadeiramente enorme” de sucessões dos quatro nucleotídeos, essas moléculas “eram parte essencial do processo hereditário”.
Chargraff descobriu algo mais:
É notável – embora ainda não possamos dizer se isso é apenas um acidente – que em todos os ácidos desoxipentosanucleicos examinados até agora, as razões molares [isto é, de molécula a molécula] de purinas totais [adeninas e timinas] e de piridinas totais [guaninas e citosinas] não se afastam de 1. […] Há uma espécie de equilíbrio entre os distintos integrantes do DNA, como nunca foi observado até hoje em nenhum outro polímero.86
Ou seja, os nucleotídeos adenina e timina, de um lado, e guanina e citosina, de outro, eram complementares e apareciam emparelhados em todos os DNAs examinados, de modo que as quantidades de A e T, de um lado, e de G e C, de outro, eram praticamente iguais em quaisquer dessas moléculas. A diversidade de DNAs exibia uma estranha uniformidade estrutural, formando o que veio a ser conhecido como “razão de Chargraff”: a proporção de (A + T) e (C + G) variava, mas a proporção de A e T, de um lado, e G e C, de outro, era sempre muito próxima de 1 em todos os organismos. Adiante, tal descoberta desempenhou um importante papel na composição do quebra-cabeças que conduziu à estrutura do DNA.
83. A pesquisa avançava em outra frente, de modo independente. Os aperfeiçoamentos do microscópio óptico haviam impulsionado decisivamente o estudo das células no século XIX. Mas, por razões físicas, esse instrumento não pode separar duas imagens que estejam mais perto do que aproximadamente a metade do comprimento de onda da luz que os esteja iluminando. Como o comprimento de onda da luz visível é de cerca de um décimo do diâmetro de uma célula bacteriana, permaneciam invisíveis numerosos elementos da estrutura da célula.
Agora, porém, a biologia contava com um instrumento novo e muito mais poderoso. A invenção da cristalografia de raios X havia dado o Prêmio Nobel de Física a William Lawrence Bragg em 1915. Como os cristais dos compostos orgânicos e inorgânicos são quase puros e apresentam regularidades estruturais, Bragg percebeu que a passagem de raios X geraria figuras de difração que permitiriam deduzir a estrutura molecular subjacente. Nas décadas seguintes, a técnica mostrou-se fundamental. Muitas estruturas subcelulares, antes desconhecidas, foram descobertas.
Os raios X atravessam substâncias opacas ao olho nu porque podem ter um comprimento de onda de 1,5 angstrom, cerca de 4 mil vezes mais curto que a luz visível e com a mesma ordem de grandeza do espaço que existe entre os átomos que formam materiais sólidos. Penetrada por este feixe, a estrutura atômica de um cristal dispersa os raios de modo ordenado, camada por camada, produzindo uma série geralmente repetida de círculos. Na interseção com a lâmina plana da película, os picos e vales destas ondas se reforçam em alguns pontos e se anulam em outros. Resulta uma figura de interferência característica da estrutura que a produziu. A partir dessa figura é possível visualizar a estrutura.
Com o tempo, cresceu a importância desse método para obter imagens de moléculas de interesse biológico. Os pesquisadores começaram a dirigir os feixes para o interior das células, o que não era uma tarefa simples. O instrumento precisava ser ajustado em minúcias, com grande precisão, fixando-se a amostra no centro de uma película de átomos metálicos, cortada em fatias finíssimas, íntegra e sem deformações, para que suas características pudessem ser captadas na passagem da corrente elétrica.
Apesar das dificuldades de manuseio, a nova técnica revolucionou o estudo das células. Foi possível ver muito mais nitidamente, por exemplo, que os espaços claros dos citoplasmas continham uma complicada anatomia, com uma intrincada rede de filamentos, canais e túbulos, que foi denominada retículo endoplasmático. Ali, apareceram também partículas esféricas densas, com cerca de 150 angstrom de diâmetro, que continham proteínas e RNA.
84. A química Rosalind Franklin logo se destacou no domínio dessa técnica. Em 1951, com 31 anos de idade, deu uma palestra no King’s College, apresentando e interpretando as imagens que havia obtido. Foi um momento decisivo. Se houvesse extraído todas as consequências do que desvelara, Rosalind poderia ter vencido a corrida para a descrição completa do DNA. Mas, assim como acontecera com Chargraff em sua análise bioquímica do gene, ela não compreendeu plenamente o que tinha em mãos. Alguns anos depois, disse que demorou dezoito meses para perceber a importância das anotações que havia usado ao descrever as imagens, pois era autodidata em cristalografia e nunca havia realizado estudos de difração de raios X com monocristais ou com substâncias biológicas. As anotações diziam:
Os resultados sugerem uma estrutura helicoidal empacotada de modo muito apertado, que contém provavelmente 2 ou 4 cadeias coaxiais de ácido nucleico por unidade helicoidal, com grupos de fosfato do lado de fora. Tais grupos de fosfato podem absorver água em grandes quantidades, formando fortes enlaces inter-helicoidais, conferindo uma estrutura cristalina tridimensional à substância. […] Estrutura B: Evidência de duas cadeias ou hélice de uma só cadeia?87
Ainda nas notas, ela escreveu que a célula-unidade do estado cristalino era monoclínica e acrescentou medições em três dimensões e em um ângulo.
Os cristais apresentam vários graus de simetria, desde o triclínico (no qual os três eixos, ou planos, estão inclinados entre si e nenhum vértice apresenta ângulo reto) ao ortorrômbico (no qual os planos se cortam em ângulos retos). Na posição intermediária está o cristal monoclínico, em que dois ângulos são retos e o terceiro pode apresentar qualquer inclinação. Ele possui curiosas propriedades de simetria e é bastante comum em substâncias biológicas (a hemoglobina, por exemplo, pertence ao mesmo grupo espacial do DNA). A simetria mínima que um cristal monoclínico pode ter é binária, de modo que nesse caso ele reencontra a congruência consigo mesmo quando gira uma meia volta. A estrutura é diádica, ou seja, uma metade espelha a outra.
A informação de que a forma cristalina do DNA tinha simetria monoclínica em torno de um eixo perpendicular às cadeias produzia outras consequências geométricas importantes. As cadeias coaxiais só podiam correr em direções opostas na estrutura helicoidal. As duas colunas tinham que estar viradas, uma subindo, a outra descendo, formando um par invertido. Associando isso ao valor que a própria Rosalind tinha calculado para a densidade da molécula, era possível concluir que essas cadeias associadas eram quase seguramente duas – eventualmente quatro, mas não três. “Se as duas cadeias correm em direções opostas, não são idênticas. Ambas têm que dar uma volta inteira no cilindro, 360 graus, antes que a estrutura complete uma repetição.”88 As dimensões da célula-unidade mostravam que a díade tinha que ser perpendicular à longitude da molécula.
Rosalind percebeu o formato helicoidal da molécula e deduziu que provavelmente era formada por duas sequências de bases, que corriam invertidas. Mas, apesar de conhecer o trabalho de Chargraff, não levou em conta a singular relação que ele havia estabelecido entre elas, com o pareamento de purinas e piridinas.
85. Até aqui chegou Rosalind Franklin, que morreu prematuramente, com 38 anos de idade. James Watson e Francis Crick estavam no auditório do King’s College e vislumbraram o alcance da coisa. Os dois ainda não sabiam quase nada de DNA, e o que pensavam que sabiam estava errado. As dúvidas eram muito básicas: o material genético era formado por DNA puro? O DNA tinha uma forma fixa? Até que ponto os métodos de preparação das amostras influenciavam os resultados obtidos? Qual era a relação entre DNA e proteínas? Suas estruturas eram semelhantes? Como a forma do DNA se relacionava com sua função?
O conceito de cristal aperiódico, de Schrödinger (1944), as análises bioquímicas de Chargraff (1950) e as medidas de Rosalind Franklin (1951) haviam amadurecido o ataque final à estrutura da molécula. Watson e Crick debruçaram-se sobre um objeto físico minúsculo, compactado, invisível, com poucos milionésimos de milímetro de comprimento. Para conseguir descrever seu conteúdo, precisavam de outras medidas, conexões e rotações, densidades, percentagem de água e, sobretudo, ligações. A partir das informações que Rosalind Franklin obtivera com a difração de raios X, passaram a trabalhar desde logo com três valores: a largura da molécula, a distância entre as bases paralelas empilhadas e a altura de uma volta da hélice. O matemático George Stokes, no mesmo King’s College, já havia desenvolvido no século XIX as matemáticas helicoidais, estabelecendo a existência de 230 grupos espaciais cuja repetição podia criar uma rede tridimensional. A célula monoclínica era um deles, o que fortalecia a interpretação de Rosalind Franklin.
A partir daí, Watson e Crick formularam hipóteses, fizeram cálculos e construíram modelos físicos com peças de cartolina recortadas, arames e latas. Trabalharam em aproximações sucessivas. Eis o relato de Crick:
Estimulados pelos resultados apresentados no King’s College em novembro de 1951, tentamos encontrar alguns princípios gerais em que a estrutura do DNA podia se apoiar. Alguns resultados nos sugeriram ideias, mas procuramos incorporar um mínimo de fatos experimentais. Entre estes, a natureza possivelmente helicoidal da estrutura, as dimensões da célula-unidade, o número de resíduos [nucleotídeos] por ponto reticular e o conteúdo de água. Tendo chegado por essa via a uma estrutura provisória, generalizamos o que consideramos os traços importantes, que passamos a chamar de postulados. […] Partindo deles, atacamos o problema das estruturas de maneira sistemática […], estabelecendo todas as combinações topológicas possíveis. Escrevemos todos os esquemas de ligação para uma superfície plana infinita. Em seguida, isolamos uma faixa dessa superfície, enrolando-a em uma folha cilíndrica igualmente infinita. Tendo obtido assim todos os esquemas das ligações possíveis, o passo seguinte foi construir modelos de cada um deles. Cada modelo foi submetido a uma série de testes, usando-se cada vez mais dados experimentais de estruturas simples. […] Era preciso ter grande cuidado para não recusar o modelo correto.89
86. O trabalho prosseguiu lentamente. No meio do caminho, Watson leu um artigo de June Boomhead, mostrando que guaninas e adeninas purificadas estabelecem ligações entre si por meio de hidrogênio, formando uma configuração regular e repetida.
Surgiu, então, a ideia de que a molécula de DNA era formada por duas cadeias enroscadas, mantidas juntas por ligações de hidrogênio, cada uma com uma sucessão idêntica de bases. […] Havia replicação quando as duas sequências se desenrolavam e cada uma servia de molde para a formação de uma nova. O pareamento homogêneo explicava a replicação do gene com preservação da mensagem hereditária. Os nucleotídeos da sequência em formação coincidiriam, um depois do outro, com a sucessão de bases da sequência-mãe. […] A replicação por molde, o desenrolamento de sequências e a formação de novas sobre as velhas foram ideias que sobreviveram, mas a ideia de pares de bases iguais teve que ser abandonada, pois contrariava a razão de Chargraff.90
Essa razão, que Rosalind Franklin não levara em conta, custou a se impor também no trabalho de Watson e Crick. A primeira pista para corrigir o erro veio de Jerry Donouhe. Depois de estudar as ligações da guanina com o hidrogênio, ele eliminou as dúvidas sobre a presença de hidrogênio no DNA e criticou as ligações que Watson propunha, entre bases iguais. Essa correção foi fundamental, assim como a descrição, também por Donouhe, das formas tautômeras, que se mantêm inteiras com uma só metade do corpo.
Crick então percebeu que a razão de Chargraff podia significar uma replicação complementar entre as purinas, de um lado, e as piridinas, de outro. Ele conta:
O paradoxo é que, quando começamos a construir a estrutura [do DNA], não usamos essa ideia. Fomos empurrados a fazer isso. O momento decisivo veio depois que Jerry Donohue nos falou das estruturas tautômeras, porque então pudemos estabelecer as pontes de hidrogênio. Aí nos demos conta de que podíamos construir uma estrutura em que as bases seriam complementares, explicando assim a proporção uma a uma, de Chargraff.91
Com duas ligações de hidrogênio, purinas e piridinas podiam aparecer nas duas cadeias da molécula, alternando-se em qualquer ordem sem perturbar a simetria diádica. Estabelecida esta ordem, o acoplamento de bases – guanina sempre com citosina, adenina sempre com timina – determinava a ordem complementar da segunda cadeia, que corria na direção oposta. Uma sequência como ATGC na cadeia original teria que gerar TACG na complementar.
87. Dois anos depois de começarem a trabalhar, Watson e Crick apresentaram a descrição do DNA em um pequeno artigo que foi considerado a publicação mais importante em biologia desde A origem das espécies. Pela primeira vez, visualizamos a estrutura da molécula da vida, que tem cerca de 3,5 bilhões de anos. H. F. Hudson a descreve:
Duas cadeias enroscadas coaxialmente, em sentido dextrogiro, uma sobre a outra, dando uma volta completa em 34 angstroms. As bases casadas no meio, planas, com 3,4 angstroms e 1/10 de revolução que separava um par do par adjacente, acima ou abaixo. As cadeias mantidas por emparelhamento, mais próximas num sentido que no outro, deixando entre elas um sulco estreito e outro largo. […] A estrutura continha o modo de sua própria replicação. Na medida em que as cadeias se desenroscavam, aparecia um duplo molde para que as bases se acoplassem, de modo que somente nucleotídeos complementares conseguiam formar ligações e se encaixar, conforme cresciam as novas cadeias.92
Cinco semanas depois do primeiro artigo, Watson e Crick escreveram outro, enfatizando que a sequência de bases era o código que se procurava, responsável pela especificidade de cada organismo:
Qualquer sequência de pares de bases se encaixa nessa estrutura. Uma molécula grande pode abrigar muitas permutações diferentes, o que leva a crer que a sucessão das bases seja o código que contém a informação genética. Se soubermos a ordem das bases em uma cadeia do par, saberemos a ordem exata das bases da outra, por causa do emparelhamento específico.93
Isso sugeria que o DNA duplicava a si mesmo:
Até agora, as discussões sobre a autoduplicação implicam o conceito de fôrma ou molde. […] Nosso modelo do DNA é, na verdade, um par de moldes complementares entre si. Imaginamos que as ligações de hidrogênio [que conectam os pares de bases] se rompem antes da duplicação e as duas cadeias se desenrolam e se separam. Então, cada cadeia funciona como um molde para a formação, sobre ela mesma, de uma nova companheira, de modo que no final do processo teremos dois pares de cadeias, onde antes havia só um. E a sucessão de pares de bases terá sido duplicada com exatidão.94
Watson escreveu:
Na manhã de 28 de fevereiro de 1953, todas as principais características do modelo do DNA se encaixaram. As inferências de Crick no ano anterior, baseadas na pesquisa de Chargaff, mostraram-se corretas. […] Foi um grande momento. Estávamos certos de que estávamos certos. Algo tão simples, tão sucinto, não podia estar errado. O que mais nos entusiasmou foi a complementaridade das sequências de bases ao longo das duas cadeias. Se conhecêssemos a sequência de uma cadeia, automaticamente conheceríamos a sequência da outra. Logo percebi que é assim que as mensagens dos genes são copiadas com tanta exatidão quando os cromossomos se duplicam antes da divisão celular. A molécula ‘se desdobra’ para formar duas fitas separadas. Cada fita serve então de modelo para a síntese de uma nova fita, e uma dupla-hélice torna-se duas.95
Em 1958, Mathew Meselson e Franklin Stahl confirmaram a estrutura do DNA, ao conceberem e executarem uma engenhosa experiência que usou isótopos de nitrogênio radioativo para acompanhar a replicação da molécula. Depois, com o desenvolvimento de sistemas em tubos de ensaio (in vitro), obteve-se a prova de que uma única cadeia de DNA é o molde que direciona a síntese da cadeia complementar.
88. Façamos um breve resumo. O DNA é a molécula portadora da hereditariedade, como Avery propusera. É um polímero cristalino regular e estável, em forma de dupla hélice, com dois longos filamentos enrolados como uma escada em caracol, como Rosalind Franklin descrevera. Os filamentos alinham milhões de repetições de quatro unidades, permutadas ao longo da cadeia, como se fossem letras de um alfabeto, como Schrödinger imaginara. A sequência dessas unidades é o código que dirige a ordenação dos vinte tipos de aminoácidos que formam as proteínas. Eles se conectam por uma sequência de pares de bases, que só podem ser AT, TA, CG e GC, seguindo a razão de Chargraff. A complementaridade dos pares indica o modo de replicação da molécula, e a ordem deles determina a informação genética. O modelo explica tanto a capacidade de reprodução da molécula quanto o modo como ela codifica a informação. Ela opera como uma matriz, fazendo surgir um negativo de si mesmo. Do negativo, por sua vez, surge outro positivo, e a informação transmite-se identicamente no curso das gerações. Assim, o DNA cumpre duas tarefas essenciais à vida: armazenamento e replicação de informação. A molécula é, ao mesmo tempo, autocatalítica (pois dirige a construção de moléculas idênticas a ela mesma) e heterocatalítica (pois também dirige a construção de moléculas muito diferentes).
O modelo permitia imaginar uma solução plausível para o mistério das mutações genéticas: elas poderiam resultar de uma alteração casual na sequência de bases. Todas as entidades microscópicas sofrem perturbações de natureza quântica. Acumulam-se erros acidentais que podem modificar algumas sequências de “letras”. Ao serem incorporados a um segmento de DNA, esses erros não podem mais ser eliminados. Ficam protegidos pela invariância genética e são replicados. Esse segmento de DNA alterado gera uma sequência também alterada de aminoácidos em uma proteína. Na origem, tais alterações ocorrem ao acaso. Cabe à seleção natural manter ou descartar a mutação.
89. Os ácidos nucleicos são as únicas moléculas capazes de produzir réplicas de si mesmas dentro das células, mas não participam diretamente no desenvolvimento dos organismos. Só dão instruções. Especificam as longas sequências dos vinte tipos de aminoácidos que formam as proteínas, as quais não podem se replicar. Portanto, o próximo grande desafio era compreender como o DNA atua na síntese das proteínas, processo que exige milhares de reações em uma ordem rigorosa. Esta questão central permanecia obscura: a estrutura e o comportamento dos organismos dependem, em última análise, da sequência de aminoácidos das suas proteínas, e a evolução consiste em grande medida na substituição de certos aminoácidos por outros.
Duas dificuldades eram evidentes. A primeira: o DNA tem quatro bases, enquanto as proteínas combinam vinte tipos de aminoácidos; não pode existir uma correspondência biunívoca entre tais componentes. A segunda: a formação do DNA exige a presença de proteínas, e a formação de proteínas exige a presença de DNA. Para ser executado, o programa precisa ter acesso aos produtos que surgem de sua própria execução. Se um não pode existir sem o outro, como esse arranjo surgiu?
A síntese proteica ocorre no citoplasma das células, onde não há DNA. Era preciso haver uma segunda molécula envolvida. Era o RNA, quimicamente semelhante ao DNA, mas com uma discreta alteração no componente açúcar e com a piridina uracila no lugar da timina. Verificou-se que o DNA transmite as informações para o RNA, que organiza as cadeias de aminoácidos. O processo exige dois passos, transcrição e tradução.
A “leitura” do código é feita em códons, que são grupos sucessivos de três nucleotídeos. Isso permite a formação de 64 combinações, o que dá conta da primeira dificuldade que apontamos acima. Os aminoácidos especificados pela sequência de códons juntam-se em uma cadeia que cresce até formar uma proteína. Uma vez ordenadas as unidades, a molécula dobra-se sobre si mesma. Adota espontaneamente uma forma tridimensional específica, constituindo um desenho de rara e única complexidade, decisivo para a sua atuação. Os átomos buscam a disposição mais estável, aquela que requer a energia mínima. É impossível prever esse movimento e encontrar esse estado antecipadamente.
90. O processo é indireto. Jacob e Monod descobriram que, na primeira etapa, o DNA é transcrito em um intermediário chamado RNA mensageiro (mRNA), que fabrica o molde da síntese proteica. Só depois o mRNA é traduzido em proteína, por meio das moléculas de RNA de transferência (tRNA). Cada códon é reconhecido por um tRNA que está associado a um aminoácido correspondente. Formam-se, assim, as sequências lineares dos aminoácidos que constituem uma proteína.
A informação genética se expressa em uma linguagem universal e relativamente simples, formada pelas sequências das quatro bases dos ácidos nucleicos, mas necessita de uma maquinaria complexa, mediada pelo RNA, para traduzir essas sequências em outra linguagem, aquela que forma as proteínas. Não se sabe exatamente por que a relação entre DNA e proteínas exige essa mediação. A principal hipótese nos remete ao caráter histórico das estruturas biológicas. Provavelmente, houve uma época em que a vida era baseada em RNA, que antecedeu cronologicamente o DNA, uma molécula mais tardia, mais estável e mais capaz de armazenar informações no longo prazo. A presença de RNA no citoplasma das células pode ser uma relíquia do processo evolutivo. Neste caso, a mediação existe simplesmente porque a vida evoluiu assim. Essa hipótese se reforça porque ajuda a explicar a segunda dificuldade: a circularidade entre DNA e proteínas desaparece se imaginarmos que existiu um mundo vivo feito de RNA, pois esta molécula pode armazenar e replicar informações genéticas (como o DNA) e catalisar reações químicas (como as proteínas).
O RNA é um grande candidato à condição de molécula fundamental das primeiras células, ainda nos organismos primitivos, pois é capaz de formar sistemas dotados de capacidade de replicação e de evolução. Na fase inicial da vida na Terra pode ter havido um “mundo de RNA”, sem DNA e sem proteínas, mas esse mundo desapareceu.
91. Não podemos reproduzir aqui a rapidíssima sequência de descobertas nessa área entre as décadas de 1950 e 1960. Destacaremos duas agora e uma adiante.
Crick enunciou o que chamou de dogma central da biologia molecular: a maquinaria química que transfere informações do DNA ao RNA e do RNA às proteínas não é capaz operar em sentido oposto, de modo que nenhuma informação externa pode penetrar no genoma. A tradução é irreversível, e as proteínas não influenciam de nenhum modo o DNA. Terminou o debate histórico sobre a possibilidade da transmissão hereditária de caracteres adquiridos. Por isso, as espécies podem se reproduzir sem alterações significativas durante milhões de anos. Essa descoberta teve um significado profundo: a invariância precede a teleonomia. Pois, por serem invariantes, as estruturas moleculares que transmitem a hereditariedade conservam as mutações aleatórias e as submetem à peneira da seleção natural. Disso, paradoxalmente, resultam organismos cada vez mais impregnados de teleonomia.
Nessa época, Frederick Sanger fez outras duas descobertas fundamentais. A primeira: a grande classe de substâncias denominada proteínas é constituída por apenas vinte tipos de aminoácidos, organizados em diferentes sequências. A segunda: a formação das proteínas não obedece a nenhuma regra, e a molécula dobrada não contém um centro de simetria. As moléculas de um mesmo tipo de proteína são iguais entre si, como se esperava, com os aminoácidos dispostos em uma sequência constante e definida. Mas a especificação de cada proteína é única, não se repete. Elas não seguem uma lei geral, uma regra física ou química que comande a sua construção. Só aparece o acaso. A correta descrição de uma parte da molécula não permite antever, de nenhum modo, as outras partes. E a descrição completa de uma não serve para prever a descrição de outras. Conhecendo-se a ordem de 199 aminoácidos de uma proteína que possui 200, é impossível formular uma regra que permita prever qual será o único aminoácido ainda não identificado. Tornou-se necessário reconhecer que existe um código geneticamente estabelecido, com instruções completas caso a caso, capaz de orientar a formação dessas sequências imprevisíveis, mas precisas e fundamentais.
É um paradoxo: vistas por suas propriedades funcionais, as proteínas são verdadeiras máquinas, mas suas estruturas fundamentais resultam de um jogo de combinações cegas. Estabelecida essa imprevisibilidade, Monod escreveu:
O acaso é captado, conservado, reproduzido pela maquinaria da invariância e convertido em ordem, regra, necessidade. […] Na ontogênese de uma proteína funcional, refletem-se a origem e a filiação de toda a biosfera. A fonte última do projeto que os seres vivos representam, perseguem e realizam revela-se nessa mensagem, nesse texto preciso, fiel, mas essencialmente indecifrável, que a estrutura primária constitui. Indecifrável porque, antes de exprimir a função fisiologicamente necessária que ele realiza de modo espontâneo, só revela em sua estrutura o acaso de sua origem. Tal é, para nós, o sentido mais profundo dessa mensagem que nos chega do fundo das idades.97
A complexidade das proteínas não para aí: como vimos, suas partes se dobram em estruturas tridimensionais irregulares, com detalhes únicos, específicos, extremamente complexos. Entre milhares de conformações funcionais possíveis, ela adota a mais compacta, aquela que é termodinamicamente estável. A função da proteína depende tanto das informações do genoma quanto da estrutura tridimensional que assume. Também aqui, nenhuma regra predetermina os modos como as cadeias se dobram. O desempenho da molécula depende de suas propriedades estereoespecíficas, ou seja, sua capacidade de reconhecer outras moléculas (inclusive outras proteínas) segundo sua forma. Inerentemente assimétricas, elas são muito mais difíceis de descrever do que o DNA, por exemplo.
92. Logo começaram a vir à luz as estruturas das primeiras proteínas decifradas. O caso pioneiro (Kendrew, 1957) foi o da mioglobina, que armazena oxigênio no tecido muscular. Mas o mais notável – por sua complexidade e por seu impacto teórico mais geral – foi o da hemoglobina, com 574 aminoácidos distribuídos em quatro cadeias, com um total de 10 mil átomos, produzida em quantidades enormes para transportar oxigênio pelo organismo. Max Perutz estudou a hemoglobina durante 31 anos, enfrentando muita dificuldade para relacionar estrutura e função: por que era necessária uma estrutura tão grande, tão complexa, tão irregular, dobrada de modo tão específico, apenas para carregar e descarregar quatro moléculas de oxigênio por vez, cada uma com dois átomos?
Essa tarefa aparentemente simples envolve uma enorme dificuldade química: a ligação que se estabelece no ferro oxidado é muito estável, enquanto a função respiratória da molécula só pode ser realizada se seus átomos de ferro se combinarem de forma facilmente reversível com o oxigênio, sem se oxidar, para que ele seja liberado nos tecidos. Se a ligação fosse forte, como se deveria esperar, a maior parte do oxigênio retornaria aos pulmões sem ter sido descarregada nas células. O organismo morreria asfixiado, mesmo respirando normalmente. É por isso que a hemoglobina precisa de estruturas que se modificam durante o ciclo de recolher o oxigênio nos pulmões e entregá-lo nos tecidos, trazendo de volta o dióxido de carbono. Entre captar e entregar o oxigênio, ela altera em mais de 10% o seu comprimento. A pressão do gás, assim regulada, promove a troca da exata quantidade de oxigênio demandada pelo organismo. “A hemoglobina é uma espécie de pulmão molecular, um órgão em miniatura”, disse Perutz, ganhador do Prêmio Nobel de Química em 1962.98
93. O trabalho de Perutz se estendeu até 1970, quando ele percebeu a extraordinária significação de uma descoberta feita por Linus Pauling em 1935, que envolvia elementos de mecânica quântica, e finamente descobriu o gatilho que altera a configuração da molécula. Mas seus resultados parciais já haviam aberto o caminho para a revolução que Jacques Monod e François Jacob promoveram na biologia molecular entre o final da década de 1950 e o início da de 1960, descobrindo os modos de regulação e controle intracelular. Vimos que eles já haviam descoberto como DNA e RNA interagem na síntese das proteínas. Agora foram adiante, com as teorias de regulação e, principalmente, as proteínas alostéricas.
Monod denominou “cibernética microscópica” a parte do seu trabalho que descreve os modos de regulação ligados à ativação ou inibição de enzimas por retroalimentação, com a participação de genes operadores e repressores. Na “inibição retroativa”, a enzima que catalisa a primeira reação de uma sequência é inibida pela presença do último produto da mesma sequência, de modo que a concentração intracelular do produto do metabolismo governa a rapidez de sua própria síntese. Na “ativação retroativa”, ao contrário, a enzima é ativada pela degradação do último produto da sequência metabólica que ela mesma iniciou. Esses sistemas ajudam a coordenar a atividade dentro da célula e fazem dela uma unidade funcional. Por meio dessas retroalimentações – um conceito-chave da cibernética, como veremos –, o estado homeostático do metabolismo celular se conserva.
Mas a descoberta mais notável foi a das proteínas alostéricas. Já se sabia que os sistemas nervoso e endócrino realizam a coordenação entre órgãos, tecidos e células dos organismos. Tomando a hemoglobina como protótipo de uma classe de proteínas que se autorregulam, Monod e Jacob descobriram outras proteínas cuja ação coordena a maquinaria química no interior de cada célula. Não só os organismos têm sistemas reguladores internos, como Bernard começara a descrever no século XIX. As células também, com consequências extraordinárias.
94. Tanto do ponto de vista sincrônico quanto evolutivo, sempre se considerou que o metabolismo de um organismo é limitado pelas propriedades químicas das reações possíveis. A célula não pode fabricar uma enzima capaz de ativar uma reação quimicamente impossível. As enzimas “clássicas” limitam-se a reconhecer seus substratos específicos, ignorando tudo o mais. Mas a soma das suas atividades, isoladas umas das outras, nunca produziria um metabolismo celular coerente e viável se não contasse com um sistema de coordenação.
As proteínas alostéricas agem como transdutoras de sinais químicos. Com isso, as células alcançam novo grau de liberdade em relação a constrangimentos químicos que, de outra maneira, seriam insuperáveis. Pela alosteria podem-se conectar quaisquer dois circuitos metabólicos. Como proteínas são moléculas produzidas somente por seres vivos, é isso que permite que eles desenvolvam redes incomparavelmente mais complexas que o restante da natureza. Estão além da química comum. Monod explica:
Se a regulação das células dependesse apenas de interações diretas submetidas às leis gerais da química, então a tendência global dos sistemas seria para o equilíbrio. Mas equilíbrio químico significa morte. A célula só sobrevive porque se mantém afastada do equilíbrio. Na verdade, ela é um sistema cibernético de retroalimentação. Sua regulação deve-se inteiramente a certo tipo de circuitos químicos que, não obstante, transcendem a química. É algo indireto. Isso permite que a célula adquira um novo grau de liberdade quando comparada aos rigores extremos das interações químicas gerais, diretas. E funciona virtualmente sem nenhum gasto de energia.99
Sendo capazes de estabelecer ligações indiretas entre compostos que não apresentam afinidade química, essas proteínas ampliam enormemente a liberdade de escolha e as possibilidades de organização da célula. Quase tudo se torna possível, pois desaparecem as restrições químicas, restando apenas algumas de natureza fisiológica. Elas regulam o curso da energia e dos materiais dentro das células, requerendo pouca energia para isso. A “gratuidade” das reações alostéricas – a expressão é de Monod – transcende a química e permite uma elaboração biológica praticamente ilimitada. Por isso, a seleção natural as escolheu ao longo da história.
Isso abriu, para a evolução molecular, um campo praticamente infinito de exploração e de experiências, o que lhe permitiu construir a imensa rede de interconexões cibernéticas que fazem de um organismo uma unidade funcional autônoma, cujas performances parecem transcender as leis da química, para não dizer que delas escapam. […] É na estrutura dessas moléculas [alostéricas] que devemos ver a fonte última da autonomia, ou mais exatamente da autodeterminação que caracteriza os seres vivos.100
Descobriu-se, assim, que as sequências de aminoácidos das cadeias polipeptídicas guardam o segredo mais profundo das estruturas teleonômicas dos seres vivos. Se soubéssemos enunciar uma lei que as governa, diz Monod, “poderíamos dizer que o último segredo foi devassado, a última ratio foi descoberta”. Ele considerou o conceito de interação alostérica “o segundo segredo da vida”, o primeiro sendo a dupla hélice e o código genético. “Nos dois casos”, escreveu, “intervém a simetria. Em termos epistemológicos, penso que a ciência só alcança seu nível mais básico quando consegue interpretar algo em termos de simetria.”101 Logo veremos a agudeza dessa observação.