YouTube

Artigos Recentes

Cientistas "brincando de Deus": Letras artificiais no DNA

- Atualizado no dia 5 de maio de 2022 -

Compartilhe o artigo:



         A vida como hoje a conhecemos, incluindo os vírus ou não (!), é baseada em um pequeno alfabeto. O DNA, basicamente, é uma junção natural em pares de 4 letras distintas: A, G, C e T. A forma como essas letras estão dispostas definem todas as variações de formas e funções associadas à vida ao nosso redor, seja protista, seja eucarionte, seja viral. Nesse sentido, os cientistas nos últimos anos estão conseguindo expandir nosso limitado alfabeto genético, criando novas letras estáveis e funcionais! O primeiro grande passo foi anunciado no final de 2017, com a criação das letras X e Y, estáveis e capazes de serem integradas ao genoma de um organismo (Ref.1). O segundo e revolucionário passo foi anunciado esta semana, com a publicação de um estudo na Science detalhando a criação de quatro novas letras (S, B, P e Z), as quais naturalmente conseguem formar uma estrutura estável de dupla hélice imitando perfeitamente o DNA, além de conseguirem serem integradas de forma funcional em uma estrutura de DNA contendo as quatro letras naturais (Ref.13), ou seja, um sistema genético de 8 letras! Além disso, esse sistema de 8 letras cumpre as exigências teóricas para ser submetido ao processo evolutivo.

          Estamos avançando na engenharia genética como nunca antes imaginado e o potencial da biologia sintética é ilimitado, possibilitando a criação de diversas novas formas de vida e de funções biológicas originais, especialmente em termos de variedade proteica. E os novos avanços nesse campo comprovam que a vida apenas precisa de uma química favorável para emergir, e as quatro letras naturais estão longe de serem especiais. Isso traz um impacto importante também na busca por vida alienígena pelo Universo.

         Antes dos dois novos estudos serem destrinchados aqui neste artigo, fica a sugestão de primeiro você dar uma lida na primeira parte do texto (Maquinário Genético), antes de dar prosseguimento com a leitura na segunda parte de interesse (Letras Artificiais). Quando o assunto é genética, muitos ficam cheios de dúvidas quanto aos termos usados nos estudos científicos. Nesse sentido, antes de entrarmos em detalhes no novo avanço dado pelos pesquisadores, será dada uma breve explicação sobre o que é o DNA e como funciona a síntese de proteínas no corpo. Em caso de quaisquer dúvidas, deixe-as nos comentários e elas serão eventualmente respondidas.

(!) Existe uma exceção natural à "regra" de 4 letras no código genético em vírus bacteriófagos, com a substituição da letra 'A' pela letra 'Z'. Essa exceção é explorada no tópico EXCEÇÃO NATURAL: Z-DNA.

- Continua após o anúncio -





   O QUE É O DNA?

           O DNA - sigla em inglês para 'ácido desoxirribonucleico' - é uma molécula orgânica polimérica que representa o material hereditário em humanos e em quase todos os outros organismos vivos na Terra (aqui entramos com certos vírus como exceção, os quais carregam RNA apenas). Praticamente todas as células no corpo de uma pessoa carregam o mesmo DNA. A maior parte do nosso DNA é encontrado no núcleo celular, com uma pequena e distinta quantidade confinada nas mitocôndrias (DNA mitocondrial ou mtDNA) - organelas responsáveis por produzirem energia (ATP) para as células.

         A informação no DNA é armazenada na forma de um código constituído de quatro bases químicas: adenina (A), guanina (G), citosina (C) e timina (T). O DNA humano possui mais de 2 bilhões dessas bases e mais de 99,6% delas (em termos de sequência) são as mesmas em todas as pessoas. A ordem, ou sequência, dessas bases determinam a informação disponível para a construção e manutenção de um organismo, de forma bastante similar ao que as letras do alfabeto de escrita podem ser organizados para produzir palavras e textos, como este artigo.


 



         As bases de DNA, por afinidade química, formam pares entre si, sendo A sempre com T, e C sempre com G, produzindo unidades chamadas de 'pares de bases'. Cada base é também ligada a uma molécula de açúcar (desoxirribose) e uma molécula de fosfato. Juntos, uma base, açúcar, e fosfato são chamados de 'nucleotídeo'. Os nucleotídeos são arranjados em duas longas fileiras que formam uma espiral chamada de 'dupla hélice'. A estrutura da dupla hélice é tipo uma escada, com as bases de pares formando os degraus e as estruturas de açúcar e fosfato formando o corrimão vertical.




          A mais importante propriedade do DNA é a sua capacidade de replicação, conseguindo realizar cópias de si mesmo. Cada cadeia de DNA na dupla hélice pode servir como um padrão para a duplicação da sequência de bases, sendo isso crítico quando as células se dividem, já que a nova célula precisa ter uma cópia exata do DNA presente na antiga célula (exceto na formação de gametas sexuais, os quais possuem metade da quantidade original de cromossomos). Além disso, as sequências coordenam a produção do RNA - ácido ribonucleico -, necessário para a síntese de proteínas no corpo, as quais cumprem papeis diversos em todos os seres vivos, desde estrutural até hormonal. Mutações ocorrem quando as disposições desses pares são alteradas, seja por deleção, substituição ou adição.

----------
> Durante a replicação do DNA, primeiramente ocorre a separação das fitas de DNA (desfaz a hélice) no sentido 5’-3’ pela enzima DNA Helicase. Ocorre então a síntese da uma nova fita e esta sempre se dá no sentido 5’-3’.  Logo vem a principal enzima da replicação: DNA Polimerase. A DNA Polimerase é capaz de sintetizar uma nova fita de DNA a partir de uma fita molde e agrega nucleotídeos na extremidade 3’ da fita de DNA.
----------






          Nesse sentido, temos os genes, os quais são as unidade físicas básicas de herança genética e de comando de síntese proteica/RNA. Os genes são passados de pais para filhos e contêm a informação necessária para especificar traços, ou seja, são eles que expressam o que será feito no corpo, e podem estar ativados ou desativados, onde esses estados podem ser definidos via genética, epigenética ou outros mecanismos regulatórios de transcrição. Os genes são trechos do DNA, e acabam sendo arranjados um após o outro em estruturas chamadas de 'cromossomos'. Um cromossomo é uma longa e única molécula de DNA, sendo que os humanos (Homo sapiens) possuem 23 pares de cromossomos e mais de 20 mil genes constituindo-os (no total). Caso ocorram erros durante os processos de produção das células haploides de reprodução na nossa espécie (espermatozoides ou óvulos, os quais possuem apenas uma cópia dos cromossomos, ou seja, 23 cromossomos no total), e a célula-ovo resultante tenha mais ou menos cromossomos, doenças genéticas surgem, como a Síndrome de Down, onde existe um cromossomo a mais no par 21 (1).



          Muitas espécies de bactérias possuem apenas um cromossomo na célula (lembre-se que as bactérias são unicelulares), cada um deles contêm apenas uma cópia para cada gene em quase todos os casos e os genes são quase sempre interruptos. Já os bem mais complexos e números cromossomos nos eucariontes possuem várias sequências dentro de um gene que não possuem uma aparente função (introns) e basicamente interrompem as sequências ativas (exons). Apenas cerca de 1,5% do DNA humano codifica um produto genético e se as sequências de introns fossem incluídas, seriam 30% de genes que codificam algo.
----------
> Através de mecanismos epigenéticos e de plasticidade fenotípica, os fenótipos expressos são regulados além das informações trazidas pelo genoma, através da ativação e da desativação de genes engatilhadas por fatores ambientais ou endógenos diversos. A diferenciação das células embrionárias em diferentes tecidos no nosso corpo, por exemplo, é realizada via epigenética. Para mais informações, acesse o artigo: Epigenética, Plasticidade Fenotípica e Evolução Biológica
---------- 

- Continua após o anúncio -



   COMO É REALIZADA A SÍNTESE PROTEICA?

            Basicamente, os traços - genes - do DNA coordenam a produção de proteínas a partir da combinação de diferentes bases (A, G, G e T). Proteínas (polipeptídeos) - como as enzimas, certos hormônios, constituintes musculares e outros componentes estruturais diversos - são a base da vida e são formadas pela junção de vários aminoácidos ligados em cadeia. Cada aminoácido, por sua vez, é determinado por três nucleotídeos consecutivos - códons - em uma única fileira de DNA, com esses 'códons' arranjados em uma sequência que corresponde à sequência de aminoácidos no polipeptídeo que o gene codifica.

            Existem 20 aminoácidos compondo as estruturas proteicas dos seres vivos, os quais são englobados nas 64 possibilidades de organização das quatro letras do DNA (43 = 64). Bem, mas como não existem 64 aminoácidos entre os seres vivos, isso significa que mais de um códon codifica o mesmo aminoácido ('degenerados'), como pode ser visto em uma das figuras mais à frente. E como ocorre essa síntese, no caso dos eucariontes? Primeiro, regiões específicas do DNA (genes) codificam uma mensagem (RNA mensageiro, ou mRNA) em um processo chamado de transcrição - com a ajuda da enzima RNA polimerase. Esse mRNA se une a um ribossomo (organela de produção proteica constituída de uma estrutura formada por RNA ribossômico, ou rRNA,e proteínas) e, através de aminoácidos soltos no citoplasma trazidos anexados à moléculas de RNA transportador (tRNA) - estes também produzidos por genes específicos e soltos no citoplasma -, é iniciada a produção da proteína respeitando a ordem de códons no mRNA, em um processo conhecido como 'tradução'.



        Na transcrição, apenas parte do DNA se abre (no gene específico) para servir de referência para a formação do mRNA. Após a liberação do mRNA, a dupla hélice é refeita. Como o DNA não pode sair do núcleo, o mRNA acaba sendo o mensageiro das instruções. Os aminoácidos são unidos na proteína por ligações peptídicas. Alguns aminoácidos podem ser tragos ao ribossomo por vários tipos de tRNA possuindo diferentes anticódons (sequência de três letras no tRNA que complementam três letras no mRNA). Outros só podem ser trazidos por um. Alguns códons não especificam aminoácidos, apenas especificam quando uma proteína está completa, ou seja, são códons de terminação (UGA, UAG e UAA). Nessa história toda, o ribossomo catalisa a síntese proteica.


           Todos os tipos de RNA são produzidos por genes específicos, e cumprem a função básica de serem os representantes de ação do DNA, seja atuando como orientadores ou transportadores. No DNA eles são criados através da ação da enzima polimerase, a qual cria cadeias de RNA pareando as bases que constituem os pares de um gene alvo, ou seja, uma guanina no trecho do DNA será uma citosina no trecho do RNA, e uma adenina no trecho do DNA será uma uracila no trecho do RNA (note que a timina no DNA não aparece no RNA, sendo substituída pela uracila - U).



-----------
> Em 2021, cientistas reportaram que células de mamíferos - incluindo provavelmente humanos - são capazes de produzir DNA a partir de RNA, similar ao que retrovírus (ex.: HIV) fazem com as enzimas transcriptases reversas. Entenda: Atualização na Biologia: Células de mamíferos podem produzir DNA a partir de RNA
------------

- Continua após o anúncio -





   PRIMEIRO PASSO - DUAS LETRAS

            Agora que você está mais familiarizado com o nosso alfabeto e linguagem genética, vamos entender o impacto dos dois grandes avanços científicos alcançados nos últimos anos nessa área. Devido à Evolução Biológica (2) e consequente ancestralidade comum, os seres vivos hoje no planeta acabam compartilhando características genéticas muito similares, incluindo um limitado alfabeto de quatro letras sendo reaproveitado ao longo da linha evolutiva, como já exposto.


        Mas essa limitação natural começou a mudar quando, no começo de 2017, um estudo foi publicado (Ref.2) mostrando a criação de organismos vivos geneticamente modificados com o editor genético CRISPR-Cas9 (3) - no caso, a bactéria Escherichia coli foi o alvo - que conseguiam continuar se reproduzindo de forma robusta com duas letras inéditas incorporadas ao seu código genético - os nucleotídeos X e Y. Em testes laboratoriais, após se dividirem mais de 60 vezes, as bactérias modificadas conseguiram manter os nucleotídeos "alienígenas" no seu material genético (DNA). Antes desse feito, apenas as clássicas quatro letras (A, G, C e T) eram conhecidas de atuarem de forma eficiente nos seres vivos.


         Tendo esse fantástico resultado em mãos, o mesmo time de pesquisa, liderado pelo químico Floyd Romesberg do Instituto de Pesquisa Scripps, em La Jolla, Califórnia, resolveu ir além. Eles incorporaram dois tipos de novos nucleotídeos (um par) no DNA das bactérias E. coli, fazendo com que suas células, então, passassem a usar o novo alfabeto - agora composto por 6 letras - para inserir aminoácidos não naturais em uma proteína fluorescente!

   PROGRESSO

          Nas últimas duas décadas, o time de Romesberg fez centenas de moléculas de DNA modificadas, em algo primeiro iniciado pelo químico Steven Benner em 1989 - na época no Instituto Federal Sueco de Tecnologia, Zurich - ao sintetizarem moléculas de DNA contendo formas modificadas de citosina e guanina. Nesse início, as moléculas modificadas - apelidadas de 'Funny DNA' - podiam se replicar e produzir RNA e proteínas em tubos reacionais, ou seja, apenas fora de organismos vivos.

          As várias novas moléculas modificadas de DNA produzidas por Romesberg, ao contrário daquelas de Benner e das tradicionais em seres vivos, possuem seus pares "alienígenas" de nucleotídios mantidos juntos devido às suas insolubilidades em meio aquoso, similar como o óleo fica unido em gotas quando misturado em água. Ou seja, essas novas moléculas de nucleotídeos sendo testadas ficavam unidas em pares através de uma maior predominância das forças de Van Der Walls - ligação intermolecular entre moléculas com caráter menos polar. Já os nucleotídeos tradicionais ficam unidos devido à ligações de hidrogênio - ligação intermolecular que ocorre entre hidrogênio e átomos muito eletronegativos (O, N, e F).

          De qualquer forma, para funcionar em células vivas, as bases "alienígenas" precisam entrar em parceria com as bases naturais sem perturbar o formato do DNA ou atrapalhar tarefas essenciais, como os processos de duplicação e transcriação. Em 2014, Romesberg reportou um grande avanço: uma cepa de E. coli, com um pedaço de DNA contendo um único, não-natural, par de bases. O DNA "alienígena" foi feito de compostos químicos chamados de dNaM e d5SICS (apelidados de X e Y, respectivamente). Mas as células contendo essas estranhas bases se dividiam com muita dificuldade, além de tenderem a perder seu DNA 'alienígena' com o tempo.

           Então, veio um novo grande avanço, com o já mencionado trabalho publicado no começo de 2017 ano reportando a inserção das bases X e Y no E. coli de forma mais estável e duradoura ao longo das replicações celulares. Nesse caso, a base Y agora representava o composto químico chamado de dTPT3, em substituição ao d5SICS. Porém, ainda algo importante faltava: as células da bactéria ainda não conseguiam usar essas novas letras para produzir códons e, dessa forma, possibilitar a utilização de aminoácidos para a criação de proteínas.


- Continua após o anúncio -



   CONQUISTA

          Nesse sentido, em um trabalho publicado no final de Novembro na Nature (Ref.1), o time de Romesberg conseguiu criar células saudáveis de E. coli que puderam finalmente utilizar seu novo DNA alienígena. Em experimentos separados, as células incorporaram dois aminoácidos (chamados de PrK e pAzF) em uma proteína que emite um brilho verde - Green Fluorescent Protein (GFP). Tanto as bases X e Y quanto os aminoácidos foram dados de alimento para as células, e, para permitir que estas utilizassem os novos componentes, os pesquisadores criaram versões modificadas de tRNA, permitindo a leitura dos novos códons e transporte dos aminoácidos para os ribossomos. Agora, as possibilidades pulam de 64 códons para 216 códons (63)!




          Com os novos aminoácidos incorporados à proteína fluorescente a partir do maquinário genético alienígena, ficou demonstrado agora que os cientistas podem armazenar e recuperar informações no DNA de organismos semi-sintéticos, possibilitando a criação teórica de inúmeras novas proteínas que antes não eram possíveis de serem criadas pelos seres vivos, além de ser possível a criação de estruturas genéticas variadas de interesse, inclusive em escala industrial. Em um trabalho ainda não publicado, o time de pesquisa reportou que conseguiu inserir um par dessas novas bases em local chave do gene implicado com a resistência a antibiótico. Bactérias que possuem esse DNA 'alienígena' herdado de células modificadas se tornam sensitivas à drogas relacionadas com a penicilina, algo que pode levar a uma inovativa estratégia de combate à crescente crise de resistência bacteriana.




          Após esse feito, o próximo passo seria conseguir incorporar essas novas letras em grandes extensões do código genético, deixando-o com um aspecto cada vez mais sintético e moldável. Ao mesmo tempo, os cientistas continuaram na busca por outras letras mais estáveis para serem incorporadas com ainda mais eficiência.

- Continua após o anúncio -



   SEGUNDO PASSO - QUATRO LETRAS

           Agora, um estudo publicado esta semana na Science (Ref.13), e realizado por um consórcio de pesquisadores liderados por Steven Benner, fundador da Foundation for Applied Molecular Evolution em Alachua, Flórida, reportou a criação de sistemas do tipo DNA e RNA a partir de 8 nucleotídeos - as tradicionais A, G, C e T mais as letras S, B, Z e P - os quais formam 4 pares ortogonais. O DNA sintético foi chamado de 'hachimoji' (palavra que significa 'oito letras') e possui o potencial para a formação de 512 códons (83)!.

           Primeiramente, as novas letras são um grande avanço em relação ao par X-Y porque possuem ligações de hidrogênio. Como X e Y, por exemplo, não possibilitam ligações de hidrogênio - apenas interações apolares/hidrofóbicas -, essas duas letras necessitam obrigatoriamente serem complementadas na estrutura de dupla hélice por bases com ligações de hidrogênio (A, G, C e T, por exemplo) para uma estabilidade e capacidade de funcionar como um biopolímero capaz de transmitir, armazenar e utilizar informações. Em outras palavras, as novas letras sintéticas (S, B, Z e P) são capazes de formarem uma estrutura do tipo DNA sem assistência das letras naturais, e, claro, podem ser incorporadas a longas sequências de DNA em grandes proporções junto às letras naturais, formando um sistema de informação genética estável e eficiente de 8 letras.


         Somando-se a isso, os novos sistemas sintéticos obedecem os requerimentos necessários para suportar evolução Darwiniana - mudança na frequência de alelos ao longo de contínuas replicações -, incluindo estrutura central polieletrolítica, estabilidade termodinâmica teórica e blocos de construção estereorregulares que atendem às exigências de um cristal aperiódico de Schrödinger. Parâmetros termodinâmicos mensurados também previram estabilidade dos duplexes de hachimoji, permitindo que o novo DNA sintético aumente a densidade natural de informação do DNA tradicional. Além disso, três estruturas cristalinas mostraram que os blocos sintéticos de construção não perturbam o cristal aperiódico visto na dupla hélice do DNA.

           Para permitir vida como a conhecemos, moldada e diversificada pelos processos evolutivos, é crucial uma alta eficiência no armazenamento, transmissão e evolução da informação genética. Isso é alcançado pelas duplas hélices características do DNA, cujas fileiras ortogonais ao comprimento da fita são ligadas por pares de nucleobases de tamanhos regulares a partir de ligações de hidrogênio. Segundo teorizou o famoso Erwin R. J. A. Schröndinger (4) - físico teórico Austríaco e um dos fundadores da Teoria Quântica - essa regularidade no tamanho é necessária para os pares se encaixarem na forma de um cristal aperiódico, este o qual ele propôs ser necessário para o armazenamento confiável e a transferência de informação. Essa exigência também é essencial para quaisquer biopolímeros que possam suportar evolução Darwiniana, ao assegurar que mudanças nas sequências genéticas (dos blocos de construção da informação) não danifiquem a performance do biopolímero, incluindo a interação com enzimas responsáveis pela sua replicação.

         Passando nos testes teóricos de estabilidade, os pesquisadores resolveram testar na prática a capacidade do novo sistema sintético de transmitir informação. Como a letra S do DNA Hachimoji possuiu um espaço estrutural com ausência de densidade eletrônica (destacado em verde na imagem acima), o novo DNA sintético não pode ser transcrito via RNA polimerase natural, especialmente porque uma enzima é muito específica com seu substrato. Nesse sentido, os pesquisadores utilizaram uma variação do T7 RNA polimerase ((Y639F H784A P266L, "FAL", no caso)  para a geração de RNA Hachimoji na forma de uma proteína de Aptamer fluorescente funcional (uma cadeia curta de oligonucleotídeos, nesse caso uma variante proteica oriunda do espinafre). A síntese foi confirmada por três técnicas analíticas independentes, incluindo HPLC e UV.


           Os resultados do novo estudo, portanto, expandem as possibilidades químicas de suporte à vida, incluindo em relação às buscas de vida alienígena ao longo do Universo e de vias para o início da vida aqui na Terra. A vida, de fato, apenas precisa de uma química favorável para ocorrer, e está longe de ser limitada a apenas 4 letras.




- Continua após o anúncio -



   EXCEÇÃO NATURAL: Z-DNA

           Em 1977, cientistas da União Soviética foram os primeiros a descobrir que o vírus de DNA cianofago S-2L, especializado em infectar bactérias fotossintéticas, trazia ao invés de adenina (A) no seu código genético, o nucleotídeo 2-aminoadenina, representado pela letra Z, e formando o alfabeto genético ZTCG ao invés do tradicional ATCG. Estudos subsequentes nas últimas décadas têm identificado o nucleotídeo Z no DNA de vários outros bacteriófagos (vírus que infectam bactérias), sugerindo vantagens adaptativas dessa "nova" letra.

 

           Como mostrado na imagem acima, uma característica do par de base Z:T é a presença de três ligações de hidrogênio ao invés das duas ligações de hidrogênio observadas no par A:T. Segundo evidências experimentais até o momento acumuladas, essa interação extra resulta em 

- maior estabilidade térmica, ou seja, o dZ-DNA é mais estável em maiores temperaturas do que o dA-DNA; 

- uma cadeia de dZ-DNA é mais acurada em se ligar a sequências complementares de DNA;

- a estrutura do dZ-DNA é resistente à degradação por nucleases que reconhecem e cortam específicas sequências de DNA contendo a letra A.

          Essas propriedades podem conferir, por exemplo, maior resistência às defesas antivirais das bactérias hospedeiras. Bacteriófagos se reproduzem ao injetar o DNA viral na bactéria alvo, utilizando o maquinário celular do hospedeiro para a produção de proteínas virais que irão permitir a cópia, construção e empacotamento de novos genomas virais dentro da célula. Para se defender contra esse tipo de infecção, bactérias usam uma variedade de mecanismos, como enzimas nucleases capazes de destruir o DNA viral invasor. Com a presença do dZ-DNA, pode ser mais difícil para esses mecanismos antivirais atuarem efetivamente, permitindo maior sucesso de infecção e de disseminação dos bacteriófagos. De fato, todos os vírus bacteriófagos possuem modificações químicas nas letras A, G, T e C com esse mesmo objetivo.



           Estudos mais recentes têm explorado como esse nucleotídeo é formado e incorporado na estrutura do DNA durante a replicação viral (Ref.16). No caso do fago S-2L - o qual infecta bactérias do gênero Synechococcus -, já temos estabelecido o caminho bioquímico de síntese da letra Z, e a identificação de uma enzima DNA polimerase responsável por incorporar a letra Z no DNA e ao mesmo tempo rejeitando a letra A (Ref.17). Avanços nesse sentido podem armar o campo de bioengenharia com um maquinário genético otimizado para a síntese de proteínas antes nunca observadas e com potenciais aplicações em áreas de biomateriais e de medicina. A existência natural da letra Z, mesmo que em um vírus, é mais uma forte evidência de que basta uma química favorável para que novos alfabetos genéticos funcionais e estáveis emerjam.

-------------
CURIOSIDADE: O nucleotídeo Z - basicamente um híbrido entre a adenina e a guanina - já foi também detectado em meteoritos, sugerindo uma existência pré-biótica dessa letra genética.
------------


- Continua após o anúncio -



   CONCLUSÃO

         No atual cenário de progresso no campo da engenharia genética, estamos como crianças que estivessem há anos tentando entrar em um loja de doces e que, quando finalmente conseguem, e ficam livres para fazerem o que quiserem, acabam perdidas em meio a tantas possibilidades. Agora, passos futuros certamente serão a criação de organismos totalmente sintéticos e moldados à vontade humana em todos os seus aspectos. Tudo isso reforça ainda mais que a vida não é assim tão 'especial': basta termos uma química favorável para que ela encontre o seu caminho (6).


Artigos Recomendados:


REFERÊNCIAS CIENTÍFICAS
  1. https://www.nature.com/articles/nature24659.epdf
  2. http://www.pnas.org/content/114/6/1317
  3. http://www.nature.com/news/alien-dna-makes-proteins-in-living-cells-for-the-first-time-1.23040
  4. https://www.ncbi.nlm.nih.gov/books/NBK21950/
  5. Lehninger Principles of Biochemistry, 6th Edition 
  6. https://publications.nigms.nih.gov/insidelifescience/genetics-numbers.html
  7. https://www.genome.gov/glossary/index.cfm?id=70
  8. https://www.ncbi.nlm.nih.gov/books/NBK21603/
  9. https://www.umassmed.edu/rti/biology/role-of-rna-in-biology/role-of-rna-protein-in-synthesis/
  10. https://www.genome.gov/pages/education/modules/blueprinttoyou/blueprintinsideback.pdf
  11. http://www.ecdoe.gov.za/documents/learners/self-study-guides/life-sciences-gr12.pdf
  12. https://www.genome.gov/12011238/an-overview-of-the-human-genome-project/
  13. https://science.sciencemag.org/content/363/6429/884
  14. Khudyakov, I. Y., Kirnos, M. D., Alexandrushkina, N. I., & Vanyushin, B. F. (1978). Cyanophage S-2L contains DNA with 2,6-diaminopurine substituted for adenine. Virology, 88(1), 8–18.
  15. https://www.nature.com/articles/d41586-021-01157 
  16. https://science.sciencemag.org/content/372/6541/460.full
  17. https://science.sciencemag.org/content/372/6541/516