Biblia

Conocer el genoma

Conocer el genoma

En 2001, el Proyecto Genoma Humano produjo una lectura casi completa del ADN de la especie humana. Pero los investigadores tenían poca idea acerca de cómo se usaban, controlaban u organizaban esos A, G, C y T, y mucho menos cómo se codifican para un ser humano vivo y que respira.

Esa brecha de conocimiento acaba de obtener un poco más pequeño Un proyecto internacional masivo llamado ENCODE, la Enciclopedia de Elementos de ADN, ha catalogado cada nucleótido dentro del genoma que hace algo, lo que resulta que es mucho más que el 1,5 por ciento del genoma que contiene instrucciones reales para fabricar proteínas. La investigación, un esfuerzo de 10 años realizado por un equipo internacional de 442 científicos, muestra que el resto del genoma, la mayoría no codificante, todavía está lleno de elementos funcionales.

El genoma ya no es una inmensidad vacía, dijo Shyam Prabhakar del Instituto del Genoma de Singapur, que no participó en el estudio. Está densamente repleto de picos y ondulaciones…

Casi todos los nucleótidos están asociados con una función de un tipo u otro, y ahora sabemos dónde están, qué se une a ellos, cuáles son sus asociaciones, y más, agregó Tom Gingeras, uno de los estudios de muchos científicos de alto nivel. Los resultados se publican hoy (5 de septiembre) en más de 30 artículos en muchas revistas diferentes.

Los investigadores han reconocido durante mucho tiempo que parte del ADN no codificante probablemente tiene una función, y recientemente se han descubierto muchos ejemplos sólidos. luz. Al mismo tiempo, la gente creía que gran parte de estas secuencias eran, de hecho, basura. El proyecto ENCODE sugiere lo contrario.

Los investigadores descubrieron que muchas partes no codificantes del genoma humano contienen sitios de acoplamiento donde las proteínas pueden unirse, lo que afecta la expresión de genes cercanos y distantes. Otras regiones no codificantes se transcriben en moléculas de ARN que nunca se traducen en proteínas. Aún otros afectan cómo se pliega y empaqueta el ADN. En resumen, estas regiones no son solo basura; según el análisis de ENCODE, el 80 por ciento del genoma tiene alguna función bioquímica.

El 20 por ciento restante puede que tampoco sea basura, según Ewan Birney, coordinador principal de análisis del proyecto. Explica que mientras ENCODE analizó 147 tipos diferentes de células, hay un par de miles en total. Si se examinan otros tipos de células, pueden surgir funciones para la proporción fantasma. Es probable que el 80 por ciento llegue al 100 por ciento, dijo Birney. Realmente no tenemos grandes trozos de ADN redundante. Esta metáfora de la basura no es tan útil.

Las implicaciones son amplias, desde redefinir qué es un gen hasta proporcionar nuevas pistas en la búsqueda para comprender las enfermedades y cómo funciona el genoma en tres dimensiones. Hay pepitas para todos aquí, dijo Prabhakar. No importa qué parte del genoma estemos estudiando en un proyecto en particular, nos beneficiará buscar las pistas ENCODE correspondientes.

Por supuesto, todavía queda un largo camino por recorrer, señaló Birney. Creo que va a tomar este siglo para completar todos los detalles, dijo. Esa reconciliación completa va a ser la ciencia de este siglo.

En cifras

Los investigadores ya sabían que el 1,5 por ciento del genoma codifica proteínas. ENCODE descubrió que un 8,5 por ciento adicional codifica regiones donde las proteínas se adhieren al ADN, presumiblemente regulando la transcripción de genes. Y, debido a que ENCODE no ha analizado todos los tipos posibles de células o todas las proteínas posibles que se adhieren al ADN, esta cifra probablemente sea conservadora. Birney estima que la proporción total del genoma que crea una proteína o se adhiere a una es de alrededor del 20 por ciento.

El resto de los elementos funcionales del análisis ENCODE cubren otras clases de secuencias que se pensaba que eran esencialmente sin funciones, incluidos los intrones. La idea de que los intrones definitivamente son un peso muerto no es cierta, dijo Birney. Incluso algunas secuencias repetitivas, pequeños fragmentos de ADN que tienen la capacidad de copiarse a sí mismos y que generalmente se consideran parásitos, probablemente sean funcionales y, a menudo, contengan secuencias a las que las proteínas se pueden unir para influir en la actividad de los genes cercanos. Quizás su propagación a través del genoma no represente la invasión de un parásito, sino una forma de difundir el control. Estos parásitos pueden subvertirse a veces, dijo Birney.

Birney espera que muchos escépticos discutan sobre la proporción exacta del 80 por ciento del genoma que ENCODE estima que está haciendo algo y sobre la definición de funcional. Pero, dijo, no importa cómo lo cortes, tenemos que acostumbrarnos al hecho de que suceden muchas más cosas con el genoma de lo que sabíamos.

¿Qué hay en un gen?

La visión simplista de un gen es que es un tramo de ADN que se transcribe para formar una proteína. Pero con los datos de ENCODE, esta definición ya no tiene sentido. Hay muchas transcripciones, probablemente más de las que nadie se había dado cuenta, algunas de las cuales conectan dos genes previamente desconectados. Esto significa que los límites de esos genes tienen que ampliarse, y las brechas entre ellos se reducen o desaparecen.

Gingeras dice que este espacio intergénico se ha reducido en un factor de cuatro. Una región que alguna vez se llamó Gene X ahora se fusionó con Gene Y, dice. Con límites tan borrosos, Gingeras piensa que ya no tiene sentido pensar en un gen como un punto específico en el genoma o como su unidad básica. En cambio, ese honor recae en la transcripción de ARN. El átomo del genoma es la transcripción, dice Gingeras. Son la unidad básica que se ve afectada por la mutación y la selección.

Nuevas enfermedades conducen

Durante la última década, los genetistas han analizado un flujo aparentemente interminable de genomas. -amplios estudios de asociación (GWAS), y han arrojado una larga lista de polimorfismos de un solo nucleótido (SNP) que se correlacionan con el riesgo de diferentes condiciones. El equipo de ENCODE mapeó todos estos SNP identificados por GWAS en sus datos.

Los investigadores encontraron que solo el 12 por ciento de los SNP conocidos se encuentran dentro de las áreas de codificación de proteínas. También mostraron que, en comparación con los SNP aleatorios, los asociados a enfermedades tienen un 60 por ciento más de probabilidades de estar dentro de las regiones no codificantes pero funcionales que identificó ENCODE, especialmente en promotores y potenciadores. Esto sugiere que muchas de estas variantes controlan la actividad de diferentes genes y proporciona muchas pistas nuevas para comprender cómo afectan nuestro riesgo de enfermedad. Fue uno de esos momentos demasiado buenos para ser verdad, dijo Birney. Literalmente, estaba en la sala [cuando obtuvieron el resultado] y dije: ¡Sí!

Los investigadores de ENCODE también encontraron nuevos vínculos entre los SNP asociados a enfermedades y elementos específicos del ADN. Por ejemplo, encontraron cinco SNP que aumentan el riesgo de enfermedad de Crohn y que son reconocidos por un grupo de factores de transcripción llamados GATA2. Eso no era algo que los biólogos de la enfermedad de Crohn tuvieran en su radar, dijo Birney. De repente, hicimos una asociación imparcial entre una enfermedad y una parte de la biología básica.

Ahora estamos trabajando con muchos biólogos de diferentes enfermedades mirando sus conjuntos de datos, agregó. En cierto sentido, ENCODE está trabajando desde el genoma, mientras que los estudios GWAS están trabajando desde la enfermedad. Hasta ahora, el equipo ha identificado 400 de estos puntos críticos que vale la pena investigar.

Los 3- Genoma D

Escribir el genoma como una cadena de letras invita a una falacia común: que es una entidad lineal bidimensional. En realidad, el ADN está envuelto alrededor de proteínas llamadas histonas como cuentas en un hilo. Luego, estos se retuercen, doblan y enrollan en una intrincada forma tridimensional. De esta manera, las partes distantes del genoma pueden ser vecinos físicos y pueden afectar la actividad de los demás.

Job Dekker, un bioinformático de la Facultad de Medicina de la Universidad de Massachussetts, utilizó datos de ENCODE para mapear estos datos de largo alcance. interacciones en solo el 1 por ciento del genoma en tres tipos diferentes de células, y descubrió más de 1,000 de ellas. Me gusta decir que nada en el genoma tiene sentido, excepto en 3D, dijo Dekker. La disponibilidad de los nuevos datos de ENCODE es realmente un adelanto para el futuro de la ciencia del genoma, agregó.

Compartir los datos

Los nuevos resultados de ENCODE son extenso, informado en 30 artículos centrales en Nature, Genome Biology y Genome Research, así como una gran cantidad de artículos secundarios en Science, Cell y otros. Y todos los datos están disponibles gratuitamente para el público.

Las páginas de las revistas impresas son un depósito deficiente para una gran cantidad de datos, por lo que el equipo de ENCODE ha ideado un nuevo modelo de publicación. En el sitio del portal ENCODE, los lectores pueden elegir uno de los 13 temas de interés, como secuencias de mejora, y seguirlos en hilos especiales que extraen todos los párrafos relevantes de los 30 artículos principales. En lugar de que las personas tengan que leer por encima los 30 documentos y determinar cuáles quieren leer, sacamos ese hilo para usted, dijo Birney.

El equipo también ha construido lo que ellos llaman una máquina virtual. , un programa descargable que incluye todo el código que los científicos de ENCODE utilizaron para analizar sus datos. Cualquier investigador puede descargar datos casi sin procesar y reproducir cualquiera de los análisis en los documentos por sí mismos. Es lo último en transparencia.

Con estos proyectos científicos realmente intensivos, tiene que haber una gran confianza en que los analistas de datos han hecho las cosas correctamente, dijo Birney. Con la máquina virtual, puedes reproducir absolutamente, paso a paso, lo que hicimos para llegar a la figura. Creo que debería ser el estándar para el futuro.

¿Le interesa leer más?

Conviértase en miembro de

Reciba acceso completo a más de 35 años de archivos, así como TS Digest, ediciones digitales de The Scientist, reportaje stories, ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí