Preguntas y respuestas: Genomas completos de 150.000 británicos revelan nuevas variantes genéticas
ARRIBA: ISTOCK.COM, JuSun
Una de las muchas sorpresas derivadas de la secuenciación del genoma humano fue la revelación de que la proteína Las secuencias codificantes constituyen una proporción relativamente pequeña de nuestro ADN. Estos exones, conocidos colectivamente como el exoma, representan menos del 2 por ciento del genoma humano. Aún así, los científicos a menudo buscan a través de los exomas la base genética de las enfermedades y tales búsquedas han resultado fructíferas, identificando a los culpables detrás de las enfermedades raras y los cambios genéticos patológicos en los tumores. Pero los investigadores se están dando cuenta cada vez más de que la secuenciación del exoma completo solo cuenta una parte de la historia: las mutaciones en las regiones no codificantes del genoma también pueden causar enfermedades, por ejemplo, al afectar la transcripción de un gen.
Kri Stefnsson CORTESÍA DE DAVID SLIPHER
Para comenzar a descubrir algunos de estos efectos pasados por alto, los investigadores analizaron recientemente las secuencias genómicas completas de más de 150 000 individuos del Biobanco del Reino Unido, una enorme base de datos que contiene muestras de ADN y datos fenotípicos de 500 000 individuos. Sus hallazgos, publicados el 20 de julio en Nature, incluyen 12 variantes genéticas no detectadas en la secuenciación del exoma completo que influyen en rasgos como la altura y la edad de inicio de la menarquia.
El científico habló con Kri Stefnsson, fundador de deCODE Genetics, que secuenció la mitad de los genomas analizados en el estudio, sobre la importancia de la secuenciación del genoma completo. (Amgen, la empresa matriz de deCODE, fue una de las cuatro empresas que contribuyeron a la financiación de los estudios; la otra mitad de la secuenciación fue realizada por el Instituto Wellcome Sanger).
El científico : ¿Qué es el Biobanco del Reino Unido y qué intenta lograr todo su consorcio de secuenciación del genoma?
Kri Stefnsson: Lo que siempre aspiramos a hacer en estudios de población como este es desarrollar la comprensión de la diversidad humana. La diversidad en el riesgo de enfermedad, la respuesta al tratamiento, la diversidad en lo que respecta al nivel educativo, el nivel socioeconómico, etc. cuál de estos dos produce los datos más útiles.
Cuando observamos estos 150,000 genomas, comenzamos a observar regiones que . . . tienen una conservación de secuencia sustancial. La suposición es que las regiones que son menos tolerantes a la diversidad de secuencias son las regiones que deben ser de mayor importancia funcional. Y cuando observamos el 1 por ciento del genoma que es menos tolerante a la diversidad de secuencias. . . El 83 por ciento de ellos están en las secuencias intragénicas, no en los exones. Por lo tanto, está absolutamente claro que hay una enorme cantidad de información que extraer [de] esas regiones.
Los exones son solo una parte muy pequeña de un genoma, y el resto del genoma no es inútil.
En este documento, también . . . enumeró alrededor de 12 fenotipos donde encontramos variantes en el genoma que se asocian con ellos, donde no pudimos encontrar lo mismo usando la secuenciación del exoma completo. Es absolutamente claro. . . que la secuenciación del exoma completo fue extremadamente valiosa, nos dio una visión espectacular del papel de las secuencias de codificación en la patogénesis de todo tipo de enfermedades, pero que la secuenciación del exoma completo no es suficiente.
TS: Entonces, ¿se intentó la secuenciación del genoma completo porque la secuenciación del exoma completo no capturó la imagen completa?
KS: La evolución es absolutamente despiadada y se deshace de todo lo que no necesitamos. . Los exones son solo una parte muy pequeña de un genoma, y el resto del genoma no es inútil. Está absolutamente claro que el resto del genoma es funcionalmente muy importante y, por lo tanto, no permite una diversidad de secuencias ilimitada.
Ver Adaptación con un poco de ayuda de los genes saltadores
TS : ¿Cuáles fueron los desafíos técnicos al realizar la secuenciación del genoma completo a esta gran escala?
KS: Hay todo tipo de desafíos, pero estamos bastante acostumbrados a escalar y tomar procesos que generalmente se realizan a una escala relativamente pequeña y hacerlos a gran escala. . . . Ciertamente hay una enorme cantidad de datos que provienen de 150.000 genomas. Hay un desafío, por ejemplo, en la llamada de variantes conjuntas [el proceso para identificar variantes genéticas a partir de datos de secuencia], cuando estás llamando a las variantes en todos estos genomas simultáneamente. Existe un desafío cuando se trata simplemente de puntuar, administrar y extraer estos datos. Esto se está convirtiendo, ante todo, en un desafío informático.
TS: ¿Cuáles son los desafíos pendientes?
KS: Todos somos aspirantes a comprender la diversidad humana. Y si observa los datos que provienen del Biobanco del Reino Unido, no es una muestra imparcial de la población de Gran Bretaña. Hay una representación excesiva de personas de ascendencia europea. Y lo que tenemos de diversidad de secuencias de personas de ascendencia africana, de ascendencia asiática, etcétera, es mucho menos de lo que necesitamos.
Es increíblemente importante. . . desde un punto de vista científico, para conseguir una mayor representación de personas de otras etnias. También es, desde un punto de vista social, inaceptable tener esta poca información sobre personas de otras ascendencias. La disparidad en el cuidado de la salud en el mundo comienza con el hecho de que sabemos menos sobre la naturaleza de las enfermedades en personas de otros orígenes que los europeos. . . . Entonces, uno de los desafíos es asegurarnos de que tengamos cohortes formidables de personas de otras ascendencias para trabajar.
Vea que los riesgos genéticos para la depresión difieren entre los grupos ancestrales
TS: ¿Qué aprendió de la secuenciación del genoma completo publicada en el artículo?
KS: La lección principal y más importante es . . . cómo [un] porcentaje increíblemente grande de las regiones con alta conservación de secuencia están fuera de los exones. . . . Significa que tenemos una tarea formidable por delante para anotar las regiones con bajo puntaje de agotamiento o poca tolerancia a la diversidad de secuencias.
TS: E identificó varias variantes asociado con la diversidad fenotípica?
KS: Ese es solo el primer paso. Enumeramos alrededor de 12 asociaciones, pero esta es la diversidad de secuencias para que trabaje el resto del mundo, para buscar correlaciones entre las variantes en la secuencia y los fenotipos. Y solo ponemos algunos ejemplos de cómo podríamos hacer esto con la secuenciación del genoma completo donde no pudimos encontrar esto con la secuenciación del exoma completo.
TS: Las secuencias del genoma están disponibles en línea, para que otros investigadores trabajen en ellos?
KS: Estarán disponibles a través del Biobanco del Reino Unido. También ponemos en nuestro sitio web una base de datos de frecuencias alélicas. La razón por la que lo hicimos es que cuando realiza la secuenciación del genoma completo con fines de diagnóstico, es extremadamente importante tener una referencia a la que pueda acudir, para asegurarse de que está secuenciando a alguien con una enfermedad en particular y encuentra una variante rara. . . que la variante que encuentras en el desafortunado niño no se encuentra en un grupo de individuos sanos. Por lo tanto, es un recurso valioso para quienes desean trabajar en la secuenciación de diagnóstico. . . . Sentimos que era nuestro deber ponerlo a disposición de todos los que trabajan en la secuenciación de diagnóstico.
Nota del editor: esta entrevista ha sido editada para abreviar.