Ahora completamente completo, el genoma humano revela nuevos secretos
Cuando los investigadores compararon las regiones centroméricas de 1.600 personas de todo el mundo, encontraron que aquellos sin ascendencia africana reciente en su mayoría tenían dos tipos de variaciones de secuencia. Las proporciones de estas dos variaciones están representadas por las cuñas negras y grises claras dentro de los círculos, que se colocan en el mapa cerca del lugar donde se tomaron muestras de cada grupo de individuos. Los de África u otras áreas con una gran proporción de personas con ascendencia africana reciente, como el Caribe, tenían mucha más variación de secuencia centromérica, representada por las cuñas multicolores. Tales variaciones podrían ayudar a rastrear cómo evolucionan las regiones centroméricas, así como también cómo estas variantes genéticas se relacionan con la salud y la enfermedad. Crédito: Nicolas Altemose, UC Berkeley.
Cuando los científicos anunciaron la secuencia completa del genoma humano en 2003, se equivocaron un poco.
De hecho, casi 20 años después, alrededor del 8 % del genoma nunca se ha secuenciado por completo, en gran parte porque consiste en fragmentos de ADN muy repetitivos que son difíciles de alinear con el resto.
Pero un consorcio de tres años finalmente completó ese ADN restante, proporcionando la primera secuencia genómica completa y sin espacios para que los científicos y médicos puedan consultarla.
El genoma recién completado, denominado T2T-CHM13, representa una importante actualización del genoma de referencia actual, llamado GRCh38, que utilizan los médicos cuando buscan mutaciones relacionadas con enfermedades, así como los científicos que analizan la evolución de la variación genética humana.
Entre otras cosas, el Las nuevas secuencias de ADN revelan detalles nunca antes vistos sobre la región alrededor del centrómero, que es donde los cromosomas se agarran y separan cuando las células se dividen, asegurando que cada célula «hija» herede la cantidad correcta de cromosomas. La variabilidad dentro de esta región también puede proporcionar nueva evidencia de cómo evolucionaron nuestros ancestros humanos en África.
«Descubrir la secuencia completa de estas regiones del genoma que antes faltaban nos dijo mucho sobre cómo están organizadas, lo que era totalmente desconocido para muchos cromosomas», dijo Nicolas Altemose, becario postdoctoral en la Universidad de California, Berkeley, y coautor de cuatro nuevos artículos sobre el genoma completo. «Antes, solo teníamos la imagen más borrosa de lo que había allí, y ahora es nítido hasta la resolución de un solo par de bases».
Altemose es el primer autor de un artículo que describe las secuencias de pares de bases alrededor del centrómero. . Un artículo que explica cómo se realizó la secuenciación aparecerá en la edición impresa del 1 de abril de la revista Science, mientras que el artículo centrómero de Altemose y otros cuatro que describen lo que nos dicen las nuevas secuencias se resumen en la revista con los artículos completos publicados en línea. Cuatro artículos complementarios, incluido uno del que Altemose es coautor, también aparecerán en línea el 1 de abril en la revista Nature Methods.
La secuenciación y el análisis fueron realizados por un equipo de más de 100 personas, el llamado Telemere-to-Telomere Consortium, o T2T, llamado así por los telómeros que cubren los extremos de todos los cromosomas. La versión sin espacios del consorcio de los 22 autosomas y el cromosoma sexual X está compuesta por 3.055 millones de pares de bases, las unidades a partir de las cuales se construyen los cromosomas y nuestros genes, y 19.969 genes que codifican proteínas. De los genes que codifican proteínas, el equipo de T2T encontró alrededor de 2000 nuevos, la mayoría de ellos desactivados, pero 115 de los cuales aún pueden expresarse. También encontraron alrededor de 2 millones de variantes adicionales en el genoma humano, 622 de las cuales ocurren en genes médicamente relevantes.
«En el futuro, cuando alguien tenga su genoma secuenciado, podremos identificar todos los variantes en su ADN y usar esa información para guiar mejor su atención médica», dijo Adam Phillippy, uno de los líderes de T2T e investigador principal del Instituto Nacional de Investigación del Genoma Humano (NHGRI, por sus siglas en inglés) de los Institutos Nacionales de Salud. «Verdaderamente terminar la secuencia del genoma humano fue como ponerse un nuevo par de anteojos. Ahora que podemos verlo todo claramente, estamos un paso más cerca de comprender lo que significa».
El centrómero en evolución
Las nuevas secuencias de ADN en y alrededor del centrómero totalizan alrededor del 6,2% del genoma completo, o casi 190 millones de pares de bases, o nucleótidos. De las secuencias restantes recién agregadas, la mayoría se encuentran alrededor de los telómeros al final de cada cromosoma y en las regiones que rodean los genes ribosómicos. Todo el genoma está formado por solo cuatro tipos de nucleótidos que, en grupos de tres, codifican los aminoácidos utilizados para construir proteínas. La investigación principal de Altemose consiste en encontrar y explorar áreas de los cromosomas donde las proteínas interactúan con el ADN.
«Sin proteínas, el ADN no es nada», dijo Altemose, quien obtuvo un doctorado. en bioingeniería conjuntamente de UC Berkeley y UC San Francisco en 2021 después de haber recibido un D.Phil. en estadística de la Universidad de Oxford. «El ADN es un conjunto de instrucciones que nadie puede leer si no tiene proteínas alrededor para organizarlo, regularlo, repararlo cuando está dañado y replicarlo. Las interacciones proteína-ADN son realmente donde sucede toda la acción». regulación del genoma, y ser capaz de mapear dónde ciertas proteínas se unen al genoma es realmente importante para comprender su función».
Después de que el consorcio T2T secuenciara el ADN faltante, Altemose y su equipo usaron nuevas técnicas para encontrar el lugar dentro del centrómero donde un gran complejo proteico llamado cinetocoro sujeta firmemente el cromosoma para que otras máquinas dentro del núcleo puedan separar los pares de cromosomas.
«Cuando esto sale mal, terminas con cromosomas mal segregados y eso lleva a todo tipo de problemas», dijo. «Si eso sucede en la meiosis, eso significa que puede tener anomalías cromosómicas que conducen a un aborto espontáneo o enfermedades congénitas. Si sucede en las células somáticas, puede terminar con cáncer, básicamente, células que tienen una mala regulación masiva».
Los husos ( verde) que separan los cromosomas durante la división celular se unen a un complejo proteico llamado cinetocoro, que se adhiere al cromosoma en un lugar llamado centrómero, una región que contiene secuencias de ADN altamente repetitivas. La comparación de las secuencias de estas repeticiones reveló dónde se han acumulado las mutaciones durante millones de años, lo que refleja la edad relativa de cada repetición. Las repeticiones en el centrómero activo tienden a ser las secuencias duplicadas más jóvenes y más recientes en la región, y tienen una metilación de ADN sorprendentemente baja. Alrededor del centrómero activo en ambos lados hay repeticiones más antiguas, probablemente las reliquias de los centrómeros anteriores, con las más antiguas más alejadas del centrómero activo. Los investigadores esperan que los nuevos métodos experimentales ayuden a revelar por qué los centrómeros evolucionan desde el medio, así como por qué este patrón está tan estrechamente asociado con la unión del cinetocoro y con una baja metilación del ADN. Crédito: Nicolas Altemose, UC Berkeley
Lo que encontraron dentro y alrededor de los centrómeros fueron capas de nuevas secuencias superpuestas a capas de secuencias más antiguas, como si a través de la evolución se hubieran establecido repetidamente nuevas regiones de centrómeros para unirse al cinetocoro. Las regiones más antiguas se caracterizan por mutaciones y deleciones más aleatorias, lo que indica que la célula ya no las utiliza. Las secuencias más nuevas donde se une el cinetocoro son mucho menos variables y también menos metiladas. La adición de un grupo metilo es una etiqueta epigenética que tiende a silenciar los genes.
Todas las capas dentro y alrededor del centrómero están compuestas de longitudes repetitivas de ADN, basadas en una unidad de aproximadamente 171 pares de bases de largo, que es aproximadamente la longitud del ADN que envuelve un grupo de proteínas para formar un nucleosoma, manteniendo el ADN empaquetado y compacto. Estas unidades de 171 pares de bases forman estructuras repetidas aún más grandes que se duplican muchas veces en tándem, creando una gran región de secuencias repetitivas alrededor del centrómero.
El equipo de T2T se centró en un solo genoma humano, obtenido de un tumor no canceroso llamado mola hidatiforme, que es esencialmente un embrión humano que rechazó el ADN materno y en su lugar duplicó su ADN paterno. Tales embriones mueren y se transforman en tumores. Pero el hecho de que este lunar tuviera dos copias idénticas del ADN paterno, ambas con el cromosoma X del padre, en lugar de ADN diferente tanto de la madre como del padre, facilitó la secuenciación.
Los investigadores también publicaron esta semana la secuencia completa. de un cromosoma Y de una fuente diferente, que tardó casi tanto en ensamblarse como el resto del genoma combinado, dijo Altemose. El análisis de esta nueva secuencia del cromosoma Y aparecerá en una publicación futura.
Altemose y su equipo, que incluía a la científica del proyecto de UC Berkeley Sasha Langley, también utilizaron el nuevo genoma de referencia como andamio para comparar el ADN centromérico. de 1.600 individuos de todo el mundo, revelando grandes diferencias tanto en la secuencia como en el número de copias del ADN repetitivo alrededor del centrómero. Estudios anteriores han demostrado que cuando grupos de humanos antiguos emigraron de África al resto del mundo, solo se llevaron una pequeña muestra de variantes genéticas. Altemose y su equipo confirmaron que este patrón se extiende a los centrómeros.
«Lo que encontramos es que en individuos con ascendencia reciente fuera del continente africano, sus centrómeros, al menos en el cromosoma X, tienden a dividirse en dos grandes grupos, mientras que la mayor parte de la variación interesante está en individuos que tienen ascendencia africana reciente», dijo Altemose. «Esto no es del todo una sorpresa, dado lo que sabemos sobre el resto del genoma. Pero lo que sugiere es que si queremos ver la variación interesante en estas regiones centroméricas, realmente necesitamos tener un esfuerzo enfocado para secuenciar más genomas africanos y completan el ensamblaje de secuencias de telómero a telómero».
Las secuencias de ADN alrededor del centrómero también podrían usarse para rastrear linajes humanos hasta nuestros ancestros simios comunes, anotó.
«A medida que te alejas del sitio del centrómero activo, obtienes una secuencia cada vez más degradada, hasta el punto de que si vas a las orillas más lejanas de este mar de secuencias repetitivas, comienzas a ver el centrómero antiguo que , tal vez, nuestros ancestros primates distantes solían unirse al cinetocoro», dijo Altemose. «Es casi como capas de fósiles».
La secuenciación de lectura larga cambia las reglas del juego
El éxito de T2T se debe a técnicas mejoradas para secuenciar tramos largos de ADN a la vez, lo que ayuda cuando determinar el orden de tramos de ADN altamente repetitivos. Entre estos se encuentra la secuenciación HiFi de PacBio, que puede leer longitudes de más de 20 000 pares de bases con alta precisión. La tecnología desarrollada por Oxford Nanopore Technologies Ltd., por otro lado, puede leer hasta varios millones de pares de bases en secuencia, aunque con menos fidelidad. A modo de comparación, la llamada secuenciación de próxima generación de Illumina Inc. se limita a cientos de pares de bases.
«Estas nuevas tecnologías de secuenciación de ADN de lectura larga son simplemente increíbles; solo para este mundo de ADN repetitivo, sino porque le permiten secuenciar moléculas de ADN largas y únicas», dijo Altemose. «Puede comenzar a hacer preguntas a un nivel de resolución que simplemente no era posible antes, ni siquiera con métodos de secuenciación de lectura corta».
Altemose planea explorar más las regiones centroméricas, utilizando una técnica mejorada él y sus colegas de Stanford desarrollaron para identificar los sitios en el cromosoma que están unidos por proteínas, de manera similar a cómo el cinetocoro se une al centrómero. Esta técnica también utiliza tecnología de secuenciación de lectura larga. Él y su grupo describieron la técnica, llamada Metilación dirigida con secuenciación de lectura larga (DiMeLo-seq), en un artículo que apareció esta semana en la revista Nature Methods.
Mientras tanto, el consorcio T2T se está asociando con Human PanGenome Reference Consortium para trabajar en un genoma de referencia que represente a toda la humanidad.
«En lugar de tener solo una referencia de un individuo humano o una mola hidatiforme, que ni siquiera es un individuo humano real, deberíamos tener una referencia que represente a todos», dijo Altemose. «Hay varias ideas sobre cómo lograr eso. Pero lo primero que necesitamos es comprender cómo se ve esa variación, y necesitamos muchas secuencias genómicas individuales de alta calidad para lograrlo».
Su el trabajo en las regiones centroméricas, al que llamó «un proyecto apasionante», fue financiado por becas posdoctorales. Los líderes del proyecto T2T fueron Karen Miga de UC Santa Cruz, Evan Eichler de la Universidad de Washington y Adam Phillippy de NHGRI, quienes proporcionaron gran parte de los fondos. Otros coautores de UC Berkeley del artículo centrómero son Aaron Streets, profesor asistente de bioingeniería; Abby Dernburg y Gary Karpen, profesores de biología molecular y celular; la científica del proyecto Sasha Langley; y la ex becaria postdoctoral Gina Caldas.
Explorar más
Nuevo genoma humano de referencia abre regiones inexploradas Más información: Nicolas Altemose et al, Mapas genómicos y epigenéticos completos de centrómeros humanos, Science (2022). DOI: 10.1126/ciencia.abl4178. www.science.org/doi/10.1126/science.abl4178 Información de la revista: Science , Nature Methods
Proporcionado por la Universidad de California – Berkeley Cita: ahora totalmente completa , el genoma humano revela nuevos secretos (31 de marzo de 2022) recuperado el 29 de agosto de 2022 de https://medicalxpress.com/news/2022-03-fully-human-genome-reveals-secrets.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.