Biblia

Investigación sobre el COVID-19 sesgada hacia solo un puñado de genes

Investigación sobre el COVID-19 sesgada hacia solo un puñado de genes

ARRIBA: ISTOCK.COM, THEASIS

Los científicos han identificado más de 2000 genes humanos relacionados con el COVID-19, pero la mayor parte de los la literatura publicada está dominada solo por un pequeño subconjunto de ellos, un hecho que puede estar limitando el progreso en la lucha contra la pandemia.

Un equipo de la Universidad Northwestern, dirigido por el científico de datos Thomas Stoeger, había demostrado previamente que Los científicos tienden a centrarse en un puñado de genes, específicamente, menos del 20 por ciento de todos los genes en el genoma humano representaron más del 90 por ciento de las publicaciones que analizaron. Antes del Proyecto del Genoma Humano, los científicos tenían una visión incompleta del conjunto completo de genes humanos y confiaban más en aquellos que tenían análogos en organismos modelo o que eran más fáciles de estudiar mediante experimentos knockout. El advenimiento de la tecnología de secuenciación moderna, que incluye herramientas complementarias como CRISPR, espectrometría de masas y enfoques basados en ARN, ha ampliado lo que saben los investigadores, pero parece que los científicos aún se aferran a patrones antiguos.

Thomas StoegerHelio Tejedor Navarro

En un En un estudio publicado hoy (24 de noviembre) en eLife, Stoeger y su colega de Northwestern, Lus Amaral, observaron la investigación de COVID-19 para ver si los científicos estaban priorizando de manera similar ciertos genes durante la pandemia en informes de casos e investigaciones sobre mecanismos de infección y transmisión, herramientas de diagnóstico y tratamientos. La pareja analizó 10 395 artículos publicados y preprints y comparó los genes estudiados en esas publicaciones con una lista de genes vinculados al virus a través de estudios de asociación de genoma completo (GWAS).

A medida que avanza la pandemia, encontraron, los científicos se han centrado en un pequeño subconjunto de genes con exclusión de otros que también pueden ser importantes. De los aproximadamente 2000 genes identificados por los informes de GWAS, solo 611 se incluyeron en la literatura que analizaron. En particular, tres genes, que codifican [KG1] para la enzima convertidora de angiotensina 2 (ACE2), un receptor que el virus usa para ingresar a las células; proteína C reactiva, un marcador de inflamación; y la interleucina 6, una molécula de señalización involucrada en las respuestas inflamatorias, representó el 25 por ciento de la investigación total. Cuando compararon estos artículos sobre la COVID-19 con un conjunto de aproximadamente 466 000 artículos que no eran sobre la COVID-19 anteriores a 2016, Stoeger y Nunes descubrieron que, independientemente de si la investigación se relacionaba o no con la pandemia, los mismos tipos de genes que son ventajosos para la experimentación aún atraen la mayor atención.  

El científico habló con Stoeger sobre cómo los investigadores eligen qué genes estudiar, qué información podrían estar perdiendo y las formas en que la investigación puede abrirse a genes que antes se habían pasado por alto.  

Mira cómo los científicos juegan a sus favoritos con el estudio de los genes humanos. He aquí por qué.

El científico:  En el artículo, usted menciona este sesgo histórico en torno a los genes en los que los científicos eligen enfocarse, y habla sobre cómo estas elecciones son anteriores al Proyecto Genoma Humano. ¿Puedes describir cómo seleccionaban las personas los genes para estudiar antes del Proyecto Genoma Humano?

Thomas Stoeger: La ciencia es difícil, por lo que los científicos comienzan con la problemas de investigación menos difíciles. Las preguntas de investigación en las que trabajaron los científicos antes del Proyecto Genoma Humano tendían a ser sobre genes que son interesantes y muy útiles para estudiar, pero también resultaron ser más fáciles de estudiar de diferentes maneras.

Una manera es que los genes humanos [que eligieron] también tenían genes relacionados en organismos modelo, como moscas de la fruta o gusanos, y el gen relacionado ya había sido estudiado. Los genes más cortos también se han estudiado mucho más que otros. . . porque son más fáciles de trabajar. Y también hay algunas otras propiedades químicas, por ejemplo, las proteínas codificadas por los genes. Cuando las proteínas se asientan en el exterior de la célula, por ejemplo, es más fácil acceder a ellas. Todas estas cosas juntas hicieron que la experimentación fuera menos difícil.

TS  ¿Cómo se basa este nuevo artículo en el trabajo anterior que ha realizado para analizar este sesgo en la elección de genes para la investigación?

Stoeger: Es nuestro deseo capturar todos los aspectos de la biología y hacer que estén interrelacionados para que podamos comparar las cuestiones sociales con las cuestiones de química [y] biología. Conceptualmente, este documento es un poco diferente del anterior. El último fue principalmente sobre cosas que estaban en el pasado. Ahora, queremos saber para algo muy actual en el que muchos científicos están trabajando en lo mismo, ¿hasta qué punto nos apegamos al mismo sesgo del pasado o hasta qué punto hacemos algo nuevo? Entonces, tal vez la mejor respuesta sería para mí decir que queremos saber si las amenazas globales emergentes están sujetas a los mismos sesgos que afectan al resto de la literatura médica.

Ver dos regiones genéticas vinculadas con COVID grave -19

TS¿Me puede contar un poco más sobre LitCovid, ¿el programa que usó para identificar los genes que se están estudiando en la investigación de COVID-19?

Stoeger: Soy un científico de datos que trata de integrar muchos recursos diferentes. Siempre estoy especialmente agradecido cuando otras instituciones ya han limpiado los datos y los han mejorado. 

LitCovid es una lista seleccionada de publicaciones relacionadas con COVID-19 [administrada por los Health], y ya han etiquetado computacionalmente conceptos individuales dentro de esos artículos. Puedes imaginarlo con todos los resúmenes, títulos y resultados, y cada vez que hay una palabra vinculada a un gen, hay algo insertado en el texto que dice: Aquí hay un gen, y cada gen tiene un número único. Computacionalmente, lo que están haciendo es usar un tipo de procesamiento de lenguaje natural para hacer un modelo de cómo funciona el lenguaje y crear etiquetas que se relacionen con genes o enfermedades. combínelo con otros datos, como datos del pasado o datos de diferentes experimentos, para ver cómo todas estas cosas diferentes se relacionan entre sí.

TS : ¿Qué tipo de información podríamos estar perdiendo si nos enfocamos solo en este pequeño subconjunto de genes? >

Stoeger: La respuesta honesta es que realmente no lo sabemos. No sabemos qué hacen todos estos otros genes que aparecen en grandes experimentos relacionados con COVID-19. Muchos de los genes más estudiados en la literatura sobre COVID-19 son genes muy importantes y deben estudiarse, pero no son la historia completa.

TS : ¿Cómo pueden los científicos salir de esta rutina y llevar algunos de estos genes inexplorados al trabajo de los científicos?

Stoeger: Esto es algo que trataremos de responder en un próximo trabajo al analizar históricamente casos en los que las personas lograron hacer que algunos genes fueran más populares, [aunque] nos damos cuenta de que es muy raro que las personas tengan éxito.

Pero hay algunas estrategias que podrían funcionar mejor que otras. Una estrategia es básicamente . . . Tome estos experimentos que examinan nuestros genes y enfóquese realmente en los nuevos. Otra cosa para fomentar el trabajo en este sector [sería] iniciativas que soliciten subvenciones de investigación individuales. En este momento, estos solo incluyen un par de genes, pero tal vez haya 10,000 o más genes que valdría la pena estudiar. Y luego hay una estrategia que yo personalmente sigo, que es tomar un contexto biológico realmente importante que ya se ha estudiado mucho, como el envejecimiento, y tomar toda la evidencia que existe y enfocarse en estos genes que se han pasado por alto pero que tienen alguna evidencia creciente de que son importantes.

TS: Dijiste que si miras en la historia , hay ejemplos de genes que se están volviendo más populares. ¿Tiene algún ejemplo de eso que le venga a la mente?

Stoeger: Hay un gen llamado C9orf72 que ahora es uno de los genes más populares de los últimos 10 años. Un grupo [llevó a cabo] estudios de asociación de genoma completo para la asociación entre algunas enfermedades neurológicas y diferentes mutaciones en el genoma humano. Descubrieron que las mutaciones en este gen estaban asociadas con [demencia y esclerosis lateral amiotrófica (ELA)]. La gente no esperaba que este gen estuviera relacionado con estas enfermedades, pero de repente se demostró que este gen por sí solo era mejor para explicar qué pacientes sufrirían las enfermedades que cualquier otro gen que ya se había estudiado.

T. Stoeger, LAN Amaral, la investigación sobre la COVID-19 corre el riesgo de ignorar genes importantes del huésped debido a patrones de investigación preestablecidos, eLife, doi:10.7554 /eLife.61981, 2020.

Nota del editor: la entrevista fue editada por motivos de brevedad.