Biblia

Más que la suma de mutaciones: 165 nuevos genes del cáncer identificados con la ayuda del aprendizaje automático

Más que la suma de mutaciones: 165 nuevos genes del cáncer identificados con la ayuda del aprendizaje automático

Viendo «a través» del cáncer con el poder del análisis de datos, posible con la ayuda de la inteligencia artificial. Crédito: MPI f. Molecular Genetics/ Ella Maru Studio

Un nuevo algoritmo puede predecir qué genes causan cáncer, incluso si su secuencia de ADN no cambia. Un equipo de investigadores en Berlín combinó una amplia variedad de datos, los analizó con «inteligencia artificial» e identificó numerosos genes del cáncer. Esto abre nuevas perspectivas para la terapia dirigida contra el cáncer en medicina personalizada y para el desarrollo de biomarcadores.

En el cáncer, las células se descontrolan. Proliferan y se abren camino en los tejidos, destruyendo órganos y, por lo tanto, afectando funciones vitales esenciales. Este crecimiento sin restricciones generalmente es inducido por una acumulación de cambios en el ADN en los genes del cáncer, es decir. mutaciones en estos genes que gobiernan el desarrollo de la célula. Pero algunos cánceres tienen muy pocos genes mutados, lo que significa que otras causas conducen a la enfermedad en estos casos.

Un equipo de investigadores del Instituto Max Planck de Genética Molecular (MPIMG) en Berlín y del El Instituto de Biología Computacional de Helmholtz Zentrum Mnchen desarrolló un nuevo algoritmo utilizando tecnología de aprendizaje automático para identificar 165 genes de cáncer previamente desconocidos. Aparentemente, las secuencias de estos genes no están necesariamente alteradas, ya que una desregulación de estos genes puede conducir al cáncer. Todos los genes recientemente identificados interactúan estrechamente con genes de cáncer bien conocidos y se ha demostrado que son esenciales para la supervivencia de las células tumorales en experimentos de cultivo celular.

Objetivos adicionales para la medicina personalizada

El algoritmo, denominado «EMOGI» por Integración de gráficos multiómicos explicables, también puede explicar las relaciones en la maquinaria de la célula que hacen que un gen sea un gen canceroso. Como describe el equipo de investigadores encabezado por Annalisa Marsico en la revista Nature Machine Intelligence, el software integra decenas de miles de conjuntos de datos generados a partir de muestras de pacientes. Estos contienen información sobre las metilaciones del ADN, la actividad de los genes individuales y las interacciones de las proteínas dentro de las vías celulares, además de datos de secuencias con mutaciones. En estos datos, un algoritmo de aprendizaje profundo detecta los patrones y los principios moleculares que conducen al desarrollo del cáncer.

«Idealmente, obtenemos una imagen completa de todos los genes del cáncer en algún momento, que puede tener un diferente impacto en la progresión del cáncer para diferentes pacientes», dice Marsico, jefe de un grupo de investigación en MPIMG hasta hace poco y ahora en Helmholtz Zentrum Mnchen. «Esta es la base para la terapia personalizada contra el cáncer».

A diferencia de los tratamientos convencionales contra el cáncer, como la quimioterapia, los enfoques de terapia personalizada adaptan la medicación precisamente al tipo de tumor. “El objetivo es seleccionar la mejor terapia para cada paciente, es decir, el tratamiento más efectivo con la menor cantidad de efectos secundarios. Además, seríamos capaces de identificar cánceres que ya se encuentran en etapas tempranas, en función de sus características moleculares”.

“Solo si conocemos las causas de la enfermedad seremos capaces de contrarrestarlas o corregirlas de forma eficaz”, afirma la investigadora. «Por eso es tan importante identificar tantos mecanismos como sea posible que puedan inducir cánceres».

Mejores resultados por combinación

«Hasta ahora, la mayoría de las investigaciones se han centrado en los cambios patogénicos en el secuencia genética, es decir, en el modelo de la célula», dice Roman Schulte-Sasse, estudiante de doctorado en el equipo de Marsico y primer autor de la publicación. «Al mismo tiempo, se ha hecho evidente en los últimos años que las perturbaciones epigenéticas o la actividad genética desregulada también pueden provocar cáncer».

Es por eso que los investigadores fusionaron datos de secuencias que reflejan fallas en el modelo información que representa eventos dentro de la celda. Inicialmente, los científicos confirmaron que las mutaciones, o la multiplicación de segmentos del genoma, son de hecho los principales impulsores del cáncer. Luego, en un segundo paso, identificaron genes candidatos que están en un contexto menos directo con el gen real que impulsa el cáncer.

«Por ejemplo, encontramos genes cuya secuencia no cambia en su mayoría en el cáncer y, sin embargo, son indispensables para el tumor porque regulan el suministro de energía», dice Schulte-Sasse. Estos genes están fuera de control por otros medios, por ejemplo, debido a cambios químicos en el ADN como metilaciones. Estas modificaciones dejan intacta la información de la secuencia pero gobiernan la actividad de un gen. «Dichos genes son objetivos farmacológicos prometedores, pero debido a que operan en segundo plano, solo podemos encontrarlos mediante el uso de algoritmos complejos».

En busca de pistas para estudios adicionales

La investigación del investigador El nuevo programa añade un número considerable de nuevas entradas a la lista de genes sospechosos de cáncer, que ha crecido entre 700 y 1.000 en los últimos años. Fue solo a través de una combinación de análisis bioinformático y los métodos más nuevos de inteligencia artificial (IA) que los investigadores pudieron rastrear los genes ocultos.

«Las interacciones de las proteínas y los genes se pueden mapear como un mapa matemático conocida como gráfico», dice Schulte-Sasse. «Puedes pensar en ello como intentar adivinar una red ferroviaria; cada estación corresponde a una proteína o gen, y cada interacción entre ellos es la conexión del tren».

Con la ayuda del aprendizaje profundo, los mismos algoritmos que han ayudado a la inteligencia artificial a hacer un gran avance en los últimos años, los investigadores pudieron descubrir incluso esas conexiones de trenes que antes habían pasado desapercibidas. Schulte-Sasse hizo que la computadora analizara decenas de miles de mapas de red diferentes de 16 tipos de cáncer diferentes, cada uno de los cuales contenía entre 12 000 y 19 000 puntos de datos.

Adecuado también para otros tipos de enfermedades

Ocultos en los datos hay muchos más detalles interesantes. «Vemos patrones que dependen del cáncer y el tejido en particular», dice Marsico. «Vemos esto como evidencia de que los tumores son desencadenados por diferentes mecanismos moleculares en diferentes órganos».

El programa EMOGI no se limita al cáncer, enfatizan los investigadores. En teoría, se puede usar para integrar diversos conjuntos de datos biológicos y encontrar patrones allí, explica Marsico. «Podría ser útil aplicar nuestro algoritmo para enfermedades complejas similares para las que se recopilan datos multifacéticos y donde los genes juegan un papel importante. Un ejemplo podría ser enfermedades metabólicas complejas como la diabetes».

Explore más

Un nuevo algoritmo de predicción identifica genes impulsores de cáncer no detectados previamente. Más información: Roman Schulte-Sasse et al. Integración de datos multiómicos con redes convolucionales de gráficos para identificar nuevos genes de cáncer y sus mecanismos moleculares asociados, Nature Machine Intelligence (2021). DOI: 10.1038/s42256-021-00325-y Información del diario: Nature Machine Intelligence

Proporcionado por Max Planck Society Cita: Más que la suma de mutaciones: 165 nuevos genes del cáncer identificados con la ayuda del aprendizaje automático (2021, 12 de abril) recuperado el 30 de agosto de 2022 de https://medicalxpress.com/news/2021-04-sum-mutations-cancer-genes-machine.html Este documento está sujeto a los derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.