Nueva técnica responsable de compartir datos permitirá una mejor comprensión de las variantes genéticas que causan enfermedades
Esta abstracción gráfica del proceso de análisis federado muestra cómo el proceso pasa del desarrollo de software en el Instituto de Genómica de UC Santa Cruz a la clasificación de variantes. Crédito: James Casaletto
Los científicos pueden comprender y evaluar mejor las variaciones genéticas que causan el cáncer y otras enfermedades hereditarias mediante la aplicación de una estrategia novedosa para compartir y analizar datos genómicos de forma segura desarrollada en el Instituto de Genómica de UC Santa Cruz.
Comprender la importancia clínica de las variantes genéticas raras requiere analizar grandes cantidades de datos genómicos y clínicos. Sin embargo, las políticas de privacidad restringen el intercambio de esta información entre instituciones, y es probable que ninguna institución tenga todos los recursos necesarios para un análisis sólido.
En un artículo publicado el 9 de marzo en la revista Cell Genomics, Los investigadores de la UCSC demostraron que un enfoque denominado análisis federado puede superar este problema al «llevar el código a los datos». Esta es la primera aplicación de análisis federado que permite la clasificación de variantes genéticas previamente no clasificadas.
«Tenemos que encontrar formas de llegar a los datos que respeten la privacidad, pero aún así permitir que los investigadores hagan su investigación, por lo que el federado modelo es definitivamente el camino del futuro», dijo James Casaletto, Ph.D. candidata en la Facultad de Ingeniería Baskin de la UCSC y autora principal del artículo.
El estudio se centró en las variantes genéticas de los genes del cáncer de mama BRCA1 y BRCA2. Las personas que heredan variantes dañinas de uno de estos genes tienen un mayor riesgo de cáncer de mama, de ovario y de otro tipo. Sin embargo, muchas personas tienen variantes de significado desconocido (VUS) en estos genes, lo que significa que los científicos no saben si estas variantes son dañinas o no.
El nuevo estudio proporciona una comprensión más matizada de BRCA1 y BRCA2. variantes. También sirve como una «prueba de concepto» de una nueva técnica de análisis e intercambio de datos para evaluar las implicaciones clínicas de las variantes genéticas.
Las VUS específicas son raras individualmente, pero colectivamente es común que ocurran VUS en general. en la población humana. Para comprender mejor exactamente qué VUS causan enfermedades, los investigadores deben realizar análisis delicados en un amplio conjunto de datos, que luego pueden ser interpretados por expertos para sacar conclusiones clínicas.
«Esto tiene que ver con la persona común que tal vez se pregunte si hay antecedentes de cáncer en su familia y si ha heredado ese riesgo familiar de cáncer», dijo Melissa Cline, científica investigadora del Instituto de Genómica de la UCSC. «Todo este trabajo tiene como objetivo mejorar las pruebas genéticas».
Sin embargo, la mayoría de los datos de salud humana del mundo están ‘encerrados’ o almacenados de manera inaccesible debido a las leyes de privacidad, y las instituciones pueden estar tienen prohibido exportar los datos genómicos que recopilan, lo que los hace inaccesibles para los investigadores que estudian variantes genéticas.
Además, la ingeniería del software necesario para ejecutar estos análisis es compleja y, por lo general, no puede ser realizada por el genetista promedio. Los investigadores de la UCSC están abordando estos dos problemas con su novedoso enfoque de análisis federado.
En el enfoque de análisis federado, los investigadores llevan el código a los datos, evitando en absoluto la necesidad de exportar datos confidenciales. El software del UCSC Genomics Institute se envía en un «contenedor» a cualquier institución colaboradora en todo el mundo que albergue un conjunto valioso pero protegido de datos genómicos. Luego, la institución colaboradora usa el software para analizar sus datos dentro del entorno seguro de su institución, generando datos resumidos que no revelan información personal sobre pacientes individuales.
Este enfoque garantiza que los datos del paciente cumplan con las estrictas reglas de privacidad. de una institución que no les permite exportar datos, pero permite a los investigadores recopilar un conjunto mucho más amplio de datos genómicos que pueden conducir a mejores conclusiones clínicas. Además, el análisis federado puede sortear los problemas de cargar, descargar y mover grandes conjuntos de datos que pueden ser prohibitivamente grandes.
«[El documento es] una prueba de concepto de que tenemos esta tecnología de contenedores, lo hemos aprovechado para BRCA1 y BRCA2, también hemos demostrado en la investigación que se puede usar para otros genes, genotipos y fenotipos», dijo Casaletto.
Para este proyecto, los investigadores de la UCSC colaboraron con el Centro RIKEN para Integrative Medical Sciences en Japón para analizar su biobanco de datos genómicos BRCA1 y BRCA2. Estos genes se heredan de los padres de una persona y, cuando mutan, pueden conducir a un mayor riesgo de cáncer de mama, de ovario y de otro tipo.
Usaron esto para hacer descubrimientos sobre qué variantes específicas en los genes BRCA1 y BRCA2 conducían al cáncer y que no afectó a los pacientes, moviendo la aguja en una serie de variantes previamente inciertas.
Al realizar este análisis, los investigadores pudieron ayudar a abordar la falta de diversidad en las bases de datos genéticas.
«La genética de las personas blancas está muy sobrerrepresentada, la genética de las personas no blancas es mucho más un misterio, debido a una gran cantidad de sesgos históricos en la recopilación de datos», dijo Cline. «También pudimos sumar un poco más de conocimiento sobre la genética japonesa de lo que estaba disponible anteriormente».
Una mayor colaboración utilizando análisis federados con institutos de todo el mundo podría hacer mucho para abordar la falta de representación de los no blancos. personas y capacitar a las instituciones que pueden tener pocos recursos para contribuir al conjunto de datos genómicos globales.
«Lo que se ha hecho en el pasado es básicamente compartir mucho menos datos, por lo que el nombre del juego es realmente global intercambio de datos», dijo Cline.
Los investigadores también trabajan con The Global Alliance for Genomics and Health (GA4GH), que ayuda a establecer políticas y crear estándares técnicos para el intercambio de datos responsable y ético. Brindaron orientación sobre qué intercambio de datos se puede hacer de manera legal y responsable, y ayudaron a establecer métodos para hacer que el software del Genomics Institute sea portátil en diferentes sistemas operativos y entornos para permitir una colaboración como esa en este proyecto.
Explore más
BRCA Exchange agrega datos sobre miles de variantes de BRCA para comprender el riesgo de cáncer Más información: James Casaletto et al, Federated analysis of BRCA1 and BRCA2 variation in a Japanese cohort, Cell Genómica (2022). DOI: 10.1016/j.xgen.2022.100109 Proporcionado por la Universidad de California – Santa Cruz Cita: Nueva técnica responsable de intercambio de datos permitirá una mejor comprensión de las variantes genéticas que causan enfermedades (2022, 9 de marzo) consultado el 29 de agosto 2022 de https://medicalxpress.com/news/2022-03-responsible-technique-enable-disease-causing-genetic.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.