Biblia

Navegando por la jungla: GA4GH y una infraestructura global para compartir datos genómicos sin problemas

Navegando por la jungla: GA4GH y una infraestructura global para compartir datos genómicos sin problemas

Crédito: Ricardo Job-Reese, Broad Communications

Durante la última década y media, el campo biomédico ha sido testigo de una explosión en el volumen y la variedad de datos genómicos y relacionados con la salud. Por un lado, esto ha sido una bendición increíble para el avance de la salud humana; a medida que crece nuestro conocimiento sobre la genética de la salud y la enfermedad, también aumentan las oportunidades para que los investigadores logren avances notables en la prevención, el diagnóstico y el tratamiento de enfermedades.

Sin embargo, esa explosión también ha creado inmensos desafíos. Los conjuntos de datos se distribuyen entre centros de investigación, universidades, sistemas de atención médica, agencias gubernamentales y más, a menudo almacenados en sistemas que no pueden comunicarse directamente entre sí o en formatos que no se pueden traducir fácilmente de uno a otro. Hay una falta de infraestructura que dificulta que los investigadores compartan y analicen esos datos y convertirlos en conocimiento que pueda beneficiar a los pacientes.

Lanzada en 2013 para enfrentar este desafío, la Alianza Global para la Genómica y la Salud (GA4GH) es una comunidad de 650 organizaciones y 1,000 miembros individuales de más de 90 países dedicados a crear estándares, políticas y enfoques que promover el intercambio eficaz y responsable de datos genómicos y relacionados con la salud. GA4GH está construyendo canalizaciones, lenguajes y reglas comunes para que los investigadores puedan compartir y analizar datos genómicos y clínicos de manera consistente.

En una edición especial reciente de la revista Cell Genomics, los miembros de GA4GH publicaron una colección de 10 documentos que describen los objetivos, los principios y el trabajo de la organización hasta la fecha, incluidas las recomendaciones para federar el acceso a los datos a nivel internacional y los estándares para el acceso y la supervisión de los datos. Juntos, estos comentarios y documentos técnicos brindan una historia de GA4GH y una hoja de ruta sobre cómo crecerá y evolucionará su trabajo en los próximos años.

Nos sentamos con cuatro miembros de Broad que desempeñan un papel clave en GA4GH el ingeniero de software comunitario y codirector del proyecto GA4GH Variant Representation Standard (VRS) Lawrence Babb; el gerente de productos de software y codirector de uso de datos de GA4GH, Jonathan Lawson; Anthony Philippakis, director general de datos de Broad, codirector de Eric and Wendy Schmidt Center y miembro del comité directivo de GA4GH; y la miembro del instituto y vicepresidenta de GA4GH, Heidi Rehmto, hablarán sobre el progreso y el futuro de la organización.

¿Cómo ha cambiado el panorama de intercambio de datos en genómica clínica en la última década?

JL: A fines de la década de 2000 quedó claro que la investigación genómica se estaba volviendo más común y que los datos almacenados en grandes bases de datos podrían vincularse potencialmente a los pacientes. Esas preocupaciones plantearon la necesidad de un acceso controlado a los datos. El beneficio allí es que esto generó un fuerte sentido de administración de datos. El problema es que muchas instituciones siguieron adelante e hicieron lo suyo, lo que llevó a una proliferación de diferentes procesos para el acceso a los datos.

En un nivel alto, lo que ahora vemos es un deseo de establecer algunos caminos claros para que los investigadores puedan navegar esa jungla de procesos y acceder a los datos de manera controlada. Esta es un área en la que GA4GH realmente ha dado un paso al frente, al ayudar a brindar consistencia a la forma en que se otorga y establece el acceso a los datos. Cuanto más interoperables puedan ser las cosas, más fácil será para un investigador obtener todos los datos que pueda desear o necesitar para responder una pregunta científica y, en última instancia, generar resultados científicos innovadores que tengan un impacto positivo en la salud humana.

HR: Ahora existe un reconocimiento mundial de que no podemos respaldar la genómica clínica sin un intercambio generalizado de datos genómicos y de salud, así como conocimiento curado. El éxito del intercambio voluntario de conocimientos en ClinVar del NCBI y el uso generalizado de plataformas federadas como Matchmaker Exchange nos ha demostrado que los laboratorios clínicos y la comunidad de enfermedades raras han aceptado la idea de que debemos trabajar juntos para comprender la variación causal y aplicar la genómica a la atención de pacientes con enfermedades raras.

¿Cuáles cree que son algunos de los desafíos más importantes al llevar los datos genómicos a la clínica?

LB: Llegar al punto en el que podamos representar de manera confiable los hallazgos y conocimientos genéticos con el la precisión clínica necesaria para informar la atención del paciente requerirá un esfuerzo significativo. Esto está comenzando a suceder en varias áreas, pero aún no existe una base común sobre la cual todos en el campo puedan construir enfoques confiables para usar estos datos invaluables. Necesitamos estándares, herramientas y recursos que alcancen el nivel que requiere el sistema de salud.

JL: Todavía tenemos que resolver los problemas principales de qué datos existen, cómo podemos compartirlos y cómo podemos analizarlo. Los gobiernos, fundaciones y corporaciones han gastado millones de dólares para generar datos genómicos, a menudo para un proyecto de investigación singular. Después del proyecto inicial, esos datos se colocan esencialmente en el estante trasero de un almacén, y nadie sabe si están allí o cómo se pueden usar. Todos estos datos podrían ser extremadamente útiles, y necesitamos descubrir las estructuras de incentivos correctas que alentarían a los propietarios de datos a involucrarse con este problema.

AP: Estamos en un momento crucial, donde la genómica está comenzando. pasar de una actividad puramente de investigación a una que esté cada vez más impulsada por la atención clínica. Pero si bien ha habido una aceptación real del intercambio de datos a nivel de paciente en la investigación básica, esto es mucho menos claro en la clínica. Por ejemplo, la cantidad de datos genómicos de cáncer a nivel de paciente generados a través de la atención oncológica eclipsa lo que se ha generado en el entorno de la investigación. ¿Por qué no compartimos los datos genómicos y clínicos de cada paciente con cáncer, para que podamos aprender de los resultados de los tratamientos que estamos dando? Necesitamos extender el tipo de intercambio de datos que ahora es común en el entorno de investigación al entorno clínico.

También necesitamos construir la base de evidencia para demostrar que conocer la composición genómica de un individuo mejora los resultados. Por ejemplo, ¿los pacientes con una puntuación de riesgo poligénico (PRS, por sus siglas en inglés) alto para el cáncer deberían someterse a un cribado más intensivo? ¿Deberíamos comenzar antes con una estatina a aquellos con una PRS alta para la enfermedad de las arterias coronarias? Para que la genómica se convierta en el estándar de atención, debemos realizar estudios que aborden estas preguntas.

HR: Todavía existe mucha preocupación sobre la privacidad y la seguridad de los datos cuando se intenta colaborar y compartir entre fronteras internacionales. Necesitamos involucrarnos y educar a la comunidad genómica sobre los riesgos y beneficios de compartir datos genómicos, y de permitir que las personas, en lugar de los reguladores, impulsen la toma de decisiones, al mismo tiempo que aplicamos los enfoques más avanzados y las políticas reflexivas para proteger los derechos de las personas a la privacidad y la seguridad de sus datos.

¿Cómo ha cambiado GA4GH desde su lanzamiento? ¿Cuáles son algunos de sus mayores éxitos?

LB: He estado involucrado con GA4GH durante cinco años más o menos. En ese tiempo, GA4GH ha perfeccionado significativamente su organización para que pueda abordar áreas clave que son demasiado grandes o complejas para una sola organización, segmentando sus esfuerzos en flujos de trabajo y confiando en asociaciones con proyectos impulsores del mundo real para crear soluciones abiertas. El lema de «código de ejecución de consenso aproximado» del liderazgo de GA4GH ayuda a los proyectos impulsores a producir y compartir soluciones en torno a problemas comunes.

JL: El modelo liderado por la comunidad ha tenido mucho éxito, más de lo que esperaba cuando me uní a GA4GH en 2017. Ha sido interesante ver lo que realmente se necesita para administrar un modelo liderado por la comunidad. estándar. En última instancia, debe haber árbitros, pero a menudo es obvio cuando hay consenso sobre lo que se debe hacer y cómo hacerlo.

GA4GH es el puente que nos brinda una razón y un marco para resolver los problemas de intercambio de datos y acceso a datos a escala global. Si no se coordina globalmente, está destinado a resolver estos problemas solo dentro de los EE. UU., o solo dentro de una red limitada de instituciones. Hablo con colegas en Singapur, Sudáfrica, Australia, Brasil y el Reino Unido, personas con las que probablemente nunca trabajaría en mi trabajo diario, pero con las que puedo concentrarme en estos problemas juntos. Eso es enorme.

AP: Durante la última década, GA4GH ha desarrollado un excelente conjunto de procesos para ver la creación de estándares. Esta maravillosa colección de artículos en Cell Genomics demuestra ese progreso.

HR: Hemos convencido con éxito a países, financiadores y organizaciones de la importancia de desarrollar estándares y marcos comunes para el intercambio de datos genómicos y de salud. Hemos pasado de un esfuerzo de base distribuido a una operación bien impulsada que ha descubierto cómo trabajar en toda la comunidad global.

Estos artículos de Cell Genomics representan una gran cantidad de trabajo. ¿Puede describir algunos de los mensajes clave para llevar a casa?

JL: Veo un tema prominente y recurrente de intercambio de datos y acceso a datos. El documento de perspectiva se centra en el intercambio de datos, y es un objetivo principal en todo lo que hacemos en GA4GH. Creo que esto se debe a que el intercambio de datos es un multiplicador de fuerza en el descubrimiento genómico. Los participantes de GA4GH pueden mejorar el almacenamiento y el análisis de datos en sus instituciones de origen, pero la creación de sistemas federados y estandarizados asegura a todos que los datos serán más fáciles de compartir y acceder, lo que hace que los resultados de los análisis sean más potentes y se alcancen más rápidamente.

AP: Son una clara indicación del poder que pueden tener los estándares para impulsar el progreso. Tomemos, por ejemplo, enfoques automatizados para la supervisión del uso de datos. Si le preguntas a cualquier investigador que quiera utilizar grandes datos genómicos cuál es su mayor punto débil, casi todos dirían que es el proceso de obtener acceso a los datos. La ontología del uso de datos y el sistema de supervisión del uso de datos podrían optimizar este proceso de manera significativa al automatizar muchos de los pasos necesarios para validar si el propósito de un investigador es consistente con los términos del consentimiento informado de un conjunto de datos determinado.

HR: Un tema común son las largas listas de autoría con muchas personas, instituciones y países representados, lo que demuestra la importancia del consenso de la comunidad y el compromiso generalizado para impulsar el trabajo de GA4GH.

Otro es el reconocimiento de que necesitamos una amplia participación para garantizar que nuestro trabajo se base en proyectos y perspectivas clave y, en última instancia, sea adoptado por toda la comunidad. La participación de nuestros proyectos impulsores es una forma en que logramos esto. Otro es a través de nuestro Foro de implementación de la genómica en la salud, que lanzamos en 2020 y que reúne iniciativas de datos genómicos a gran escala como Australian Genomics y Genomics England para compartir recursos y conocimientos, y para apoyar la implementación de nuestro trabajo.

¿Qué sigue para GA4GH?

LB: Estamos trabajando en esfuerzos de refinamiento del proceso de «toque ligero» que garantizarán la calidad, la coherencia y la difusión de nuestro trabajo. Y estamos trayendo contribuciones de organizaciones adicionales interesadas en participar en este esfuerzo masivo pero esencial.

También continuamos reuniendo a las organizaciones para crear y apoyar métodos mediante los cuales se pueda capturar el conocimiento sobre las variantes genéticas. y difundido de manera estándar e interoperable, y para compartir los resultados de laboratorio y sus interpretaciones con médicos y pacientes de manera significativa. Ese es un componente básico para incorporar la genómica más directamente en la atención médica.

JL: En cuanto al uso de datos, creo que estamos pasando de la defensa a la ofensiva. Estamos siendo más proactivos y hablando de crear cosas nuevas, en lugar de simplemente resolver viejos problemas. ¿Qué innovaciones podemos construir que desbloquearán mucho potencial? Un tema en eso es la federación: crear estándares donde, si soy un investigador, cada vez que me conecto con una nueva base de datos o una nueva institución, no tengo que repetir los mismos procesos una y otra vez.

Existe esta danza en el desarrollo de políticas y desarrollo tecnológico; tienen que moverse juntos en coordinación. A través de GA4GH, Broad está en condiciones de ayudar a participar en una gran cantidad de actividades de promoción de políticas con los reguladores en los EE. UU. y Europa y más allá. Además de eso, también podemos crear el software que se ajusta a una política recién acuñada o que prueba que una política que estamos proponiendo es realmente procesable y nos brinda retroalimentación para refinarla.

HR: Estamos comenzando a enfocarnos más en la implementación de los estándares que han sido aprobados. Queremos trabajar con nuestros proyectos impulsores y la comunidad en general para poner a prueba nuestros estándares y políticas y demostrar que son adecuados para su propósito, así como unir múltiples estándares para respaldar los flujos de trabajo de un extremo a otro. Creo que Broad está bien posicionado para continuar contribuyendo al trabajo de GA4GH, implementar los estándares de GA4GH y ayudar a demostrar lo que se puede lograr en nuestro campo.

Explore más

Conectando los puntos para datos de salud Más información: Heidi L. Rehm et al, GA4GH: Políticas y estándares internacionales para el intercambio de datos en la investigación genómica y la atención médica, Cell Genomics ( 2021). DOI: 10.1016/j.xgen.2021.100029

Adrian Thorogood et al, Federación internacional de bases de datos de medicina genómica utilizando estándares GA4GH, Cell Genomics (2021). DOI: 10.1016/j.xgen.2021.100032

Jonathan Lawson et al, The Data Use Ontology para simplificar el acceso responsable a conjuntos de datos biomédicos humanos, Cell Genomics (2021). DOI: 10.1016/j.xgen.2021.100028

Alex H. Wagner et al, The GA4GH Variation Representation Specification: Un marco computacional para la representación de variaciones y la identificación federada, Cell Genomics (2021). DOI: 10.1016/j.xgen.2021.100027

Moran N. Cabili et al, Validación empírica de un enfoque automatizado para la supervisión del uso de datos, Cell Genomics (2021). DOI: 10.1016/j.xgen.2021.100031