Preguntas y respuestas: Un hito de 10 000 genomas para datos compartidos de cáncer pediátrico
ST. JUDE CHILDREN’S RESEARCH HOSPITAL / PETER BARTA
Jinghui Zhang es una fuerza impulsora detrás de St. Jude Cloud, una plataforma que alberga genomas de cáncer pediátrico, así como herramientas de análisis de datos para investigadores. En la reunión de la Asociación Estadounidense para la Investigación del Cáncer de 2019 esta semana en Atlanta, Georgia, Zhang y sus colegas del St. Jude Children’s Research Hospital están celebrando haber alcanzado los 10 000 genomas cargados en la plataforma. También están promocionando un nuevo navegador de genoma llamado GenomePaint diseñado para integrar datos genómicos, transcriptómicos y epigenómicos de pacientes.
El científicohabló con Zhang para conocer su visión para St. Jude Cloud y cómo la plataforma ha cambiado con el tiempo para convertirse en la base de datos con la mayor cantidad de genomas completos recopilados de pacientes y sobrevivientes de cáncer pediátrico.
El científico: ¿Cuál fue la inspiración detrás de St. Jude Cloud?
Jinghui Zhang: De hecho, tuve que…
También soy desarrollador de herramientas, así que tengo que compartir mis herramientas con la comunidad de investigación global. Podemos subir nuestras herramientas a la nube y solo haces una instalación y todos pueden usarlas directamente.
El tercer componente es la visualización de datos. Si colocamos los datos en la forma en que las personas pueden visualizarlos, entonces los investigadores que no tienen habilidades informáticas pueden comenzar a analizar los datos.
TS: ¿Cómo ha evolucionado St. Jude Cloud a lo largo de los años?
JZ: Empezamos nuestro prototipo en 2016. Inicialmente, solo nos enfocábamos en poner herramientas allí. A partir de 2017 es donde viene la mayor evolución. Microsoft decidió colaborar con nosotros, por lo que pudimos obtener el espacio de almacenamiento en la nube para alojar estos conjuntos de datos.
El primer hito llegó en 2018, [cuando] pudimos colocar 5000 genomas en la nube La AACR de este año será el segundo hito de los 10 000 genomas completos en su lugar.
TS: ¿Quién usa el St. Jude Cloud?
JZ: Hay tres entidades de investigación separadas. Las más obvias son las instituciones de investigación involucradas en la investigación del cáncer pediátrico en todo el mundo. El segundo grupo [son aquellos] involucrados en la investigación genómica en general porque nuestro recurso es un conjunto de datos muy genómico. Un tercer grupo está realmente más interesado en nuestras herramientas. Hay grupos que ni siquiera están involucrados en la investigación del cáncer, sino en la investigación de enfermedades humanas genéricas [que] están interesados en utilizar nuestras herramientas para su enfermedad específica.
TS:¿Cuáles han sido los efectos de St. Jude Cloud en la investigación del cáncer pediátrico?
JZ: Tenemos un total de 800 usuarios registrados de 400 institutos en todo el mundo han accedido a los datos. Ya lo sé de un grupo en Australia, mencionaron que están usando nuestras herramientas de visualización todos los días para su trabajo clínico.
Para nuestro propio programa de genómica clínica en St. Jude, hemos desarrollado este ARN rápido -seq herramienta que estaban usando para la detección de genes de fusión. [Nota del editor: los genes de fusión son híbridos de genes que pueden causar cáncer.] Y esta herramienta se usa para determinar realmente si el paciente con cáncer se colocará en una rama del ensayo clínico o en la otra. , y requiere un tiempo de respuesta muy rápido. Con la computación en la nube, realmente reduce el análisis de datos desde inicialmente hasta una semana o varias horas. Eso nos permite cumplir con el cronograma para tomar una decisión sobre el ensayo clínico.
TS: ¿Qué sigue para la plataforma?
JZ: Hay un par de cosas. Uno se está expandiendo [a] más pacientes, más muestras, expandiendo el recurso de datos. Lo segundo es incorporar datos epigenéticos adicionales que generamos a partir de líneas celulares de cáncer pediátrico para que podamos facilitar la interpretación de la varianza no codificante. El tercer aspecto de esto es. . . estamos discutiendo con el Instituto Nacional del Cáncer sobre el establecimiento de un sistema de datos federado, para que nuestra base de datos pueda comunicarse con los recursos construidos por el NCI [como su portal de datos], para que no construyamos las bases de datos en silos.
Nota del editor: esta entrevista fue editada por motivos de brevedad.
¿Interesado en leer más?
El científico ARCHIVOS
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos, así como a TS Digest, ¡Ediciones digitales de El científico, artículos destacados y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí