Biblia

Secuenciación del árbol de la vida

Secuenciación del árbol de la vida

“El árbol de la vida”de Gustav Klimt” 1909WIKIMEDIA

Los científicos que trabajan para secuenciar todo tipo de bacterias, Archaea, plantas y animales y hacer que estos genomas estén disponibles públicamente esperan usar los datos para informar sobre cuestiones de salud, industriales y ambientales. Los consorcios de secuenciación a gran escala han estado produciendo datos a un ritmo impresionante, pero aún quedan brechas significativas en el árbol de la vida genómico. Y aunque estos grupos han estado trabajando en gran medida de forma independiente, juntos podrían abordar cuestiones de mayor alcance, como cómo ha evolucionado la vida, cómo funciona actualmente y cómo podría verse en el futuro.

“Todavía estamos en la etapa de desarrollo, donde cada consorcio se enfoca en un dominio específico y está construyendo sus propios datos y asegurándose de que estén en buena forma” dijo Igor Grigoriev, jefe del programa de genómica fúngica en el Instituto Conjunto del Genoma (JGI) del Departamento de Energía de EE. los datos se recopilan en repositorios centrales. Además de la base de datos del genoma del Centro Nacional de Información Biotecnológica, existe la base de datos en línea de genomas (GOLD) financiada por JGI, que funciona como un centro para las iniciativas de secuenciación del genoma y los proyectos de metagenoma completos y en curso. GOLD se centra principalmente en los genomas microbianos, pero incluye algunos genomas eucariotas. Los datos de muchos de estos proyectos están integrados en las bases de datos de JGI y también se pueden cargar en las herramientas KnowledgeBase recientemente desarrolladas y financiadas por el DOE.

Tanto hablar entre comunidades como crear herramientas creativas para hacer preguntas científicas más amplias en los dominios de la vida es importante, dijo Grigoriev. Como comunidad científica, creo que estamos justo ahora en este momento. . . avanzando hacia esto.

El genoma del sorgo cultivado (Sorghum bicolor) se publicó en agosto de 2013.FLICKR, KAY LEDBETTER

En medio de este impulso colectivo inicial Sin embargo, algunos grupos todavía están trabajando para secuenciar especies críticas dentro de sus propios dominios. En 2011, los miembros de la comunidad de genómica microbiana estaban listos para publicar un manuscrito, reuniendo a la comunidad científica para financiar un proyecto de secuenciación genómica a gran escala que cubría importantes cepas bacterianas y de arqueas. El objetivo era llenar los vacíos en el árbol de la vida microbiano. Sin embargo, el decreto resultó innecesario, ya que el progreso en las iniciativas de secuenciación del genoma, incluidas las de miles de genomas bacterianos y de arqueas, como el proyecto piloto de la Enciclopedia genómica de bacterias y arqueas (GEBA), les dio a los genetistas y biólogos microbianos razones para creer que la secuenciación se completaría. .

Pensamos que había un punto de inflexión hace tres años, dijo Nikos Kyrpides, quien dirige el programa de genómica y metagenómica microbiana en el JGI. La comunidad creía que más agencias de financiación comenzarían a apoyar estudios de secuenciación microbiana, no solo para aplicaciones industriales y de salud pública, sino para cubrir los genomas de referencia del árbol filogenético.

Investigadores del JGI y varias instituciones internacionales Desde entonces, han secuenciado los genomas completos de 3000 microbios adicionales, pero la cobertura de los dominios bacteriano y de arqueas sigue siendo bastante escasa. Entonces, Kyrpides y sus colegas ahora envían un manuscrito actualizado para crear conciencia sobre la importancia de su Proyecto Microbial Earth, que tiene como objetivo secuenciar 7830 cepas de tipos representativos de las 11 000 especies disponibles en colecciones de cultivo durante los próximos tres años. Solo alrededor del 10 al 15 por ciento de la diversidad de Archaea cultivadas y especies bacterianas ha sido capturada por secuenciación hasta ahora, dijo Kyrpides. Eso es enormemente pequeño.

Parte del problema es que muchas agencias de financiación gubernamentales y privadas están más interesadas en ayudar a los científicos a secuenciar los genomas de las especies que afectan la salud humana, las preocupaciones de la industria y los problemas ambientales.

El genoma del tunicado estrella dorada (Botryllus schlosseri) se publicó en julio de 2013. WIKIMEDIA, PARENT GERY

Muchas veces es más fácil recibir financiación para secuenciar especies importantes para la agricultura, por ejemplo. Este tipo de proyectos avanzan más rápido porque hay más fondos de gobiernos o empresas interesadas en financiar esfuerzos dirigidos, dijo Toni Gabaldón, jefe de bioinformática y genómica del Centro de Regulación Genómica en Barcelona, España. Un problema, dijo Kyrpides, es que las agencias de financiación a menudo no trabajan juntas y, por lo general, se necesita más de una sola entidad de financiación para apoyar los esfuerzos amplios y enciclopédicos de secuenciación. Estamos presionando para que las agencias de financiamiento cambien: dejen de delinear proyectos por aplicación y trabajen juntos.

Han surgido muchos consorcios dedicados a secuenciar ramas específicas del árbol de la vida como investigadores que trabajan dentro del mismo han reconocido que la puesta en común de recursos puede impulsar el progreso científico. Entre estos grupos se encuentran la Alianza Global de Invertebrados (GIGA), el Proyecto Genoma de 5000 Insectos (i5K), el Proyecto Genoma de 1000 Hongos, el Programa de Investigación del Genoma Vegetal de la Fundación Nacional de Ciencias (NSF) de EE. UU. y el Proyecto Genoma 10K, cuyo objetivo es secuenciar 10.000 genomas de vertebrados. También existe la Iniciativa Global del Genoma (GGI) dirigida por la Institución Smithsonian, un esfuerzo colaborativo para secuenciar al menos una especie de cada una de las 9500 familias de invertebrados, vertebrados y plantas descritas.

A medida que más y más Las tecnologías de secuenciación de lectura y lectura llegan al mercado y los costos generales de decodificación de genomas caen, un desafío emergente es atraer y coordinar expertos para recopilar, anotar y colocar datos de secuenciación en sus contextos biológicos, según Kevin Hackett, líder de programa nacional en el Departamento de Agricultura de los Estados Unidos (USDA) y uno de los líderes del proyecto i5K.

Y estos esfuerzos analíticos son importantes; en lugar de que los investigadores compitan por la financiación, los unen con objetivos comunes, eliminando redundancias y reduciendo los costes generales. Según Stephen Goff, director de proyectos de iPlant Collaborative, una cultura de verdadera cooperación en genómica apenas está comenzando a evolucionar.

Por su parte, en lugar de generar nuevos datos de secuenciación genómica, el equipo de iPlant está creando computación en la nube, almacenamiento de datos y herramientas de análisis genómico disponibles para la comunidad vegetal en general. Por ejemplo, iPlant proporciona la ciberinfraestructura y las herramientas de análisis que ayudarán al African Crops Consortium a secuenciar 101 cultivos importantes para la agricultura del continente. IPplant también se ha ofrecido como voluntario para proporcionar infraestructura para el proyecto i5K y otros proyectos de secuenciación de insectos, dijo Goff.

El genoma de la medusa peine (Mnemiopsis leidyi) se publicó en diciembre de 2012.FLICKR , VIDAR-AQUA-PHOTOS

Otros consorcios están creando sus propias herramientas de almacenamiento y análisis de datos. A través de su Programa de Investigación del Genoma Vegetal, la NSF tiene como objetivo no solo generar nuevas secuencias genómicas, sino también proporcionar una plataforma para integrar todos los datos genómicos existentes para los análisis evolutivos y de diversidad de especies. En Europa, los miembros del grupo European Life-Sciences Infrastructure for Biological Information (ELIXIR) pretenden crear un recurso para que los científicos almacenen y compartan grandes conjuntos de datos, como genomas completos.

El equipo de Grigoriev en JGI ha desarrollado un recurso de genómica fúngica público basado en la web. MycoCosm es un ejemplo de integración de datos de genómica fúngica y herramientas computacionales, y la unión de la comunidad de investigación de biólogos fúngicos, explicó. A partir de aquí, podemos pasar al siguiente paso de integración en múltiples dominios.

Las herramientas bioinformáticas deberán evolucionar para seguir el ritmo a medida que los análisis genómicos se vuelven más complicados y cubren relaciones complejas entre dominios, como la interacción simbiótica entre ciertas plantas, hongos y endobacterias. Pero incluso dentro de una sola base de datos de consorcios, a medida que la cantidad de secuencias genómicas aumenta de decenas a cientos, escalar las herramientas analíticas y de almacenamiento ha sido un desafío.

Muchos científicos computacionales y bioinformáticos están trabajando junto con biólogos para analizar y organizar los datos de secuenciación. Este es un gran desafío, pero tengo mucho optimismo porque hay mucha innovación y energía en este campo, dijo Klaus-Peter Koepfli, uno de los principales investigadores del proyecto Genoma 10K y científico visitante en el Instituto Smithsonian de Biología de la Conservación en Washington, DC Hay muchos obstáculos para reconstruir la filogenia de todos los seres vivos, pero es un gran objetivo.

¿Cuántas especies se han secuenciado?

Durante los últimos 250 años, se han identificado y clasificado taxonómicamente 1,2 millones de especies eucariotas. Número de especies estimadas que existen en la Tierra: especies de bacterias y arqueas, de 100.000 a 10 millones1,2; especies eucariotas, aproximadamente 8,7 millones (incluidos 2,2 millones de organismos marinos; 1,3 millones en total)1.

  NÚMERO TOTAL DE ESPECIES (ESTIMADO) NÚMERO DE ESPECIES IDENTIFICADAS/DESCRITAS (APROXIMADO) NÚMERO DE ESPECIES CON SECUENCIAS DE GENOMAS COMPLETAS* (ESTIMADO) REFERENCIAS BACTERIAS, ARCHAEA 100.000 a 10 millones  12 000 (460 Archaea cultivadas) 17 420 bacterias, 362 genomas de Archaea  base de datos GOLD; Investigación sobre ácidos nucleicos (enero de 2012); Centro Mundial de Datos para Microorganismos HONGOS 1,5 millones 100 000 356 JGI INSECTOS 10 millones 1 millón 98 Pest Management Science (mayo de 2007); NCBI; RG Foottit y PH Adler, Insect Biodiversity: Science and Society (2009) PLANTAS 435 000 (plantas terrestres y algas verdes)

300 000

150

Conservación Internacional de Jardines Botánicos; La Lista de Plantas; WS Judd et al., Sistemática de plantas con un enfoque filogenético (2008);  D. Bramwell, Plant Talk, 28:324 (2002) VERTEBRADOS TERRESTRES, PECES 80.500 (5.500 mamíferos)  62.345 (5.487 mamíferos) 235 (80 mamíferos) Genoma 10K; Sociedad Zoológica de Londres (2012); Science (diciembre de 2010); Australian Biodiversity Information Services (2009) INVERTEBRADOS MARINOS 

6,5 millones

1,3 millones 60

Journal of Heredity (mayo de 2014); Biología actual (diciembre de 2012); Sociedad Zoológica de Londres (2012); Oceanis 19:5-24 (1993)

OTROS INVERTEBRADOS 1 millón de nematodos, varios miles Drosophila 23.000 nematodos, 1.300&nbsp ;Drosophila 17 nematodo, 21 Drosophila M. Blaxter et al., The evolution of parasitism in Nematoda, Parasitology (en prensa); Universidad de Texas A&M; Biología Molecular y Evolución (1995) 

1 PNAS (agosto de 2002) 2  Bergeys International Society for Microbial Systematics (2014) 3 PLOS Biology (agosto de 2011) *al 24 de abril de 2014

 

¿Interesado en leer más?

The Scientist ARCHIVES

Conviértase en miembro de

Reciba acceso completo a más de 35 años de archivos, así como a TS Digest, ediciones digitales de The ¡Científico, artículos destacados y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí