Estructuras de proteínas desconocidas predichas
S. OCHINNIKOV ET AL, SCIENCE 2017Los datos de secuencias de ADN recopilados de diversos entornos han ayudado a los investigadores a generar modelos tridimensionales de más de 600 familias de proteínas para las cuales las estructuras eran previamente desconocidas, según un artículo publicado en Science hoy (19 de enero). Los datos metagenómicos permitieron comparaciones de secuencias de proteínas en una variedad de especies, lo que otorgó un poder estadístico a las predicciones que de otro modo no habrían sido posibles.
“El gran mensaje final es que ahora es posible usar métodos computacionales para obtener muy buenos modelos de estructuras de proteínas” dijo el bioquímico de proteínas David Eisenberg de la Universidad de California, Los Ángeles, que no participó en el estudio. «Eso es un gran problema porque [los autores] pudieron obtener modelos para muchas más proteínas de lo que era posible incluso hace unos años». Instituto de Química Biofísica en Munich,…
Hasta hace poco, explicó Sding, los biólogos predecían las estructuras de sus proteínas favoritas con modelos de homología donde tenías una proteína molde que estaba relacionada con la que te interesaba ya partir de esta homología básicamente podrías copiar la estructura y adaptarla a la nueva secuencia. Pero con el nuevo enfoque, ahora puede construir modelos [precisos] incluso si no tiene una plantilla, dijo.
Desde que descubrieron que la secuencia de aminoácidos determina la forma en que se pliega una proteína, los científicos han estado investigando formas de calcular la estructura de una proteína a partir de su secuencia, dijo David Baker, de la Universidad de Washington, quien dirigió el nuevo estudio y diseñó y desarrolló un software de predicción de la estructura de la proteína llamado Rosetta.
Se sabe que las proteínas se pliegan a sus estados de energía más bajos, dijo Baker, pero a menudo hay tantas conformaciones posibles de baja energía, especialmente con proteínas grandes, que esto solo rara vez es informativo. Los datos de estructuras de proteínas determinadas experimentalmente pueden fortalecer los cálculos de Rosetta, agregó, pero luego, hace unos años, nosotros y otros nos dimos cuenta de que si tenía suficientes secuencias de una gran familia de proteínas, podía identificar pares de residuos que estaban en contacto en el 3- Estructura D basada en su covariación durante la evolución.
En pocas palabras: si dos aminoácidos interactúan entre sí dentro de una proteína, es probable que evolucionen juntos. Por ejemplo, si sus cargas son opuestas y una mutación cambia la carga de uno, es probable que el otro también cambie. La comparación de las secuencias de una proteína dada de múltiples especies puede identificar dichos residuos que evolucionan conjuntamente y, por lo tanto, interactúan.
Hace un par de años, el equipo de Baker utilizó este enfoque para predecir las estructuras de docenas de familias de proteínas. Desde entonces, se han determinado experimentalmente las estructuras de seis de las proteínas y, en el nuevo artículo, las comparaciones lado a lado de las predicciones de Rosetta y los resultados experimentales muestran que son muy, muy similares, dijo Baker.
Pero, ¿qué pasa si una proteína de interés no tiene una gran variedad de secuencias diversas disponibles para comparar? Ahí es donde entra en juego la metagenómica, explicó Baker.
Los datos metagenómicos se obtienen mediante la secuenciación de todo el ADN dentro de una muestra dada, ya sea suelo, agua de estanque, heces, lo que sea, para obtener una tremenda diversidad de secuencias, dijo Baker. Expande enormemente el número de familias para las que hay suficientes [comparaciones de secuencias] para generar modelos precisos. De hecho, utilizando datos metagenómicos, el equipo pudo predecir con confianza las estructuras de otras 614 familias de proteínas.
Es bastante emocionante porque cada familia de proteínas tiene al menos 1000 proteínas diferentes, por lo que estos modelos cubren probablemente más de un millón de proteínas de estructura actualmente desconocida, dijo Baker.
Los datos metagenómicos generalmente contienen una mayor proporción de secuencias de ADN procariotas que eucariotas, dijo Baker. En consecuencia, entre las restantes 4.500 familias de proteínas que todavía no tienen modelos estructurales, muchas son específicas de eucariotas. Ahora, lo que intentamos hacer es recopilar datos de secuencias genómicas de personas de todo el mundo que están realizando proyectos de secuenciación genómica en eucariotas como pájaros, peces, gusanos y hongos, dijo.
La limitación es la disponibilidad de secuencias, dijo John Moult, de la Universidad de Maryland, que no participó en la investigación. Pero ahora hay una gran cantidad de secuencias nuevas que salen cada año, por lo que solo proyectando hacia el futuro puede ver que, utilizando esta misma metodología, dejará una gran impresión en las familias restantes en los próximos cinco o 10 años.
S. Ovchinnikov et al., Determinación de la estructura de la proteína mediante datos de secuencias del metagenoma, Science, 355: 294-98, 2017.
¿Le interesa leer más?
El científico ARCHIVOS
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos, así como TS Digest, ediciones digitales de The Scientist, artículos destacados, ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí