Nuevo método estadístico alivia la crisis de reproducibilidad de datos
Crédito: CC0 Public Domain
Hay una crisis de reproducibilidad en curso en la investigación científica, donde muchos estudios pueden ser difíciles o imposibles de replicar y, por lo tanto, validar, especialmente cuando el estudio involucra una muestra muy grande Talla. Por ejemplo, para evaluar la validez de los hallazgos de un estudio genético de alto rendimiento, los científicos deben poder replicar el estudio y lograr los mismos resultados. Ahora, investigadores de Penn State y la Universidad de Minnesota han desarrollado una herramienta estadística que puede estimar con precisión la replicabilidad de un estudio, eliminando así la necesidad de duplicar el trabajo y mitigando de manera efectiva la crisis de reproducibilidad.
El equipo usó su nuevo método, que describen en un artículo publicado hoy en Nature Communications, para confirmar los hallazgos de un estudio de 2019 sobre los factores genéticos que contribuyen a la adicción al tabaco y la bebida, pero señalaron que también se puede aplicar a otros estudios de asociación de todo el genoma o estudios que investigan las bases genéticas de las enfermedades.
«Aunque aplicamos el método para estudiar los resultados relacionados con la adicción al tabaco y la bebida, podría beneficiar a otros estudios de consorcios similares a gran escala, incluidos estudios actuales sobre la contribución genética del huésped a los síntomas de COVID-19», dijo Dajiang Liu, profesor asociado de ciencias de la salud pública y bioquímica y biología molecular, Penn State.
Según Liu, para detectar patrones en el genoma- estudios de asociación amplia es importante obtener datos de un gran número de individuos. Los científicos a menudo adquieren estos datos mediante la combinación de muchos estudios existentes diseñados de manera similar, que es lo que Liu y sus colegas hicieron para el estudio sobre la adicción al tabaco y la bebida de 2019 que finalmente comprendió a 1,2 millones de personas.
«Trabajamos muy duro para recopilar todas las muestras de pacientes que pudimos manejar», dijo Liu, señalando que los datos provienen de biobancos, estudios epidemiológicos y empresas de pruebas genéticas directas al consumidor, como 23andMe. Sin embargo, agregó, dado que el equipo usó todos los estudios disponibles en su análisis, no quedó ninguno para usar como comparación para la validación. «Nuestro método estadístico permite a los investigadores evaluar la replicabilidad de las señales de asociación genética sin un conjunto de datos de replicación», dijo. «Ayuda a maximizar el poder de los estudios genéticos, ya que no es necesario reservar muestras para la replicación; en cambio, todas las muestras se pueden usar para descubrimientos».
El método del equipo, al que llaman MAMBA (Meta-Analysis Model-Based Assessment of replicability), evalúa la fuerza y consistencia de las asociaciones entre fragmentos atípicos de ADN, llamados polimorfismos de un solo nucleótido (SNP), y rasgos de enfermedades como la adicción. Específicamente, MAMBA calcula la probabilidad de que si un experimento puede repetirse con un conjunto diferente de individuos, las relaciones entre los SNP y los rasgos de esos individuos serían iguales o similares a las del primer experimento.
Qunhua Li, profesor asociado de estadística de Penn State, explicó que MAMBA asigna una mayor probabilidad de replicabilidad (PPR) para cada SNP si el SNP está significativamente asociado con el rasgo que se está evaluando y si sus tamaños de efecto estimados son consistentes en múltiples estudios.
«Por ejemplo», dijo Li, «si la mayoría de los participantes que son adictos al tabaco tienen un SNP determinado que difiere de las personas no adictas, y si este SNP aparece entre las personas en múltiples estudios más pequeños, entonces MAMBA le dará un PPR más alto, lo que sugiere que el SNP probablemente sea importante en la adicción».
Los investigadores demostraron el valor de su método al aplicarlo al estudio de Liu de 2019 sobre la adicción al tabaco y la bebida. Entre las 556 señales de asociación SNP comunes y de baja frecuencia, el equipo identificó 529 con PPR superior al 99 %. En un análisis extenso de alrededor de 4300 SNP raros, los investigadores identificaron 2807 SNP con una PPR superior al 99 %.
«Curiosamente, descubrimos que ciertos genes que se sabe que son responsables del metabolismo de los lípidos también influyen en la adicción al tabaco «, dijo Bibo Jiang, profesor asistente de ciencias de la salud pública, Penn State, y señaló que el fenómeno se conoce como pleiotropía cuando un gen influye en dos rasgos aparentemente irrelevantes. «Si queremos diseñar medicamentos que se dirijan a esos genes para ayudar a las personas a dejar de fumar, debemos tener en cuenta cualquier afección subyacente relacionada con el metabolismo de los lípidos, como el colesterol alto, que puedan tener».
Liu anotó que el método se puede aplicar a estudios de asociación de todo el genoma centrados en una amplia variedad de rasgos. «Creo que en la próxima década más o menos, un enfoque esencial de la biología será interpretar y dar sentido a esos descubrimientos de estudios de asociación de todo el genoma y si podemos traducir algunos de ellos en medicamentos para facilitar la medicina personalizada», dijo. «Estamos entusiasmados de poder ofrecer este enfoque estadístico como un servicio a la comunidad investigadora».
Explore más
Los que toman riesgos están predispuestos a fumar y al uso de cigarrillos electrónicos, según sugiere un nuevo estudio. Más información: Nature Communications (2021). DOI: 10.1038/s41467-021-21226-z Información de la revista: Nature Communications
Proporcionado por la Universidad Estatal de Pensilvania Cita: Nuevo método estadístico alivia la crisis de reproducibilidad de datos (2021) , 30 de marzo) recuperado el 30 de agosto de 2022 de https://medicalxpress.com/news/2021-03-statistical-method-eases-crisis.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.