{"id":36378,"date":"2022-09-01T06:49:13","date_gmt":"2022-09-01T11:49:13","guid":{"rendered":"https:\/\/www.biblia.work\/articulos-salud\/sesgo-tecnico-generalizado-en-conjuntos-de-datos-de-secuenciacion-de-arn\/"},"modified":"2022-09-01T06:49:13","modified_gmt":"2022-09-01T11:49:13","slug":"sesgo-tecnico-generalizado-en-conjuntos-de-datos-de-secuenciacion-de-arn","status":"publish","type":"post","link":"https:\/\/www.biblia.work\/articulos-salud\/sesgo-tecnico-generalizado-en-conjuntos-de-datos-de-secuenciacion-de-arn\/","title":{"rendered":"Sesgo t\u00e9cnico generalizado en conjuntos de datos de secuenciaci\u00f3n de ARN"},"content":{"rendered":"<p>ARRIBA: ISTOCK.COM, SHUOSHU<\/p>\n<p>La secuenciaci\u00f3n de ARN es una herramienta popular entre los bi\u00f3logos moleculares porque les permite examinar los patrones de expresi\u00f3n g\u00e9nica en el ADN. Sin embargo, la t\u00e9cnica es susceptible a artefactos experimentales, lo que puede dar lugar a resultados mal interpretados. Seg\u00fan un estudio publicado la semana pasada (12 de noviembre) en <em>PLOS Biology<\/em>, uno de esos sesgos, que est\u00e1 asociado con la longitud del gen, est\u00e1 muy extendido en muchos conjuntos de datos publicados.<\/p>\n<p>Rani Elkon, un bioinform\u00e1tico de la Universidad de Tel Aviv en Israel, dice que su equipo estaba analizando conjuntos de datos de secuenciaci\u00f3n de ARN (RNA-seq) para un proyecto destinado a inferir la co-regulaci\u00f3n de genes al examinar su co-expresi\u00f3n en muchas condiciones biol\u00f3gicas diferentes cuando se toparon con un hallazgo desconcertante: los genes que codifican prote\u00ednas en el ribosoma u otra maquinaria relacionada con la traducci\u00f3n, que son excepcionalmente cortos, y los genes que codifican prote\u00ednas de la matriz extracelular, como el col\u00e1geno, que son excepcionalmente largos, siguen apareciendo en sus an\u00e1lisis. En muchos conjuntos de datos diferentes, los genes que estaban regulados al alza y a la baja se enriquecieron para esas funciones espec\u00edficas, dice Elkon.<\/p>\n<p>El equipo se pregunt\u00f3 si hab\u00eda una explicaci\u00f3n biol\u00f3gica o si esto era el resultado de una falla t\u00e9cnica. Para abordar esa pregunta, seleccionaron 35 conjuntos de datos de RNA-seq humanos y de rat\u00f3n de GEO, un dep\u00f3sito de datos gen\u00f3micos disponible p\u00fablicamente. La mayor\u00eda de los conjuntos de datos que eligieron aparecieron en art\u00edculos publicados entre 2017 y 2018 y conten\u00edan entre dos y cuatro muestras repetidas que evaluaban la misma condici\u00f3n biol\u00f3gica, por ejemplo,<strong>&nbsp;<\/strong>tratamiento con factor de necrosis tumoral, una prote\u00edna involucrada en inflamaci\u00f3n.<\/p>\n<blockquote>\n<p>Dos herramientas de control de calidad podr\u00edan eliminar eficazmente los sesgos de longitud espec\u00edficos de la muestra en los conjuntos de datos que examinaron.<\/p>\n<\/blockquote>\n<p>Su an\u00e1lisis revel\u00f3 que los extremadamente cortos o Los genes largos mostraron diferentes patrones de expresi\u00f3n entre las muestras replicadas, lo que indica que se trataba de un artefacto experimental. Si las transcripciones reflejaban alguna actividad celular relevante para la condici\u00f3n biol\u00f3gica en cuesti\u00f3n, su abundancia deber\u00eda haber sido consistente para cada muestra de condici\u00f3n. Este problema, al que los autores se refieren como sesgo de longitud espec\u00edfico de la muestra, estuvo presente en 30 de los 35 conjuntos de datos. Esto nos indic\u00f3 que el . . . &nbsp;el enriquecimiento de los genes muy largos y muy cortos en realidad refleja alg\u00fan tipo de problema t\u00e9cnico en el experimento, le dice Elkon a <em>The Scientist.<\/em><\/p>\n<p>Los investigadores tambi\u00e9n encontraron que los genes espec\u00edficos de la muestra El sesgo de longitud aument\u00f3 el n\u00famero de falsos positivos en el an\u00e1lisis de enriquecimiento de conjuntos de genes (GSEA), un m\u00e9todo que se usa ampliamente para examinar si los genes que muestran niveles alterados de expresi\u00f3n entre conjuntos de datos de RNA-seq corresponden a una funci\u00f3n biol\u00f3gica.<\/p>\n<p>Kaspar Hansen, un bioestad\u00edstico de la Universidad Johns Hopkins que no particip\u00f3 en el estudio, dice que este sesgo de longitud espec\u00edfico de la muestra est\u00e1 bien descrito en la literatura. Este estudio muestra que a pesar de la conciencia del problema, al menos entre los cient\u00edficos orientados a los m\u00e9todos, muchos investigadores no utilizan de forma rutinaria las herramientas existentes para abordarlo, agrega. Me sorprendi\u00f3 el alto porcentaje de conjuntos de datos en los que este sesgo es un problema.<\/p>\n<p>Elkon y su equipo probaron si las herramientas de control de calidad existentes podr\u00edan corregir este problema. Descubrieron que cqn (normalizaci\u00f3n de cuantiles condicionales) y EDASeq (an\u00e1lisis de datos exploratorios y normalizaci\u00f3n para RNA-seq) pod\u00edan eliminar eficazmente los sesgos de longitud espec\u00edficos de la muestra en los conjuntos de datos que examinaron.<\/p>\n<h3>Consulte Herramientas computacionales Ordenar se\u00f1al de Ruido<\/h3>\n<p>Creo que [este art\u00edculo es] una muy buena demostraci\u00f3n de lo importante que es hacer un control de calidad, dice Michael Love, un bioestad\u00edstico de la Universidad de Carolina del Norte-Chapel Hill que no particip\u00f3 en el estudiar. Love agrega que hay otros sesgos que afectan los datos de RNA-seq, como el sesgo del contenido de GC, en el que la cantidad de guanina (G) y citosina (C) puede influir en si el nivel de expresi\u00f3n de un gen est\u00e1 sobre o subrepresentado. en algunas muestras.<\/p>\n<p>Tambi\u00e9n hay otros sesgos relacionados con la longitud. En 2009, Alicia Oshlack, bioinform\u00e1tica que entonces trabajaba en el Instituto de Investigaci\u00f3n M\u00e9dica Walter and Eliza Hall en Australia, y su colega informaron sobre un sesgo t\u00e9cnico inherente a los protocolos RNA-seq que hace que sea m\u00e1s f\u00e1cil identificar diferencias en la expresi\u00f3n en genes m\u00e1s largos que en genes m\u00e1s largos. en los m\u00e1s cortos. Ella y su equipo tambi\u00e9n desarrollaron un m\u00e9todo, GOSeq, para abordar esta representaci\u00f3n excesiva. Oshlack, que ahora trabaja en Murdoch Childrens Research Institute, le dice a <em>The Scientist&nbsp;<\/em>en un correo electr\u00f3nico que, si bien los sesgos de longitud informados por su grupo y el grupo de Elkons son ligeramente diferentes, probablemente afectar\u00edan a GSEA de la misma manera. .<\/p>\n<p>El sesgo de longitud espec\u00edfico de la muestra probablemente sea el resultado de un problema t\u00e9cnico en las canalizaciones de RNA-seq, aunque la causa exacta sigue sin estar clara, dice Elkon. \u00c9l dice que espera que al destacar este problema, otros investigadores se den cuenta de este problema y tomen medidas para abordarlo.<\/p>\n<p>Dir\u00eda que es un art\u00edculo potencialmente impactante porque es importante conocer estos cosas y pensar en ellas cuando haces tu an\u00e1lisis, dice Hansen, quien desarroll\u00f3 cqn, uno de los m\u00e9todos probados en el estudio de Elkon. A veces, la comunidad necesita buenos recordatorios de que esto es realmente un problema.<\/p>\n<p><strong>S. Mandelboum et al., Interpretaci\u00f3n incorrecta funcional recurrente de los datos de RNA-seq causada por el sesgo de longitud de genes espec\u00edficos de la muestra,&nbsp;<\/strong><strong><em>PLOS Biology<\/em><\/strong><strong>,&nbsp; doi:10.1371\/journal.pbio.3000481,<\/strong> <strong>2019.&nbsp;<\/strong><\/p>\n<p><em>Diana Kwon<\/em> <em>es una freelance con sede en Berl\u00edn periodista. S\u00edguela en Twitter&nbsp;<\/em><em>@DianaMKwon<\/em><em>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>ARRIBA: ISTOCK.COM, SHUOSHU La secuenciaci\u00f3n de ARN es una herramienta popular entre los bi\u00f3logos moleculares porque les permite examinar los patrones de expresi\u00f3n g\u00e9nica en el ADN. Sin embargo, la t\u00e9cnica es susceptible a artefactos experimentales, lo que puede dar lugar a resultados mal interpretados. Seg\u00fan un estudio publicado la semana pasada (12 de noviembre) &hellip; <a href=\"https:\/\/www.biblia.work\/articulos-salud\/sesgo-tecnico-generalizado-en-conjuntos-de-datos-de-secuenciacion-de-arn\/\" class=\"more-link\">Continuar leyendo<span class=\"screen-reader-text\"> \u00abSesgo t\u00e9cnico generalizado en conjuntos de datos de secuenciaci\u00f3n de ARN\u00bb<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-36378","post","type-post","status-publish","format-standard","hentry","category-general"],"_links":{"self":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts\/36378","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/comments?post=36378"}],"version-history":[{"count":0,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts\/36378\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/media?parent=36378"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/categories?post=36378"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/tags?post=36378"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}