{"id":35289,"date":"2022-09-01T05:20:39","date_gmt":"2022-09-01T10:20:39","guid":{"rendered":"https:\/\/www.biblia.work\/articulos-salud\/making-public-data-public\/"},"modified":"2022-09-01T05:20:39","modified_gmt":"2022-09-01T10:20:39","slug":"making-public-data-public","status":"publish","type":"post","link":"https:\/\/www.biblia.work\/articulos-salud\/making-public-data-public\/","title":{"rendered":"Making Public Data Public"},"content":{"rendered":"<p> WIKIMEDIA, art\u00edculo de MIGUEL ANDRADEA en <em>PLOS Biology<\/em> hoy (8 de junio) describe Wide-Open: un sistema automatizado que escanea art\u00edculos publicados en busca de referencias a conjuntos de datos disponibles p\u00fablicamente y determina si esos datos est\u00e1n realmente disponibles. El sistema, que identific\u00f3 cientos de conjuntos de datos atrasados para su publicaci\u00f3n p\u00fablica en un repositorio de datos de gen\u00f3mica funcional en particular, obtuvo un apoyo rotundo de investigadores, defensores de la ciencia abierta y administradores de bases de datos por igual.<\/p>\n<p> &ldquo;[El sistema] es notablemente simple, muy directo y . . . muy impactante&rdquo; dice el analista de datos biol\u00f3gicos y defensor de la ciencia abierta Titus Brown de la Universidad de California, Davis, que no particip\u00f3 en el estudio. \u00abEs un gran ejemplo de una idea simple que es f\u00e1cil de implementar y que nadie m\u00e1s pens\u00f3\u00bb.<\/p>\n<p> Los avances en t\u00e9cnicas biol\u00f3gicas y tecnolog\u00edas computacionales significan que nunca ha sido tan f\u00e1cil para los cient\u00edficos acumular , almacenar y, en aras del conocimiento colectivo, compartir sus datos. De hecho, para muchos bi\u00f3logos,&#8230;<\/p>\n<p> Pero, como descubrieron Maxim Grechkin y Bill Howe de la Universidad de Washington en Seattle, a veces el paso de publicaci\u00f3n de datos no sucede. Estos cient\u00edficos inform\u00e1ticos hab\u00edan estado intentando estudiar la forma en que los investigadores comparten y reutilizan los datos, pero durante el proceso, dice Grechkin, quien es estudiante de doctorado en el laboratorio de Howes, descubrimos que algunas personas afirman que han publicado sus conjuntos de datos, pero [no lo han hecho]. ].<\/p>\n<p> Grechkin y Howe, junto con el investigador de Microsoft Hoifung Poon&nbsp;crearon un c\u00f3digo inform\u00e1tico que les permit\u00eda descargar todos los art\u00edculos cient\u00edficos de acceso p\u00fablico desde PubMed Central, escanear el texto en busca de identificadores de bases de datos p\u00fablicas o n\u00fameros de acceso y ejecutar esos identificadores contra los repositorios p\u00fablicos para determinar si los datos eran realmente p\u00fablicos o no.<\/p>\n<p> Usando este sistema, llamado Wide-Open, los investigadores realizaron un escaneo inicial para los n\u00fameros de acceso de los conjuntos de datos almacenados en Gene Expression Omnibus (GEO), parte del Centro Nacional de Informaci\u00f3n Biotecnol\u00f3gica (NCBI). Descubrieron que de aproximadamente 25 000 documentos que conten\u00edan aproximadamente 29 000 n\u00fameros de acceso GEO, 473 conjuntos de datos estaban potencialmente atrasados. Entonces, en febrero de 2017, alertaron a GEO.<\/p>\n<p> De los 473 conjuntos de datos, 429 estaban vencidos y se publicaron de inmediato al p\u00fablico, dice la curadora principal de GEO, Tanya Barrett, mientras que otros 27 ya hab\u00edan sido publicados por la hora en que GEO recibi\u00f3 la alerta. Publicamos datos todos los d\u00edas, explica Barrett.<\/p>\n<p> Sab\u00edamos que hab\u00eda algunos conjuntos de datos atrasados, por lo que no fue una gran sorpresa, dice Barrett, pero lo que mostr\u00f3 claramente el proyecto Wide-Open fue que la acumulaci\u00f3n estaba creciendo. Esa fue la parte realmente \u00fatil para nosotros.<\/p>\n<p> Tambi\u00e9n se hab\u00edan publicado otros 14 de los conjuntos de datos, pero los n\u00fameros de acceso citados en los documentos, y por lo tanto elegidos por Wide-Open, conten\u00edan errores tipogr\u00e1ficos. Los tres conjuntos de datos restantes no se pudieron publicar debido a un env\u00edo incompleto o a problemas de privacidad, explicaron los autores.<\/p>\n<p> El equipo tambi\u00e9n utiliz\u00f3 Wide-Open para buscar art\u00edculos publicados con n\u00fameros de acceso dentro del archivo de lectura de secuencias (SRA) de NCBI. ) y encontr\u00f3 84 conjuntos de datos potencialmente atrasados.<\/p>\n<p> Antes del sistema Wide-Open automatizado, GEO depend\u00eda de los usuarios de la base de datos para alertarlos sobre conjuntos de datos atrasados, por ejemplo, quejas de personas que no pueden acceder a una entrada publicada numberand en b\u00fasquedas de texto de art\u00edculos reci\u00e9n publicados para n\u00fameros de acceso. Pero estos no est\u00e1n automatizados, son procesos manuales, dice Barrett. GEO y SRA ahora planean agregar Wide-Open a las herramientas que usamos, dice ella.<\/p>\n<p> Wide-Open contin\u00faa actualiz\u00e1ndose regularmente con posibles conjuntos de datos GEO y SRA vencidos, y el equipo planea agregar b\u00fasqueda capacidades para m\u00e1s repositorios p\u00fablicos en el futuro, dice Grechkin.<\/p>\n<p> Esta es una iniciativa excelente y el \u00e9xito inicial con GEO es bastante sorprendente, dice Brian Nosek, cofundador y director ejecutivo del Center for Open Science , que no particip\u00f3 en el proyecto.<\/p>\n<p>Pero existe una gran limitaci\u00f3n con Wide-Open. El programa depende de tener documentos de acceso p\u00fablico para buscar, explica Grechkin. Por lo tanto, las revistas que est\u00e1n detr\u00e1s de un muro de pago no se pueden buscar sin pagar una suscripci\u00f3n o recibir el permiso de los editores. Este es otro argumento m\u00e1s para las [publicaciones] de acceso abierto, dice Brown.<\/p>\n<p> Aunque Wide-Open actualmente es muy limitado, es un primer paso muy bienvenido hacia la automatizaci\u00f3n de las comprobaciones para el cumplimiento [del intercambio de datos], dice el ex editor gerente de la revista&nbsp;<em>Molecular Ecology<\/em> y de Axios Review&nbsp;Tim Vines, quien tampoco particip\u00f3 en el estudio.<\/p>\n<p> Entonces, \u00bfpor qu\u00e9, si los cient\u00edficos est\u00e1n dispuestos a enviar sus datos a repositorios p\u00fablicos, \u00bfocurre el incumplimiento?<\/p>\n<p> Las fallas en el cumplimiento de las intenciones de compartir datos a menudo se deben a una raz\u00f3n humana e inocente: el olvido, dice Nosek. Los investigadores est\u00e1n ocupados y . . . un compromiso de meses atr\u00e1s para compartir datos [puede f\u00e1cilmente] pasarse por alto u olvidarse.<\/p>\n<p> De hecho, tratamos de hacer un seguimiento, pero a veces son seis meses o incluso dos a\u00f1os que un art\u00edculo va dando vueltas de una revista a otra. , dice el investigador de medicina gen\u00e9tica Ronald Crystal de Weill Cornell Medicine en Nueva York, quien en el momento de la entrevista ten\u00eda uno de los 200 o m\u00e1s conjuntos de datos atrasados que figuran en el sitio web Wide-Open. Algunas cosas se pasan por alto.<\/p>\n<p> Este sentimiento fue repetido por el toxic\u00f3logo computacional Patrick McMullen de ScitoVation y el investigador de traducci\u00f3n Jamie Cate de la Universidad de California, Berkeley, quienes tambi\u00e9n ten\u00edan conjuntos de datos atrasados. Crystal, Cate, McMullen y otros investigadores que respondieron a <em>The Scientist<\/em> apoyaron Wide-Open y planean publicar ahora sus datos.<\/p>\n<p> Creo que [Wide-Open ] es un gran sistema, dice McMullen. Es \u00fatil para los autores, para los curadores del repositorio, as\u00ed como para las personas que quieren usar los datos, dice. En resumen, es un ganar-ganar, o incluso un ganar-ganar-ganar.<\/p>\n<p> <strong>M. Grechkin et al., Wide-Open: Aceleraci\u00f3n de la publicaci\u00f3n de datos p\u00fablicos mediante la automatizaci\u00f3n de la detecci\u00f3n de conjuntos de datos vencidos, <em>PLOS Biology<\/em>, 15: e2002477, 2017.<\/strong><\/p>\n<h2>Interesado en leer m\u00e1s?<\/h2>\n<h4><em>El cient\u00edfico <\/em>ARCHIVOS<\/h4>\n<h2>Convi\u00e9rtase en miembro de<\/h2>\n<p>Reciba acceso completo a m\u00e1s de <strong>35 a\u00f1os de archivos<\/strong>, as\u00ed como <strong><em>TS Digest<\/em><\/strong>, ediciones digitales de <strong><em>The Scientist<\/em><\/strong>, <strong>art\u00edculos destacados<\/strong>, \u00a1y mucho m\u00e1s!\u00danase gratis hoy \u00bfYa es miembro?Inicie sesi\u00f3n aqu\u00ed<\/p>\n","protected":false},"excerpt":{"rendered":"<p>WIKIMEDIA, art\u00edculo de MIGUEL ANDRADEA en PLOS Biology hoy (8 de junio) describe Wide-Open: un sistema automatizado que escanea art\u00edculos publicados en busca de referencias a conjuntos de datos disponibles p\u00fablicamente y determina si esos datos est\u00e1n realmente disponibles. El sistema, que identific\u00f3 cientos de conjuntos de datos atrasados para su publicaci\u00f3n p\u00fablica en un &hellip; <a href=\"https:\/\/www.biblia.work\/articulos-salud\/making-public-data-public\/\" class=\"more-link\">Continuar leyendo<span class=\"screen-reader-text\"> \u00abMaking Public Data Public\u00bb<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-35289","post","type-post","status-publish","format-standard","hentry","category-general"],"_links":{"self":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts\/35289","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/comments?post=35289"}],"version-history":[{"count":0,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/posts\/35289\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/media?parent=35289"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/categories?post=35289"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.biblia.work\/articulos-salud\/wp-json\/wp\/v2\/tags?post=35289"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}