Terabytes de datos gubernamentales copiados
Agulhas Return Current (ARC) Ocean Climate Station mooringNOAA En los últimos meses, ha surgido un movimiento entre bibliotecarios, científicos ambientales e informáticos, y partidarios del acceso a datos públicos para crear archivos de información ambiental. Si bien el volumen de material es abrumador (estamos hablando de cientos de millones de páginas web), los voluntarios han logrado avances considerables, recopilando terabytes (TB) de datos hasta la fecha, y se recopilan más todo el tiempo.
Para el 11 de febrero, un equipo, llamado Azimuth Climate Data Backup Project, había respaldado 19 TB de datos de la NASA, la Administración Nacional Oceánica y Atmosférica (NOAA) y otras agencias federales que recopilan datos relacionados con el clima. «Sé que hay una brecha, porque hay varios conjuntos de datos grandes que aún se están descargando, en su mayoría por mí», Jan Galkowski, un estadístico que contribuye al grupo, le dijo a The Scientist en un correo electrónico. “Tenemos la capacidad y la voluntad…
La elección del presidente Donald Trump, y las expectativas de que los proyectos relacionados con el clima en particular sufran recortes durante su administración, han avivado los temores de que el acceso a los datos ambientales del gobierno puede estar en peligro. No vamos a ver ningún dato que desaparezca de la noche a la mañana, dijo Michelle Murphy, directora de la Unidad de Investigación de Tecnociencia de la Universidad de Toronto. Una forma de perder datos es cerrar un programa. . . . . [Su conjunto de datos] no tiene que eliminarse, simplemente se descuida, se desconecta, se mete en un cajón.
En respuesta a esas preocupaciones, Murphy ayudó a iniciar la Iniciativa de Gobernanza y Datos Ambientales (EDGI) varias Hace meses. El proyecto dirigido por voluntarios coordina la recopilación y el archivo de datos del gobierno de los EE. UU. a través de los llamados eventos de rescate de datos, en los que las personas se reúnen para asignar experiencia y poder de cómputo para salvar conjuntos de datos o sitios web particulares. Hasta el momento, se han realizado docenas de estos eventos en los EE. UU. y Canadá, y hay más programados.
EDGI se asocia con la red DataRefuge, una iniciativa lanzada por el Programa Penn en Humanidades Ambientales de la Universidad de Pensilvania e Internet Archive. para almacenar las páginas web y los datos que recopilan los participantes. Según Dawn Walker, que trabaja con EDGI, se han descargado 1,7 Tebibytes (TiB) para su inclusión en DataRefuge, incluidos 158 conjuntos de datos que ahora están disponibles para descargar. Los voluntarios de rescate de datos también han nominado 73.500 URL de sitios web gubernamentales para que sean rastreados por Internet Archive. (El rastreo es el proceso de descargar un sitio web, luego abrirse en abanico a cada enlace de ese sitio y descargarlos, y así sucesivamente).
Jefferson Bailey, director de archivo web en Internet Archive, dijo algunos de estos probablemente se habrían incluido en el rastreo de fin de período ya programado de las organizaciones, que recopila URL de .gov y .mil al final de cada período presidencial. Pero los esfuerzos de EDGI son complementarios. Hace cuatro años, dijo Bailey, las personas nominaron solo alrededor de 1400 URL para rastrear. Podemos arrastrarnos, escalar y almacenar mucho, le dijo a The Scientist. Pero no tenemos tiempo ni personal para organizar eventos. Trabajar con EDGI, dijo, ha sido una buena pareja.
Además de los esfuerzos organizados de EDGI y Azimuth, los ciudadanos preocupados han hecho sus propias contribuciones individuales. Bryce Lynch, un especialista en seguridad del Área de la Bahía que trabajó anteriormente en la NASA, ha estado descargando datos de boyas de sensores de la NOAA de forma continua durante los últimos dos meses. También participó en un evento local de rescate de datos.
Tengo unos 29-30 terabytes aquí en mi rack. . . . Estoy dedicando la mitad de mi ancho de banda a descargar estas cosas, dijo. Lo he estado haciendo durante dos meses. No me detendré pronto.
La guerrilla tampoco está acumulando impulso. En la Universidad Rice en Houston el sábado pasado, alrededor de 75 voluntarios pasaron el día buscando sitios web para archivar o escribiendo código para recopilar datos. Kathy Hart Weimer, jefa del Centro Kelley de Información Gubernamental, Datos y Servicios Geoespaciales en la Biblioteca Rices Fondren, dijo que se inspiró para organizar el evento sabiendo lo que había sucedido en administraciones anteriores cuando se recortó el presupuesto de las Agencias de Protección Ambiental. Eso provocó el cierre de algunas bibliotecas, dijo. Bibliotecarios que recuerdan que están en sintonía con los presupuestos federales. Queremos asegurarnos de que la información se mantenga para que no solo los científicos puedan acceder a los datos, sino también el público.
Mientras la gente hacía las maletas para salir del evento de rescate de datos, dijo Weimer, la gente preguntaba: ¿Están vamos a hacerlo de nuevo? Tal vez lo hagan, le dijo a The Scientist. Veamos qué sucede a continuación.
Ver Science Policy en 2017
¿Interesado en leer más?
El científico ARCHIVOS
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos, así como a TS Digest, ¡Ediciones digitales de El científico, artículos destacados y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí