Biblia

Almacenamiento de datos de ADN

Almacenamiento de datos de ADN

La codificación de mensajes en ADN se demostró por primera vez en la década de 1980, pero la tecnología en ese momento solo permitía codificar un símbolo gráfico. Si bien esa capacidad ha crecido en las últimas 3 décadas, el proyecto más grande hasta la fecha, completado en 2010, administró solo 7920 bits de datos, lo que equivale a aproximadamente media página de texto escrito. Utilizando una técnica novedosa, detallada hoy en Science, investigadores de las universidades de Harvard y Johns Hopkins han codificado un libro de 53 000 palabras en ADN, incluidas 11 imágenes JPG y un programa JavaScript.

«Otros han señalado que el ADN tiene ciertas ventajas», dijo el coautor del estudio, Sriram Kosuri. «Pero nadie lo había llevado realmente a un nivel en el que pudiéramos codificar cantidades realmente útiles de información».

Esas ventajas incluyen la densidad de información que se puede almacenar: una estimación de la capacidad máxima predice que un gramo de ADN monocatenario podría almacenarse como…

Para superar tales errores, el equipo asignó las bases A y C como 0 y G y T como 1, creando un flujo de datos digital. El manuscrito y sus complementos, una versión preliminar de un libro en coautoría de uno de los autores del estudio, George Church, llamado Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselvesfue convertido a HTML antes de ser traducido al secuencia de 0 y 1 que podría escribirse en la secuencia de ADN. El flujo resultante tenía una longitud de 5,27 megabits, o 5,27 millones de 0 y 1.

Los métodos anteriores se enfrentaban a problemas al intentar crear flujos completos en una secuencia larga de ADN, un proceso complicado y costoso. La solución del equipo fue dividir la corriente en secciones más pequeñas. Codificaron 96 bits por sección corta de nucleótidos, llamados oligonucleótidos, cada uno de los cuales contenía una «dirección» de 19 bits para ordenar la información en la secuencia general. Cada oligonucleótido se sintetizó varias veces, de modo que al leerlos, se podían comparar los errores en cada copia y se podía llegar a una lectura de consenso.

«Es similar en la forma en que cuando secuencias el genoma humano, no lo secuencias una vez, lo secuencias con una cobertura de 30 o 50 veces, y solo tomas el consenso en cada posición», dijo Kosuri.

Después de sintetizar la secuencia y unir gotas de ADN a chips de microarrays, los datos se almacenaron a 4 grados centígrados durante 3 meses antes de disolverlos en agua, amplificarlos por PCR y secuenciarlos. Al almacenar varias copias y secuenciar cada copia muchas veces para llegar a un consenso, el equipo logró decodificar la secuencia completa de 5,27 millones de bits con solo errores de 10 bits.

«Han ideado una muy forma inteligente de manejar el error en la creación de la información», dijo el biólogo sintético Steven Benner de la Fundación para la Evolución Molecular Aplicada, que no participó en el estudio. «[Los autores] proporcionan algunas formas inteligentes de sortear los problemas, permitiendo la lectura de las moléculas minoritarias que contienen la información deseada en medio de un mayor número de moléculas que no».

Si bien el almacenamiento de ADN no está relacionado -grabable, y no destinado a reemplazar su disco duro, la idea de almacenamiento a largo plazo de grandes cantidades de datos en un espacio muy pequeño tiene ventajas para archivar registros y datos. A diferencia de un disco plano como un CD, con datos solo inscritos en la superficie, una hoja de ADN tiene datos almacenados en todo su espesor. Sin embargo, el principal desafío que queda es el costo y la eficiencia de las tecnologías actuales de síntesis y secuenciación, que actualmente hacen que este sistema no sea práctico para el uso regular. Sin embargo, a medida que los costos de secuenciación continúan cayendo y las tecnologías continúan avanzando, tales estrategias de almacenamiento de ADN pronto pueden volverse mucho más prácticas.

Otro desafío que debe superarse es la preservación. Todavía se puede secuenciar el ADN de momias secas de miles de años, pero tales secuencias rara vez están completas.

«La química del ADN no se presta fácilmente a archivos pasivos y sin empaquetar a escala de un siglo», dijo Benner. «Sin embargo, este documento debería alentar a las personas a enfrentar los desafíos del almacenamiento de información basado en moléculas, dado su potencial para el almacenamiento de muy alta densidad».

G. Church et al., «Almacenamiento de información digital de última generación en el ADN», Science, DOI: 10.1126/science.1226355, 2012.

¿Le interesa leer más?

Conviértase en miembro de

Reciba acceso completo a más de 35 años de archivos, así como a TS Digest, ediciones digitales de The Scientist, artículos destacados y mucho más. Únase gratis hoy ¿Ya eres miembro? Inicia sesión aquí