Almacenamiento de datos basado en ADN aquí para quedarse
stock.xchng, schulergdLos investigadores lo han vuelto a hacer: codificar 5,2 millones de bits de datos digitales en cadenas de ADN y demostrar la viabilidad de usar el ADN como una base de datos a largo plazo. medio de almacenamiento denso para cantidades masivas de información. En el nuevo estudio publicado hoy (23 de enero) en Nature, los investigadores codificaron una fotografía en color, 26 segundos de «I Have a Dream» de Martin Luther King Jr. voz y los 154 sonetos conocidos de Shakespeare en el ADN.
Aunque no es el primer ejemplo de almacenamiento de datos digitales en el ADN, «es importante celebrar el surgimiento de un campo, ” dijo George Church, el biólogo sintético de la Universidad de Harvard cuyo propio grupo publicó una demostración similar de almacenamiento de datos basados en ADN el año pasado en Science. El nuevo estudio, dijo, «está haciendo avanzar las cosas».
Hace tiempo que los científicos han reconocido el potencial del ADN como medio de almacenamiento a largo plazo. «El ADN es una pieza de almacenamiento de información muy, muy densa». explica estudio…
Los avances en la síntesis de cadenas definidas de ADN, y su secuenciación para extraer información, finalmente han hecho que el almacenamiento de información basado en ADN sea una posibilidad real. El verano pasado, el grupo de Churchs publicó la primera demostración de la capacidad de almacenamiento de ADN, codificando la versión digital del libro de Churchs Regenesis, que incluía 11 imágenes JPEG, en ADN, usando Gs y Cs para representar 1s del código binario. y As y Ts para representar 0s.
Ahora, Birney y sus colegas buscan reducir el error asociado con el almacenamiento de ADN. Cuando una hebra de ADN tiene una serie de bases idénticas, es difícil que la tecnología de secuenciación de próxima generación lea correctamente la secuencia. El trabajo de las iglesias, por ejemplo, produjo 10 errores de 5,2 millones de bits. Para evitar este tipo de errores, Birney y su colaborador de EMBL-EBI, Nick Goldman, primero convirtieron cada cadena de bytes de ocho 0 y 1 en un solo trit compuesto por 5 o 6 dígitos de 0, 1 y 2. Luego, al convertir estos trits en las bases A, G, T y C del ADN, los investigadores evitaron repetir las bases mediante el uso de un código que tuvo en cuenta la base anterior al determinar qué base representaría el siguiente dígito.
El proceso de síntesis también introduce error, colocando una base incorrecta por cada 500 correctas. Para reducir este tipo de error, los investigadores sintetizaron tramos superpuestos de 117 nucleótidos (nt), cada uno de los cuales se superponía con los hilos anteriores y posteriores, de modo que todos los puntos de datos se codificaron cuatro veces. Esto eliminó efectivamente el error de lectura porque la probabilidad de que las cuatro cadenas tengan errores de síntesis idénticos es insignificante, explicó Birney.
Agilent Technologies en California sintetizó más de 1 millón de copias de cada tramo de ADN de 117 nt, las almacenó como polvo seco y lo envió a temperatura ambiente desde los Estados Unidos a Alemania a través del Reino Unido. Allí, los investigadores tomaron una alícuota de la muestra, la secuenciaron utilizando tecnología de secuenciación de próxima generación y reconstruyeron los archivos.
Birney y Goldman prevén que el ADN reemplace a otros métodos de archivo a largo plazo, como las unidades de cinta magnética. A diferencia de otros sistemas de almacenamiento de datos, que son vulnerables a la obsolescencia tecnológica, los métodos para escribir y leer ADN existirán durante mucho, mucho tiempo, dijo el biólogo molecular Thomas Bentin de la Universidad de Copenhague. Bentin, que no participó en la investigación, comparó el almacenamiento de información de ADN con el apogeo fugaz del disquete introducido hace solo unas décadas y ya casi ilegible. Y aunque sintetizar y decodificar el ADN en la actualidad sigue siendo costoso, su almacenamiento es económico. Entonces, para los datos que están destinados a almacenarse durante cientos o incluso miles de años, Goldman y Birney consideran que el ADN podría ser más barato que la cinta.
Además, existe un gran potencial para escalar a partir de los 739 kilobytes codificados. En el estudio actual. Los investigadores calculan que 1 gramo de ADN podría contener más de 2 millones de megabytes de información, aunque codificar información a esta escala implicará reducir aún más la tasa de error de síntesis, dijo el bioingeniero Mihri Ozkan de la Universidad de California en Riverside, quien no participó. en la investigación.
A pesar de los desafíos que se avecinan, sin embargo, el avance actual definitivamente merece atención, escribió el biólogo sintético Drew Endy de la Universidad de Stanford, que no participó en la investigación, en un correo electrónico a El científico. Debería convertirse en una nueva opción para el almacenamiento de datos de archivo, en la que el ADN no se considera una molécula biológica, sino una cinta de almacenamiento de datos sin vida.
N. Goldman et al., Hacia un almacenamiento de información práctico, de alta capacidad y bajo mantenimiento en ADN sintetizado, Nature, doi: 10.1038/nature.11875, 2013.
¿Interesado en leer más?
The Scientist ARCHIVES
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos, así como TS Digest, ediciones digitales de The Scientist, artículos destacados, ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí