Opinión: Software de bioinformática: Guía del comprador
NHGRI
El mercado científico actual, obsesionado con las ómicas, está repleto de programas de bioinformática. Cualquiera que sea su problema de análisis de secuencias, probablemente haya un programa o aplicación para resolverlo. Muchas de estas herramientas son de código abierto, pero pueden ser difíciles de usar; algunos requieren un profundo conocimiento computacional. Sin embargo, existen varias alternativas comerciales que reúnen múltiples programas bioinformáticos en paquetes independientes y fáciles de usar. Aunque bellamente diseñadas, estas suites de software pueden tener un precio elevado, lo que significa que la mayoría de los investigadores tienen suerte si pueden pagar solo una. Al igual que comprar un automóvil, elegir entre las muchas suites de software puede ser un desafío y, sorprendentemente, hay poca información disponible para evaluar los diferentes programas. Aquí describo mi propia experiencia con la evaluación y la compra de algunos paquetes comerciales de bioinformática.
Al principio era reacio a comprar software de bioinformática. Sentí que pagar por este tipo de programas iba en contra del espíritu de la investigación académica y que usar el usuario gráfico…
Después de probar una variedad de paquetes comerciales de bioinformática, me decidí por Biomatterss Geneious. Elegí Geneious en gran parte porque la empresa ofrece descuentos para estudiantes. Hace siete años, pagué alrededor de $200 por una licencia de estudiante, lo que me permitió instalar el software en una sola computadora. A partir de mayo de 2014, una licencia de estudiante cuesta $395 (una licencia académica estándar cuesta $795), lo que aún la coloca entre las suites comerciales todo en uno más económicas del mercado.
Desde entonces he pasado a probar, y en algunos casos comprar, otras plataformas bioinformáticas. La mayoría de las veces, para obtener detalles de precios, tenía que solicitar cotizaciones a los representantes de ventas, lo que dificultaba comparar rápidamente los costos de diferentes paquetes de software. Después de una prueba exitosa de CLC bios Genomics Workbench, por ejemplo, llené un formulario de solicitud de precios en línea y dos días después me contactó un agente de ventas que me proporcionó una cotización formal (un estimado de $5500 por una licencia académica estándar). Pasé por procesos similares para obtener el precio de DNAStars Lasergene (aproximadamente $6000 por una licencia académica) y Sequencher de Gene Code ($2500 por una licencia académica). Cuando solicite cotizaciones de precios, espere recibir varios correos electrónicos de seguimiento y llamadas telefónicas de los representantes de ventas. Entonces, ¿qué obtienes?
Comprar una suite comercial de análisis de secuencias no es tan simple como un pago único seguido de toda una vida de felicidad bioinformática. Puede haber costos ocultos y cláusulas asociadas con la ejecución del software. La mayoría de los paquetes comerciales incluyen 12 meses de actualizaciones y soporte gratuitos. Poco después de que compré una licencia de estudiante para Geneious, la empresa lanzó una nueva versión del software. Debido a que esto ocurrió dentro del año siguiente a la compra del programa, pude actualizar a la versión más reciente de forma gratuita. Geneious y la mayoría de los demás fabricantes de bioinformática han cambiado a licencias basadas en versiones, lo que significa que los usuarios reciben actualizaciones gratuitas de su versión del software sin importar cuándo se publiquen, pero el acceso a versiones más nuevas requiere una actualización, que generalmente cuesta entre 25 por ciento y 75 por ciento del precio de lista del software.
El año pasado, por aproximadamente $6,000, compré una licencia académica única de CLC Genomics Workbench y un complemento de finalización del genoma (más sobre complementos más adelante) como parte de un paquete. . La inscripción en el programa de actualización y soporte durante los primeros 12 meses, que era obligatorio, fue de $ 1,500 adicionales, lo que hace que el costo inicial del software sea de $ 7,500. La renovación del programa de mantenimiento fue del 25 por ciento del precio de compra por año y automática. En otras palabras, nueve meses después de comprar el software, me enviaron una factura por $1500, con un interés del 2 por ciento mensual si no se pagaba. Aunque es costoso, suscribirse al contrato de mantenimiento puede ser una buena idea. Los programas comerciales de bioinformática suelen sufrir cambios importantes, que pueden mejorar significativamente el software. Más de una vez he vuelto a comprar programas a precio completo porque dejé expirar el periodo de mantenimiento de licencias anteriores.
Las cosas se complican aún más cuando se compran licencias de red (o flotantes) de programas de bioinformática. A diferencia de una licencia para una sola computadora, que solo funciona en una computadora, una licencia de red/flotante permite que varias personas usen un paquete de bioinformática simultáneamente. Las licencias de red/flotantes son más costosas que sus contrapartes para una sola computadora, pero pueden ser más económicas para grandes laboratorios o aulas, donde la compra de múltiples licencias para un solo usuario tiene menos sentido.
La computación en la nube también se ha infiltrado bioinformática. Compañías como DNAnexus están vendiendo acceso en línea a computadoras poderosas y su software asociado, almacenamiento y capacidades para compartir. Illumina vende acceso en línea a su infraestructura de computación en la nube de genómica BaseSpace; 10 terabytes de almacenamiento le costarán $ 12,000 por año. Alternativamente, la popular plataforma basada en la web Galaxy es una herramienta bioinformática gratuita basada en la nube. Es seguro asumir que las nubes bioinformáticas solo crecerán y se harán más populares en los próximos años y es donde se basará el nuevo software más innovador.
¿Qué hace?
Una vez considerados inferiores a sus contrapartes de código abierto, los algoritmos de ensamblaje patentados han mejorado enormemente en los últimos años y ahora son utilizados por algunos de los mejores laboratorios de investigación del mundo.
Bioinformática comercial Los paquetes reúnen, en una única plataforma basada en navegador, una diversidad de herramientas de análisis de nucleótidos y proteínas. Dada la prevalencia de la secuenciación de alto rendimiento en la investigación de ciencias de la vida, muchas de las herramientas están diseñadas para analizar y visualizar datos de secuenciación de próxima generación (NGS), incluidos ensamblajes de genoma de novo rápidos, eficientes y de alta calidad.
El mapeo de lectura es otra característica central de los paquetes comerciales de bioinformática. Las empresas de bioinformática se jactan regularmente de sus algoritmos de mapeo ultrarrápidos y altamente ajustados para alineaciones guiadas por referencia. La prueba definitiva para cualquier ensamblador o mapeador de lectura es si se cita en revistas revisadas por pares. No hay duda de que los programas de código abierto se citan más que los propietarios. Pero las citas de paquetes de software comercial van en aumento.
Además de ensamblar y mapear datos NGS, los paquetes bioinformáticos comerciales son excelentes para organizar información de secuencias moleculares. Sus interfaces gráficas e intuitivas permiten a los usuarios crear fácilmente jerarquías de carpetas y listas desplegables de datos de secuencia, mover o exportar estos datos a diferentes carpetas y cambiar los formatos de archivo para usarlos en otras aplicaciones. En la mayoría de los casos, el software puede conectarse a recursos en línea, como GenBank y UniProt, lo que brinda acceso rápido y directo a grandes cantidades de información de secuencias de nucleótidos y proteínas, que luego se pueden buscar, descargar, interpretar y analizar a través de visores de secuencias interactivos.
La mayoría de los paquetes vienen con software para alinear secuencias de nucleótidos y aminoácidos (y cromosomas completos), así como herramientas para inferir relaciones evolutivas entre secuencias y construir árboles filogenéticos y matrices de distancia. Otras herramientas útiles incluyen la predicción de la estructura de proteínas, la repetición de nucleótidos y los buscadores de motivos, y la predicción de cebadores. Una ventaja de realizar este tipo de análisis dentro del software comercial es que los resultados se representan en gráficos coloridos y editables, que se pueden exportar y usar para figuras en conferencias y publicaciones.
Opciones y acceso
Si compra un programa de bioinformática y descubre que falta una función en particular, no se asuste: probablemente haya un complemento que pueda hacer el trabajo. Los complementos son aplicaciones descargables que brindan funciones adicionales a los paquetes de software. Las empresas de bioinformática están constantemente diseñando nuevos complementos, lo que significa que el repertorio de herramientas dentro de los paquetes se expande continuamente. Los complementos también traen algunos de los software de código abierto más utilizados a los programas propietarios, brindando a los usuarios los beneficios de una GUI fácil de usar y el poder de los algoritmos revisados por pares.
En el futuro, las innovaciones en la secuenciación dan como resultado programas bioinformáticos más sofisticados, y es crucial que estos programas sean accesibles para una amplia gama de usuarios. Pronto podríamos estar en un punto en el que las clínicas médicas ambulatorias tengan escritorios de bioinformática y secuenciación del genoma, donde los pacientes puedan desempeñar un papel activo en la interpretación de sus secuencias de genes y contribuir a los tratamientos genéticos, y donde los estudiantes de secundaria ensamblan genomas para la tarea. El papel cada vez más integral de la bioinformática en la sociedad también significa que se convertirá en una industria más lucrativa, en la que los usuarios tendrán que pagar por los mejores productos.
Mis propias experiencias con el software patentado de bioinformática han sido positivas. Las herramientas que he comprado me han hecho más productivo, pero a un costo aunque uso herramientas de análisis de secuencias casi todos los días, mis habilidades bioinformáticas, en ciertos aspectos, se han estancado. Además, los costos de licencia y actualización del uso de software comercial representan una proporción significativa del presupuesto operativo de mi laboratorio.
Si está considerando programas comerciales, le recomiendo que aproveche las pruebas gratuitas que ofrece la mayoría de las empresas. Es posible que descubra que estos programas optimizan su investigación y fortalecen su salón de clases, o que son una pérdida de tiempo y es mejor que use alternativas de código abierto. Independientemente de su posición sobre el tema, le insto a que comparta sus opiniones y experiencias con los demás.
Este artículo es una adaptación de una revisión publicada hoy (2 de septiembre) en Briefings in Bioinformatics .
David Roy Smith es profesor asistente de biología en la Universidad de Western Ontario. Se le puede encontrar en línea en www.arrogantgenome.com y @arrogatgenome, y no tiene ningún conflicto de intereses que declarar con respecto a ninguno de los programas o empresas mencionados en este artículo.
¿Le interesa leer más?
El científico ARCHIVOS
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos , así como TS Digest, ediciones digitales de The Scientist, artículos destacados , ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí