Opinión: Medicina de minería de texto
WIKIMEDIA COMMONS, LIN KRISTENSEN
La complejidad del mundo médico contiene una plétora de términos especializados que son inconsistentes y pueden superponerse. Dado que estos términos médicos son introducidos esporádicamente por investigadores en diferentes contextos geográficos y temporales, esto puede hacer que el significado de los términos cambie o que la terminología sea ambigua o inexistente. Tal ambigüedad en las guías de práctica clínica conduce a interpretaciones inconsistentes y, a su vez, a decisiones de tratamiento inapropiadas y errores médicos.
Una solución es la creación de una ontología médica, o un conjunto de conceptos médicos estandarizados. Pero estandarizar la terminología es más fácil decirlo que hacerlo. El lenguaje médico actual es vivo y complejo, y constantemente se crean nuevos términos y campos médicos. A medida que evolucionan estos nuevos términos y campos, la indexación anterior puede ser incompleta o inapropiada, y luego puede causar información errónea o falta de comunicación. Por ejemplo, la palabra “frío” se puede interpretar de varias maneras dependiendo del contexto. Puede referirse a un…
MeSH, el vocabulario controlado de la Biblioteca Nacional de Medicina de EE. UU. para indexar artículos para MEDLINE y PubMed, ha realizado uno de los mayores esfuerzos para estandarizar el lenguaje médico. Mantenido activamente por el Centro Nacional de Información Biotecnológica, MeSH es uno de los vocabularios controlados computarizados más antiguos utilizados por las bibliotecas. Incluso este documento, sin embargo, tiene términos cruzados incorrectamente debido a cambios en la terminología. Además, este y otros esfuerzos para estandarizar vocabularios tienen una cantidad significativa de elaboración manual, lo que conduce a un cierto nivel de subjetividad. Los sesgos basados en experiencias personales, culturas y dominios de experiencia pueden influir en la indexación médica, como MeSH. Algunos expertos pueden introducir términos específicos para una región geográfica o cultura organizacional, por ejemplo, que pueden no ser consistentes en otras colecciones profesionales similares. Los estudios han demostrado que la falta de comunicación ocurre con frecuencia debido a terminología vaga o términos que tienen múltiples significados debido al contexto y preferencia personal, lo que puede resultar en una variación inapropiada en la práctica médica e incluso errores médicos en el peor de los casos. Por último, pero no menos importante, MeSH no ha catalogado ningún documento anterior a 1950.
Para crear una ontogenia más robusta, los investigadores deben confiar más en la minería de textos, el campo de investigación interdisciplinario que descubre conocimiento a partir de grandes escalar colecciones de texto no estructurado. Explorando archivos médicos históricos, las técnicas de minería de texto pueden explorar posibles conexiones entre terminologías dispares que pueden llevar a detectar cambios de terminología con el tiempo, descubriendo inconsistencias y ambigüedades en MeSH y otros vocabularios médicos controlados para ayudar a reducir la falta de comunicación. Tales esfuerzos también podrían revelar tendencias en medicamentos del pasado que pueden conducir a conocimientos relevantes para la práctica médica actual. Comprender mejor los riesgos potenciales de infección en el lugar de trabajo, por ejemplo, podría fomentar prácticas para reducir esos riesgos.
La minería de textos biomédicos se ha convertido en un componente central de la bioinformática para descubrir información útil oculta en colecciones de información genómica, interacciones de moléculas pequeñas y otros grandes conjuntos de datos. Por ejemplo, Gene Ontology (GO), que es el resultado del trabajo colaborativo para realizar descripciones consistentes de productos genéticos en bases de datos multiheterogéneas, proporciona una ayuda para el descubrimiento de nuevas funciones genéticas basadas en datos de secuencia. La extracción de archivos médicos históricos para la gestión terminológica inteligente podría tener un impacto similar en el campo de la medicina, dando como resultado el descubrimiento de nuevos tratamientos y mejorando nuestra comprensión de la evolución de la práctica médica.
Pero antes de que podamos archivos históricos de minas, deben ser digitalizados. Desde la Guerra Civil Estadounidense, los avances en cirugía y otros tratamientos han cambiado la práctica de la medicina de conjeturas a metodología científica. La mitad del siglo XIX fue una época de desarrollo dramático e innovador en los tratamientos médicos. Registros como los libros de casos de los Hospitales Bellevue, que abarcan desde 1860 hasta 1940, ofrecen información del paciente, incluidos los antecedentes médicos y descripciones de quejas, diagnósticos, tratamientos y medicamentos. Sin embargo, pocas de estas colecciones históricas están actualmente disponibles en forma digital.
Sin embargo, una vez establecidas, las técnicas de minería de texto podrían aumentar el vocabulario controlado por MeSH con terminología y definiciones adicionales que representan el lenguaje médico actual. Esto serviría para mejorar la comprensión de conceptos a través de reflexiones históricas y el posible reconocimiento de posibles malentendidos en nuestro conocimiento actual. El aumento de las referencias cruzadas de otros artefactos médicos (p. ej., pinturas, bocetos e instrumentos médicos), a su vez, aumentará la riqueza del material asociado con fines educativos y de investigación. Al proporcionar versiones digitales de estos artefactos, las bibliotecas médicas podrán proporcionar bases de datos más efectivas para explorar las historias de los procedimientos médicos y las dolencias que trataron.
Min Song es profesor asociado en el Departamento de Bibliotecología y Ciencias de la Información de la Universidad de Yonsei.
¿Le interesa leer más?
Conviértase en miembro de
Reciba acceso completo a más de 35 años de archivos, así como TS Digest, ediciones digitales de The Scientist, artículos destacados, ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí