Clasificación correcta de la tos con aprendizaje automático
La memoria bidireccional a largo-corto plazo puede usar los sonidos de la tos para distinguir a los niños enfermos de los sanos, allanando el camino para la detección preliminar. Crédito: SUTD
Investigadores de la Universidad de Tecnología y Diseño de Singapur (SUTD) han demostrado que los modelos de aprendizaje profundo pueden distinguir con precisión entre niños sanos y enfermos usando solo los sonidos de la tos. Estos hallazgos, publicados en la revista Sensors, podrían abrir las puertas a una detección más eficiente de las enfermedades respiratorias en los niños y aliviar una enorme carga de los pacientes, los padres y los médicos por igual.
En los niños, la tos puede ser un signo de varias enfermedades respiratorias, como asma, rinosinusitis e infecciones de las vías respiratorias. La ubicuidad de la tos como síntoma significa que los médicos a menudo tienen que realizar pruebas y procedimientos adicionales para poder brindar un diagnóstico definitivo.
«Estas pruebas requieren visitas al hospital, no están exentas de riesgos para el niño y exigen sobre los recursos de atención médica», dijo el profesor asistente Chen Jer-Ming de SUTD, quien dirigió el estudio. «Además, tales visitas tienen otros impactos sociales o económicos negativos en el niño y su familia, como el tiempo fuera del trabajo y la necesidad de arreglos específicos para el cuidado de los niños».
La necesidad de aliviar esta carga sobre los pacientes y así como el sistema de salud en general ha llevado a un creciente interés en aprovechar las diferencias mínimas en los sonidos de la tos para distinguir una afección respiratoria de otra. Sin embargo, la mayoría de los estudios se han basado en audio de tos cuidadosamente grabado en entornos de estudio de grabación, lo que los hace inadecuados para aplicaciones del mundo real, donde el ruido de fondo y el equipo de baja calidad podrían comprometer la calidad de las toses grabadas.
Para Para abordar este problema, el profesor asistente Chen y el colaborador Dr. Hee Hwan Ing del Hospital de Mujeres y Niños KK y la Escuela de Medicina Duke-NUS utilizaron grabaciones de tos recopiladas con teléfonos inteligentes en un entorno hospitalario en vivo, para reflejar las condiciones «ecológicas» reales. Luego, para ayudarlos a clasificar con precisión los registros de tos como enfermos o saludables, el equipo recurrió a un tipo específico de modelo de red neuronal profunda llamado memoria bidireccional a largo-corto plazo (BiLSTM).
En comparación con otros modelos artificiales redes neuronales, los BiLSTM se componen de unidades individuales que pueden recordar valores durante un período de tiempo arbitrario. Dicho mecanismo de memoria, explicó el profesor asistente Chen, hace que los BiLSTM sean particularmente adecuados para manejar datos secuenciales como audio.
Para entrenar y probar su modelo, el equipo usó grabaciones de tos de 89 niños con asma, 160 con problemas respiratorios inferiores. infección del tracto respiratorio superior y 78 con infección del tracto respiratorio superior. A modo de comparación, también incluyeron sonidos de tos de 89 niños sanos.
El equipo descubrió que BiLSTM podía clasificar con precisión los sonidos de tos individuales como sanos o enfermos el 84,5 por ciento de las veces. Al considerar todas las muestras de audio de un paciente, el modelo predictivo tuvo una calificación de precisión del 91,2 por ciento. Esto significa que de 10 pacientes que proporcionan sus registros de tos, BiLSTM podrá identificar correctamente nueve como sanos o enfermos.
Sin embargo, al tratar de distinguir entre las diferentes toses patológicas, el modelo fue menos preciso. Por ejemplo, el modelo atribuyó erróneamente casi las tres cuartas partes de la tos asmática a infecciones del tracto respiratorio. A su vez, a más del 60 % de los niños con asma se les diagnosticó erróneamente una infección de las vías respiratorias bajas.
«El análisis de las características de audio de toses sanas y no saludables recopiladas del mismo niño reveló el hecho de que las toses no saludables , independientemente de las condiciones subyacentes, son mucho más similares a otras toses nocivas», señaló el profesor asistente Chen. Tal observación está en línea con los registros anecdóticos de que incluso a los médicos mismos les resulta difícil distinguir enfermedades basándose únicamente en los sonidos de la tos.
Sin embargo, los investigadores encontraron que gran parte de la clasificación errónea del modelo ocurrió al intentar distinguir diferentes enfermedades. ; BiLSTM siguió siendo muy preciso para diferenciar a los niños sanos de los enfermos.
A pesar de su potencial para transformar la detección de enfermedades respiratorias en el departamento de pediatría, aún queda trabajo por hacer antes de que el modelo BiLSTM actual esté listo para su implementación clínica.
p>
En particular, el desarrollo de una aplicación para teléfonos inteligentes que pueda recopilar entradas de audio, reenviarlas a un servidor central para procesarlas y mostrar los resultados al usuario final, será clave para que el modelo sea utilizable en el entorno clínico. Una vez implementada, la técnica se puede refinar continuamente utilizando más datos de audio de los pacientes, para mejorar su precisión en la detección de tos patológica.
«Este estudio es solo el primer paso hacia el desarrollo de un modelo de red neuronal profunda altamente eficiente eso puede diferenciar entre diferentes sonidos de tos poco saludables», dijo el profesor asistente Chen. «Este enfoque automatizado ‘en el campo’ respaldará la detección clínica de enfermedades respiratorias asociadas con la tos, lo que contribuirá al control y la detección de la salud, especialmente en comunidades remotas y en desarrollo».
Explore más
Una nueva aplicación puede ayudar a detectar el coronavirus Más información: BT Balamurali et al, Deep Neural Network-Based Respiratory Pathology Classification Using Cough Sounds, Sensors (2021). DOI: 10.3390/s21165555 Proporcionado por la Universidad de tecnología y diseño de Singapur -01-correctly-machine.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.