Biblia

Investigadores desarrollan tecnología novedosa para analizar grabaciones de voz en busca de depresión

Investigadores desarrollan tecnología novedosa para analizar grabaciones de voz en busca de depresión

Desde la izquierda, Ermal Toto, Elke Rundensteiner y ML Tlachac. Crédito: Instituto Politécnico de Worcester

Un grupo de investigadores dirigido por Elke Rundensteiner ha desarrollado una tecnología muy eficaz que analiza las grabaciones de voz en busca de signos de depresión, un avance importante que podría alertar a los médicos y otros profesionales clínicos sobre las personas que necesitan ayuda.

Representaciones de codificador bidireccional asistidas por audio de transformadores (AudiBERT), el sistema desarrollado por los investigadores, aprovecha las palabras que usa un orador, así como el tono del orador, dice Rundensteiner, profesor de ciencias informáticas de William Smith Dean y director fundador de WPI Programa de ciencia de datos.

«Los médicos pueden detectar la depresión y otras enfermedades mentales según el contenido y el tono de las entrevistas con los pacientes», dice Rundensteiner. «Con técnicas de ciencia de datos de aprendizaje profundo, hemos desarrollado una tecnología digital que examina las palabras y el tono de un hablante en busca de signos de depresión. Si se implementa ampliamente, esta herramienta podría expandir drásticamente la evaluación de la salud mental a bajo costo».

La innovación de los investigadores fue seleccionada para su presentación en noviembre de 2021 en la Conferencia de la Asociación de Maquinaria de Computación sobre Gestión de la Información y el Conocimiento, donde recibió el Premio a la Mejor Investigación Aplicada. Los autores son Rundensteiner; Ermal Toto ’20 (Ph.D.), anteriormente estudiante de posgrado en ciencias de la computación con Rundensteiner y ahora subdirectora de computación de investigación académica de WPI; y ML Tlachac, Ph.D. estudiante en ciencia de datos con Rundensteiner. Tlachac ha aceptado un puesto como profesor asistente en la Universidad de Bryant.

AudiBERT se basa en el trabajo anterior de los investigadores sobre la viabilidad de usar el aprendizaje automático para analizar muestras de voz y otros datos digitales de teléfonos inteligentes y redes sociales y en detección de depresión basada en audio como una forma de abordar los problemas sociales de la depresión y los recursos limitados de salud mental. En el centro de la investigación está la idea de que la voz de una persona puede revelar problemas ocultos.

«Si una persona está deprimida, su tono de voz se vuelve monótono», dice Toto. «Su voz puede temblar o temblar un poco. Los médicos capacitados pueden detectar intuitivamente estas variables durante las conversaciones. Ahora podemos automatizar la detección en la voz humana a través de modelos de aprendizaje automático».

AudiBERT también aborda un Desafío crítico de investigación: existen relativamente pocos conjuntos de datos de voz que hayan sido etiquetados como indicadores de depresión. Esto limita la cantidad de datos disponibles para entrenar modelos de aprendizaje profundo, un tipo de aprendizaje automático que analiza automáticamente datos digitales sin procesar para producir un modelo que pueda hacer predicciones. Por lo general, más datos conducen a mejores modelos.

«Las tecnologías de grabación de voz están en todas partes, desde nuestros teléfonos inteligentes hasta los asistentes digitales para el hogar, pero las preocupaciones sobre la privacidad de las grabaciones significan que es difícil encontrar grandes conjuntos de datos de voz que etiqueten las palabras habladas». como signos de enfermedades mentales», dice Tlachac. «Nos propusimos innovar una solución de detección de depresión que pudiera ser entrenada, incluso utilizando pequeños conjuntos de datos. Además, queríamos demostrar que la voz es una modalidad excelente para la detección».

Para evaluar AudiBERT, los investigadores experimentaron con 15 conjuntos de datos de voz que consistían en entrevistas clínicas en las que un agente virtual les hacía a los pacientes diferentes preguntas como «¿Cómo estás hoy?» Los conjuntos de datos se etiquetaron con puntajes que indicaban el estado de depresión de cada participante según un cuestionario de detección de depresión clínica. Los investigadores descubrieron que AudiBERT mostró la capacidad de detectar con precisión la depresión en las grabaciones de voz.

Rundensteiner está entusiasmado con el potencial de esta prometedora tecnología de detección no intrusiva. Los médicos podrían implementar AudiBERT para la detección universal de la salud mental y para monitorear a los pacientes deprimidos a lo largo del tiempo en busca de señales de salud mental, según los investigadores. Imaginan el día en que un paciente que visite el consultorio de un médico y complete un cuestionario de salud en una tableta de computadora pueda ser examinado sin problemas para detectar problemas de salud mental.

«Esta es una tecnología con el potencial para una sociedad muy alta impacto», dice Rundensteiner. «Al expandir la detección, esto podría marcar una diferencia positiva en la vida de las personas».

Explore más

Los investigadores mejoran la IA que puede saber si está deprimido a partir de su voz Proporcionado por el Instituto Politécnico de Worcester Cita: Los investigadores desarrollan una tecnología novedosa para detectar la depresión en las grabaciones de voz (2022, 26 de abril) recuperado el 29 de agosto de 2022 de https://medicalxpress.com/news/2022-04-technology-screen-voice-depression.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.