El enfoque híbrido de aprendizaje automático ayuda a la precisión de los gestos de las prótesis
Diagrama esquemático y físico de la ubicación de las señales EMG de superficie recopiladas por el Dr. Tie Liu de la Escuela de Ingeniería Eléctrica de la Universidad Tecnológica de Shenyang. Crédito: Dr. Tie Liu, Escuela de Ingeniería Eléctrica, Universidad Tecnológica de Shenyang
Los investigadores de ingeniería han desarrollado un enfoque de aprendizaje automático híbrido para el reconocimiento de gestos musculares en manos protésicas que combina una técnica de IA que normalmente se usa para el reconocimiento de imágenes con otro enfoque especializado. para escritura a mano y reconocimiento de voz. La técnica está logrando un rendimiento muy superior a los esfuerzos tradicionales de aprendizaje automático.
Se publicó un artículo que describe el enfoque híbrido en la revista Cyborg and Bionic Systems.
Las neuronas motoras son aquellas partes del sistema nervioso central que controlan directamente nuestros músculos. Transmiten señales eléctricas que hacen que los músculos se contraigan. La electromiografía (EMG) es un método para medir la respuesta muscular mediante el registro de esta actividad eléctrica a través de la inserción de agujas de electrodos a través de la piel y dentro del músculo. Surface EMG (sEMG) realiza este mismo proceso de registro de forma no invasiva con los electrodos colocados sobre la piel por encima del músculo, y se utiliza para procedimientos no médicos, como la investigación en deportes y fisioterapia.
Over Durante la última década, los investigadores han comenzado a investigar el uso potencial de las señales EMG de superficie para controlar prótesis para personas amputadas, especialmente con respecto a la complejidad de los movimientos y gestos que requieren las manos protésicas para brindar una actividad más suave, receptiva e intuitiva de la mano. dispositivos de lo que es posible actualmente.
Desafortunadamente, la interferencia ambiental inesperada, como un cambio de los electrodos, introduce una gran cantidad de «ruido» en el proceso de cualquier dispositivo que intente reconocer las señales EMG de superficie. Dichos cambios ocurren regularmente en el uso y uso diario de tales sistemas. Para tratar de superar este problema, los usuarios deben participar en un largo y agotador período de entrenamiento de la señal sEMG antes de usar sus prótesis. Los usuarios deben recolectar y clasificar laboriosamente sus propias señales EMG de superficie para poder controlar la mano protésica.
Para reducir o eliminar los desafíos de dicha capacitación, los investigadores han explorado varios enfoques de aprendizaje automático en particular reconocimiento de patrones de aprendizaje profundopara poder distinguir entre diferentes y complejos gestos y movimientos de la mano a pesar de la presencia de interferencia de señal ambiental.
A su vez, se obtiene una reducción en el entrenamiento optimizando el modelo de estructura de red de ese profundo aprendizaje. Una posible mejora que se ha probado es el uso de una red neuronal convolucional (CNN), que es análoga a la estructura de conexión de la corteza visual humana. Este tipo de red neuronal ofrece un rendimiento mejorado con imágenes y voz y, como tal, se encuentra en el corazón de la visión por computadora.
Hasta ahora, los investigadores han logrado cierto éxito con CNN, mejorando significativamente el reconocimiento («extracción» ) de las dimensiones espaciales de las señales sEMG relacionadas con los gestos de las manos. Pero si bien manejan bien el espacio, luchan con el tiempo. Los gestos no son fenómenos estáticos, sino que tienen lugar a lo largo del tiempo, y la CNN ignora la información del tiempo en la contracción continua de los músculos.
Recientemente, algunos investigadores han comenzado a aplicar una memoria neuronal artificial a largo plazo (LSTM, por sus siglas en inglés). arquitectura de red al problema. LSTM involucra una estructura que involucra conexiones de ‘retroalimentación’, lo que le otorga un rendimiento superior en el procesamiento, la clasificación y la realización de predicciones basadas en secuencias de datos a lo largo del tiempo, especialmente cuando hay pausas, brechas o interferencias de duración inesperada entre los eventos que son importantes. LSTM es una forma de aprendizaje profundo que se ha aplicado mejor a tareas que implican actividades conectadas y no segmentadas, como la escritura a mano y el reconocimiento de voz.
El colector de señales EMG de superficie y el diagrama de flujo de control manual ficticio. Crédito: Profesor asociado Dianchun Bai, Escuela de Ingeniería Eléctrica, Universidad Tecnológica de Shenyang
El desafío aquí es que, si bien los investigadores lograron una mejor clasificación de gestos de las señales sEMG, el tamaño del modelo computacional requerido es un problema grave. El microprocesador necesario para ser utilizado es limitado. Usar algo más poderoso sería demasiado costoso. Y, por último, si bien estos modelos de entrenamiento de aprendizaje profundo funcionan con las computadoras del laboratorio, son difíciles de aplicar mediante el tipo de hardware integrado que se encuentra en un dispositivo protésico
«Después de todo, las redes neuronales convolucionales se concibieron con imágenes el reconocimiento en mente, no el control de las prótesis», dijo Dianchun Bai, uno de los autores del artículo y profesor de ingeniería eléctrica en la Universidad Tecnológica de Shenyang. «Necesitábamos acoplar CNN con una técnica que pudiera manejar la dimensión del tiempo, al mismo tiempo que garantizaba la viabilidad en el dispositivo físico que el usuario debe usar».
Entonces, los investigadores desarrollaron un modelo híbrido de CNN y LSTM. que combinaba las ventajas espaciales y temporales de los dos enfoques. Esto redujo el tamaño del modelo de aprendizaje profundo al mismo tiempo que logró una alta precisión, con una resistencia más robusta a la interferencia.
Diagrama esquemático de 16 gestos complejos. Crédito: Dr. Liu Tie de la Escuela de Ingeniería Eléctrica de la Universidad Tecnológica de Shenyang.
Después de desarrollar su sistema, probaron el enfoque híbrido en diez sujetos no amputados que realizaron una serie de 16 gestos diferentes, como agarrar un teléfono, sostener un bolígrafo, señalar, pellizcar y agarrar una taza de agua. Los resultados demostraron un rendimiento muy superior en comparación con CNN solo u otros métodos tradicionales de aprendizaje automático, logrando una precisión de reconocimiento de más del 80 por ciento.
Sin embargo, el enfoque híbrido tuvo problemas para reconocer con precisión dos gestos de pellizco: un pellizco con el dedo medio y otro usando el dedo índice. En futuros esfuerzos, los investigadores quieren optimizar el algoritmo y mejorar aún más su precisión, mientras mantienen pequeño el modelo de entrenamiento para que pueda usarse en hardware de prótesis. También quieren averiguar qué provoca la dificultad para reconocer los gestos de pellizco y ampliar sus experimentos a un número mucho mayor de sujetos.
En última instancia, los investigadores quieren desarrollar una mano protésica que sea tan flexible y fiable como miembro original del usuario.
Explore más
Simple, preciso y eficiente: Mejorando la forma en que las computadoras reconocen los gestos de las manos Más información: Dianchun Bai et al, Investigación de aplicaciones sobre el algoritmo de optimización del reconocimiento de gestos sEMG basado en la luz Modelo CNN+LSTM, Cyborg y Bionic Systems (2021). DOI: 10.34133/2021/9794610 Proporcionado por Beijing Institute of Technology Press Cita: El enfoque de aprendizaje automático híbrido da una mano a la precisión de los gestos de prótesis (2022, 7 de febrero) recuperado el 29 de agosto de 2022 de https: //medicalxpress.com/news/2022-02-hybrid-machine-learning-approach-prosthetic-limb-gesture.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.