Biblia

El sistema de reconocimiento de objetos con IA funciona a la velocidad de la luz

El sistema de reconocimiento de objetos con IA funciona a la velocidad de la luz

ARRIBA: El aprendizaje profundo totalmente óptico utiliza componentes ópticos pasivos impresos en 3D para implementar funciones complejas a la velocidad de la luz. OZCAN LAB @ UCLA

Si desea un sistema de reconocimiento de objetos o imágenes extremadamente rápido para detectar elementos en movimiento, como un misil o automóviles en la carretera, una cámara digital conectada a una computadora simplemente no funcionará, según el ingeniero eléctrico Aydogan Ozcan de la Universidad de California, Los Ángeles. Entonces, usando aprendizaje automático, herramientas ópticas e impresión 3D, él y sus colegas crearon un sistema que es más rápido, funciona con luz y, a diferencia de las computadoras, no requiere una fuente de energía distinta a la fuente de luz inicial y un detector sencillo. Sus resultados se publican hoy (26 de julio) en Science

“Este es un enfoque muy innovador para construir una red neuronal artificial física hecha de capas apiladas de elementos ópticos ,” Demetri Psaltis, profesor de óptica y…

Lo que es novedoso aquí no es la parte de aprendizaje profundo, sino la ingeniería óptica y la capacidad de hacer un molde de la red neuronal artificial usando 3-D impresión, señala Olexa Bilaniuk, estudiante de posgrado en los grupos de Roland Memisevic y Yoshua Bengios de la Universidad de Montreal que estudia el aprendizaje automático y las redes neuronales artificiales. El trabajo anterior para crear una red óptica de este tipo había sido teórico o había construido sistemas mucho más simples y pequeños, agrega.

A Ozcan le gustaría usar el sistema para imitar varios ojos de animales, que procesan la luz. e imágenes de manera diferente al ojo humano. La invención también podría usarse para aplicaciones de microscopía e imágenes médicas, dice, si se implementa en las longitudes de onda más cortas que se usan en la microscopía óptica.

Para construir su sistema de reconocimiento, Ozcan y sus colegas primero usaron un enfoque conocido como aprendizaje profundo, en el que una computadora recibe datos de audio o visuales y se entrena para reconocer ciertos patrones. Luego, el algoritmo crea reglas sobre los datos proporcionados y las aplica para describir nuevas entradas.

En este caso, el equipo entrenó su modelo de red para reconocer diferentes tipos de datos, incluidas imágenes de dígitos escritos a mano del 0 al 9 y varias prendas de vestir. En cada caso, la computadora creó un modelo, que constaba de varias capas de píxeles. Cada píxel puede transmitir luz y representa una neurona artificial conectada a otras neuronas en la misma capa o en capas adjuntas.

Para cada tipo de datos, los investigadores luego hicieron una representación física del modelo utilizando cinco capas de un plástico impreso en 3D que luego podría procesar cada tipo de imagen utilizando una luz monocromática láser a 0,4 terahercios en lugar de la luz visible.

La red neuronal de polímero impreso toma la luz que rebota en un objeto y la procesa a la velocidad de la luz según la estructura física de la red neuronal y clasifica rápidamente el objeto o su imagen en la categoría correcta enfocando la luz en el detector correcto a la salida de la red.

El producto impreso es como un cerebro físico con conexiones neuronales, excepto que aquí, la luz conecta las neuronas de modo que la información puede fluir de una capa de neuronas a la siguiente, explica Ozcan.

Esta es una red neuronal extremadamente eficiente implementación, porque una vez t Las superficies de difracción pasiva están impresas en 3D, no usan electricidad en absoluto, pero procesan su entrada a la velocidad de la luz, sin demora, escribe Bilaniuk en un correo electrónico a The Scientist.

Los investigadores ahora están trabajando para mejorar el rendimiento del modelo de capacitación por computadora. En el caso del conjunto de entrenamiento de dígitos, su red artificial tenía una precisión de alrededor del 91,75 por ciento en el reconocimiento de nuevos dígitos escritos a mano. También les gustaría escalar su red impresa a dimensiones más grandes que las capas impresas de 8 cm por 8 cm que se informan en el documento. Con más capas, potencialmente podemos implementar tareas más complejas con mayor precisión, dice Ozcan a The Scientist

Para Psaltis, el nuevo trabajo plantea más preguntas de las que responde. ¿Se puede hacer este sistema más robusto, podemos aumentar la velocidad, cuál es el costo del modelado y la impresión 3D, y cómo podríamos integrar potencialmente esta herramienta con los sistemas digitales existentes? escribe. 

Según Bilaniuk, si el sistema pudiera adaptarse a la luz normal y miniaturizarse, las aplicaciones potenciales podrían ser la detección de rostros en las cámaras de los teléfonos móviles y el enfoque automático sin gastar la batería tal cual. necesario para dispositivos digitales.

X. Lin et al., Aprendizaje automático totalmente óptico mediante redes neuronales profundas difractivas, Science, doi:10.1126/science.aat8084, 2018.

Interesado en ¿Leer más?

El científico ARCHIVOS

Conviértase en miembro de

Reciba acceso completo a más de 35 años de archivos, así como TS Digest, ediciones digitales de The Scientist, artículos destacados, ¡y mucho más!Únase gratis hoy ¿Ya es miembro?Inicie sesión aquí