Biblia

Un enfoque computacional para comprender cómo los bebés perciben el lenguaje

Un enfoque computacional para comprender cómo los bebés perciben el lenguaje

Crédito: CC0 Public Domain

Los idiomas difieren en los sonidos que usan. El idioma japonés, por ejemplo, no distingue entre los sonidos ‘r’ y ‘l’ como en ‘rock’ versus ‘lock’. Sorprendentemente, los bebés se sintonizan con los sonidos de su lengua materna antes de aprender a hablar. Los bebés de un año, por ejemplo, distinguen menos fácilmente entre ‘rock’ y ‘lock’ cuando viven en un entorno donde se habla japonés en lugar de inglés.

Relatos científicos influyentes de este fenómeno de aprendizaje fonético temprano propusieron inicialmente que los bebés agrupan los sonidos en categorías fonéticas similares a vocales y consonantes a través de un mecanismo de agrupación estadístico conocido como aprendizaje distributivo.

La idea de que los bebés aprenden Sin embargo, las categorías fonéticas de consonantes y vocales han sido cuestionadas por un nuevo estudio publicado esta semana en Proceedings of the National Academy of Sciences.

En el estudio, un equipo multiinstitucional de científicos cognitivos y los lingüistas computacionales han introducido un marco de modelado cuantitativo que se basa en una simulación a gran escala del proceso de aprendizaje de idiomas en bebés. Utilizando técnicas de aprendizaje automático eficientes desde el punto de vista computacional, este enfoque permite que los mecanismos de aprendizaje se vinculen sistemáticamente con predicciones comprobables sobre la sintonía de los bebés con su lengua materna.

«Las hipótesis sobre lo que aprenden los bebés han impulsado tradicionalmente los intentos de los investigadores para comprender este sorprendente fenómeno», dice Thomas Schatz, asociado postdoctoral en el Instituto de Estudios Informáticos Avanzados de la Universidad de Maryland (UMIACS) y autor principal del estudio. «Proponemos partir de hipótesis sobre cómo podrían aprender los bebés».

Además de Schatz, los autores del estudio incluyen a Naomi Feldman, profesora asociada de lingüística en la Universidad de Maryland con un nombramiento en UMIACS; Sharon Goldwater, profesora del Instituto de Lenguaje, Cognición y Computación de la Facultad de Informática de la Universidad de Edimburgo; Xun-Nga Cao, ingeniero investigador de la Ecole Normale Suprieure (ENS) de París y cofundador de las startups Langinnov y Gazouyi; y Emmanuel Dupoux, profesor que dirige el equipo de aprendizaje automático cognitivo de la ENS.

Para su estudio, los investigadores simularon el proceso de aprendizaje en bebés al entrenar un algoritmo de agrupamiento computacionalmente eficiente en la entrada de voz realista. El algoritmo se alimentó con características auditivas similares a espectrogramas muestreadas a intervalos de tiempo regulares que se obtuvieron de grabaciones de voz naturalistas en un idioma de destino. En este estudio, el inglés estadounidense y el japonés fueron los dos idiomas utilizados.

Esto arrojó un modelo candidato para el conocimiento fonético temprano de, digamos, un bebé japonés, dicen los investigadores. A continuación, hicieron dos preguntas a los modelos entrenados. ¿Podrían explicar las diferencias observadas en cómo los bebés que aprenden japonés e inglés discriminan los sonidos del habla? Y, ¿los modelos aprendieron categorías fonéticas similares a vocales y consonantes?

Las explicaciones científicas dominantes del aprendizaje fonético temprano habrían esperado que las respuestas a estas preguntas coincidieran (o ambas deberían ser ‘sí’ o ambas debe ser ‘no’). Los investigadores encontraron que la respuesta a la primera pregunta era positiva: sus modelos tenían en cuenta el comportamiento observado de los bebés, en particular la dificultad de los bebés japoneses para distinguir palabras como ‘roca’ y ‘candado’. Sin embargo, la respuesta a la segunda pregunta fue negativa: se descubrió que los modelos habían aprendido unidades de habla demasiado breves y acústicamente variables para corresponder a categorías fonéticas similares a vocales y consonantes.

Estos resultados sugieren una sorprendente reinterpretación de la literatura existente sobre el aprendizaje fonético temprano. Las dificultades para ampliar el aprendizaje distributivo de categorías fonéticas a condiciones de aprendizaje realistas pueden interpretarse mejor como un cuestionamiento de la idea de que lo que aprenden los bebés son categorías fonéticas, en lugar de la idea de que aprenden a través del aprendizaje distributivo puro (la interpretación tradicional).

La ciencia cognitiva no ha utilizado tradicionalmente modelos a gran escala, dice Schatz, pero los avances recientes en el poder de cómputo, grandes conjuntos de datos y algoritmos de aprendizaje automático hacen que este enfoque sea más factible que nunca.

Schatz y Feldman forman parte del Laboratorio de Procesamiento de Información y Lingüística Computacional (CLIP) en UMIACS, donde Feldman es el director actual. Los sólidos recursos informáticos en el laboratorio CLIP y el laboratorio Cognitive Machine Learning en París fueron fundamentales para el proyecto de investigación, dice Feldman.

En conclusión, los investigadores creen que su enfoque de modelado basado en computación, junto con los esfuerzos en curso en el campo para recopilar datos empíricos a gran escala, como grabaciones a gran escala de los entornos de aprendizaje de los bebés en el hogar y la evaluación a gran escala de los resultados del aprendizaje de los bebés, abre el camino hacia una comprensión mucho más profunda de la adquisición temprana del lenguaje.

Explore más

Los bebés pueden aprender el vínculo entre el idioma y el origen étnico, sugiere un estudio. Más información: Thomas Schatz et al, Aprendizaje fonético temprano sin categorías fonéticas: conocimientos de simulaciones a gran escala en entrada, Actas de la Academia Nacional de Ciencias (2021). DOI: 10.1073/pnas.2001844118 Información de la revista: Procedimientos de la Academia Nacional de Ciencias

Proporcionado por la Universidad de Maryland Cita: Un enfoque computacional para comprender cómo perciben los bebés language (2021, 29 de enero) recuperado el 30 de agosto de 2022 de https://medicalxpress.com/news/2021-01-approach-infants-language.html Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.