Ciencia
Descubre cómo Sam revoluciona la tecnología enseñando a las máquinas a hablar
Quién: Sam, un niño australiano
Qué: Durante 18 meses se recopilaron 61 horas de imágenes y audio para generar un modelo de lenguaje para las IA
Cuándo: Durante 18 meses de la vida de Sam, entre los 6 y 25 meses de edad
Dónde: Australia
Cómo: Se utilizaron sensores y cámaras para grabar la vida del niño, exponiéndolo a 250,000 palabras para enseñar a hablar a las inteligencias artificiales
Por qué: El objetivo era enseñar a las IA a aprender de forma más eficiente y similar a los humanos
Inteligencia artificial aprendiendo del lenguaje de un niño
Un estudio realizado durante 18 meses de la vida de Sam, un niño australiano, ha recopilado 61 horas de imágenes y grabaciones de audio que han sido utilizadas para desarrollar un modelo de lenguaje para las inteligencias artificiales. Sam llevaba un casco con sensores y cámara desde los 6 hasta los 25 meses, donde se capturaron momentos donde estuvo expuesto a 250,000 palabras. Esto ha sido fundamental para enseñar a hablar a las inteligencias artificiales.
Los bebés tienen una sorprendente capacidad para aprender rápidamente a hablar. Antes de cumplir un año, ya dicen su primera palabra y a los tres años pueden comunicarse en su lengua materna. Este proceso de aprendizaje ha sido un modelo para la inteligencia artificial, que requiere una gran cantidad de datos para aprender un idioma. Un grupo de investigadores de la Universidad de Nueva York ha utilizado al pequeño Sam como referencia para entrenar a sus algoritmos, utilizando vídeos grabados desde la perspectiva del niño a través de un casco con cámara.
Aprendizaje de la ambigüedad, sarcasmo y chistes
Las lenguas naturales, como el español o el inglés, son formas de comunicación que desarrollamos de forma espontánea, a diferencia de lenguas artificiales como los lenguajes de programación o el lenguaje matemático. La ambigüedad en las lenguas naturales hace que sean especialmente desafiantes para las máquinas, y es por eso que expresiones como el sarcasmo y los chistes pueden ser difíciles de interpretar para los ordenadores.
Desarrollo desde la Guerra Fría
Desde los años 50, ha habido interés en lograr que los ordenadores puedan trabajar con lenguaje humano, como lo demostró el Experimento Georgetown para traducir entre inglés y ruso, un aspecto de gran interés durante la Guerra Fría. Para lograrlo, lingüistas e informáticos han descrito la estructura del idioma mediante reglas sintácticas basadas en teorías como las de Chomsky, aunque estos sistemas eran limitados por la falta de consideración del contexto.
Modelos de lenguaje como ChatGPT
Existen grandes modelos de lenguaje que se basan en predecir la siguiente palabra en una oración, lo que les permite generar texto coherente. Estos modelos funcionan entrenándose con una cantidad masiva de texto para detectar patrones y aprender a generar texto nuevo. Sin embargo, la capacidad de comprensión real de estos modelos es un tema de debate entre los científicos.
Desafíos en el aprendizaje de la inteligencia artificial
Los grandes modelos de IA requieren una cantidad significativa de datos, energía y recursos para su entrenamiento. La experimentación con niños como Sam representa una oportunidad para desarrollar sistemas de IA más eficientes y sostenibles en el futuro.
En resumen, el aprendizaje del lenguaje a partir de la experiencia de un niño como Sam ofrece nuevas perspectivas para el desarrollo de la inteligencia artificial, con la posibilidad de reducir la dependencia de grandes cantidades de datos y recursos para su entrenamiento.