SciELO - Scientific Electronic Library Online

 
 número32Optimización de la integridad estructural de las estaciones de ala de aeronaves de combate: un enfoque de análisis de elementos finitos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Ingenius. Revista de Ciencia y Tecnología

versión On-line ISSN 1390-860Xversión impresa ISSN 1390-650X

Ingenius  no.32 Cuenca jul./dic. 2024

https://doi.org/10.17163/ings.n32.2024.10 

Articles

Cuentacuentos basado en IA generativa para promover la inclusión de personas con discapacidades

Storytelling utilizing generative AI to foster inclusion of individuals with disabilities

Keren Mitsue Ramírez Vergara1 
http://orcid.org/0009-0008-1802-0735

Asdrúbal López-Chau1 
http://orcid.org/0000-0001-5254-0939

Rafael Rojas Hernández1 
http://orcid.org/0000-0001-6649-067X

11,∗Centro Universitario UAEM ZUMPANGO, Universidad Autónoma del Estado de México. Zumpango, Estado de México. México. kramirezv003@alumno.uaemex.mx.


Resumen

En este artículo se presenta el diseño completo y la evaluación de un sistema cuentacuentos digital destinado a niños de entre 4 y 6 años en Latinoamérica. Este sistema está basado en inteligencia artificial generativa. Se realizaron pruebas que abarcaron el funcionamiento del sistema, la diversidad de contenidos, los tiempos de generación, la evaluación de voz, entonación, velocidad y calidad de pronunciación. Los resultados confirman que el sistema funciona correctamente y es intuitivo. Las historias generadas muestran un alto grado de diversidad, ya que, al calcular los índices de Jaccard, el valor máximo encontrado fue de 0,2 en las evaluaciones de treinta cuentos analizados. Como era de esperarse, los tiempos de generación aumentan conforme se incrementa la longitud de los cuentos. Se identificó que la voz que mejor se adapta para contar los cuentos es Onyx de la TTS de OpenAI. Sin embargo, se observaron errores de pronunciación en todas las voces del modelo TTS. De acuerdo con el análisis realizado, el sistema crea historias diferentes, que promueven valores en los niños de habla hispana, fomentando la importancia de la inclusión de personas con discapacidad. Cabe destacar que en ningúncuento se encontró contenido no apto para niños.

Palabras clave: ChatGPT; cuenta cuentos; discapacidad; IA generativa; inclusión

Abstract

This article presents the comprehensive design and evaluation of a digital storytelling system tailored for Latin American children aged 4 to 6, leveraging generative artificial intelligence. Tests were conducted to assess the system’s functionality, content diversity, generation times, and voice quality, including intonation, speed, and pronunciation. The results substantiate the system’s operational efficacy and user-friendly interface. The stories generated demostrate substantial diversity, as indicated by Jaccard indices calculations, which reveal a maximum value of 0.2 derived from evaluating 30 distinct stories. As expected, there was a proportional increase in story generation times relative to their length. ’Onyx’ from OpenAI’s text-to-speech (TTS) was identified as the most appropriate voice for storytelling. Nonetheless, pronunciation inaccuracies were observed across all tested TTS model voices. The analysis demonstrated that the system generates a variety of stories that foster value formation in Spanish-speaking children, thereby promoting the importance of including individuals with disabilities. Notably, all content within the stories was found to be suitable for children, with no inappropriate material detected in any of the narratives.

Keywords: External store; Weapon Carriage; Static Structural Analysis; Sub-modelling; Modal Analysis; Buckling Analysis; Design Optimization

Introducción

La inteligencia artificial generativa (IAG) presenta un avance significativo en el campo de la inteligencia artificial (IA), siendo capaz de producir una amplia gama de contenidos, como textos, imágenes, código fuente para distintos lenguajes de programación, diseño de escenarios, argumentos legales y videos de alta definición, entre otros.

Para la generación automática de textos, actualmente se usan modelos de lenguaje de gran tamaño (large language models, LLM), los cuales producen documentos inéditos, basados en una gran cantidad de texto extraído de internet. Estas creaciones son posibles gracias a las arquitecturas modernas de aprendizaje por refuerzo con retroalimentación humana y de aprendizaje profundo [1] y, en particular, a los transformadores.

ChatGPT ha emergido como una poderosa herramienta en diversos ámbitos, como educación, mercadotecnia, finanzas, servicio al cliente, entre otros. En el área educativa, la aplicación de la inteligencia artificial generativa de textos ha aumentado considerablemente a nivel mundial en la era digital [2], ya que puede apoyar en la comprensión de conceptos al explicarlos en términos más sencillos, en la resolución de ejercicios al demostrar una variedad de enfoques, y en el desarrollo de habilidades de lectura y comprensión de textos en los alumnos de los primeros años escolares, entre muchas otras aplicaciones.

Esta nueva tecnología impulsa la transición hacia una educación más inmersiva, dinámica, participativa e inclusiva, destacando la importancia de los docentes y estudiantes como agentes de cambio en esta transformación [3]. En el futuro, la integración de sistemas como ChatGPT en la educación debería impulsar el desarrollo de las capacidades humanas, al mismo tiempo que contribuya positivamente a la reducción de las desigualdades y fomente los valores fundamentales.

Una excelente manera de fomentar estos valores es a través de la narración de cuentos a niños, pues esta actividad facilita la comprensión del mundo, estimula la imaginación y promueve la resolución de conflictos. Incluso, tiene el poder de transmitir mensajes importantes, ampliar horizontes y fomentar la participación activa en el entorno, así como promover habilidades de comunicación, debate o interpretación [4].

Como herramienta educativa, la narración de cuentos resulta eficaz en el proceso de enseñanza y aprendizaje al hacer que la adquisición de conocimientos sea divertida. Si bien, la narración de cuentos ayuda a generar reflexiones y considerar las moralejas; es un proceso que se necesita enfatizar desde una edad temprana, para estimular adecuadamente el desarrollo cognitivo e intelectual del niño [4].

Por lo tanto, es importante enriquecer la experiencia de contar cuentos con valores humanos desde una edad temprana. Es por ello por lo que el sistema propuesto en este artículo, está dirigido a niños entre 4 y 6 años, porque es una etapa en la cual los niños comienzan a familiarizarse con el texto escrito.

La orientación del sistema hacia la educación inclusiva responde a la creciente importancia que se ha dado en las últimas décadas en la eliminación de la discriminación hacia los grupos más vulnerables. La intención es contribuir a la disminución de esta problemática, específicamente en México, donde la implementación de la educación inclusiva es escasa. Según informes de la OCDE (2019), México se encuentra entre los países con menor nivel de inclusión educativa: solo el 2,85 % de los alumnos con discapacidad reciben educación, a pesar de que aproximadamente el 15 % de la población estudiantil presenta alguna discapacidad [5]. Además, según el Banco Mundial, en 2021, aproximadamente hay 85 millones de personas con algún tipo de discapacidad en América Latina y el Caribe [6], y se ha observado pocos avances en la mejora de los programas de empleo, educación y servicios de salud para las personas con discapacidad.

En este artículo se muestra el diseño y la implementación de un sistema basado en inteligencia artificial generativa -en específico, ChatGPT, junto con otras tecnologías- para la creación automática de cuentos dirigidos a niños de habla hispana. Los dos objetivos principales del sistema son los siguientes: a) inculcar en la niñez los valores de respeto, tolerancia y empatía hacia personas con discapacidad a través de historias, b) promover las habilidades de lectura y comprensión en niños de habla hispana.

Las principales contribuciones de este artículo son las siguientes:

Se propone una alternativa para abordar el desafío de fomentar la inclusión de personas con discapacidades en América Latina, mediante una solución tecnológica del estado del arte.

Se presenta el diseño completo de un sistema de software basado en IAG orientado a generar y contar historias para niñas y niños de habla hispana.

Se muestra el diseño de un prompt especialmente diseñado para generar distintos cuentos que promueven valores de empatía y respeto hacia personas con discapacidad.

Se realiza una evaluación del sistema en cuanto a la diversidad de historias generadas, así como entonación, velocidad y calidad de pronunciación en las narrativas de los cuentos.

Se proporciona públicamente el código fuente completo del sistema y también los archivos complementarios para fines no comerciales a través de un repositorio de github [7].

1.1. Revisión de literatura

Se llevó a cabo una revisión exhaustiva de la literatura utilizando las bases de datos electrónicas: IEEE Explore, Science Direct y Scopus. Los idiomas de los artículos buscados fueron inglés y español. Se restringieron los resultados a artículos de revista, libros y artículos de conferencia publicados entre los años 2021 y 2024. Esta selección de fechas se basó en el hecho de que la inteligencia artificial generativa de texto se hizo accesible para el público a nivel mundial en 2021. En total se recolectaron 91 documentos, de los cuales 85 son artículos, 5 son libros y 1 es un manual.

Las búsquedas se realizaron usando las palabras claves y operadores lógicos mostrados a continuación:

"inclusiveness AND AI AND education",

"disability AND AI AND education",

"storytelling AND inclusiveness AND education", y

"apps AND inclusiveness AND AI"

El análisis de las fuentes obtenidas de bases de datos reconocidas, revela que Scopus contribuyó con 18 documentos, ACM Digital Libray con 4, ScienceDirect con 47 e IEEE Explore con 4 documentos. Se descartaron los artículos que no tenían relación directa con el presente artículo, quedando solamente 23 artículos.

La revisión del estado del arte se centró en cuatro categorías fundamentales que fueron identificadas como objeto de investigación:

La aplicación de cuentos digitales en el desarrollo infantil.

La aplicación de la inteligencia artificial en la creatividad.

El impacto de cuentos digitales en el desarrollo infantil, y

Su potencial para promover la educación inclusiva.

1.1.1. Cuentos digitales en el desarrollo infantil

La importancia y el impacto significativo que los cuentos digitales tienen en el desarrollo infantil han sido resaltadas por varios autores. Una historia se define como una serie de oraciones que describen eventos o experiencias, generalmente relacionadas con actores principales [8].

A través de los cuentos se destacan temas como la compasión, la solidaridad y la empatía. Además de lo mencionado anteriormente, Juppi señala que un cuento digital incorpora elementos tales como texto, música, efectos de audio o voz grabada del autor, y sugiere que la duración de la historia digital dure aproximadamente entre 2 y 4 minutos [9]. Este mismo autor aclara que las narraciones digitales, a menudo, buscan empoderar a las personas; aumentando su crecimiento personal, el control de su propia vida y la capacidad de actuar como un ciudadano consiente. Este empoderamiento se logra gracias a la habilidad técnica y creativa de expresión y comunicación que caracteriza a las narraciones digitales. Finalmente, Juppi sugiere que las instituciones educativas de diferentes niveles académicos aprovechen la narración digital como herramienta para fomentar la educación inclusiva, la empatía, el respeto, el compromiso cívico, y la participación democrática.

El estudio de la influencia de los cuentos digitales en niños ha sido objeto de estudios previos. Bratitsis y Ziannas exploraron el desarrollo de la empatía social en niños mayores de 6 años mediante la narración digital interactiva del cuento “El pollito triste”, desarrollada en el entorno de programación Scratch [8]. En el estudio participaron 25 niños de sexto grado de educación infantil, quienes leyeron el cuento y participaron en actividades interactivas diseñadas para observar sus reacciones emocionales. Los resultados fueron positivos, evidenciando el interés y la sensibilidad hacia el personaje principal, así como su comprensión de la empatía y su aplicación en situaciones cotidianas. Este estudio demostró que las historias digitales facilitan la comprensión de valores inclusivos y la empatía entre los niños.

Por otra parte, Tseng et al. desarrollaron una herramienta llamada PlushPal que permite convertir juguetes de peluche en objetos digitales interactivos usando técnicas de aprendizaje automático. PlushPal permite a los niños hacer que sus peluches digitalizados reconozcan gestos y emitan sonidos personalizados [10]. Además, combina técnicas de narración de cuentos para dar vida a los muñecos, agregándoles habilidades, lo que permite a los niños conectar con recuerdos positivos y experiencias previas.

1.1.2. Inteligencia artificial generativa y su apoyo en la creatividad

La creatividad puede definirse como la capacidad de crear algo nuevo, único y útil [11]. Actualmente, esta capacidad puede ser apoyada por sistemas de IAG. Por ejemplo, Haase y Hanel argumentan que los chatbots, al contar con una amplia base de datos, pueden realizar una recombinación de ideas para generar contenido con niveles similares de creatividad, en especial en el nivel de la creatividad cotidiana [11].

Por otro lado, Li considera que la IA es una herramienta valiosa para los escritores humanos al potenciar ideas cada vez más complejas, con capacidad de expandirse y divergir [12]. Además, prevé que una futura colaboración entre la IA y los humanos será participativa, dinámica e interactiva. Por su parte, Habib et al. evalúan la creatividad en sistemas de IAG en el contexto educativo; analizando la flexibilidad, la elaboración y originalidad de las respuestas mediante pruebas de aceptación del usuario [1]. En [13] se destaca la mejora en el pensamiento divergente y la oferta de diferentes perspectivas. También se enfatiza que una integración cuidadosa de la IAG en la educación creativa, promueve una relación simbiótica entre la creatividad humana y la IA. Li coincide en esta idea, sugiriendo que el uso ético de ChatGPT podría fomentar la inclusión y la diversidad en la educación [12].

1.1.3. Inteligencia artificial en el desarrollo infantil

En una investigación reciente, Kalantari et al. [14] estudiaron el impacto de la IA en la educación infantil. En este estudio se llevó a cabo un análisis cualitativo exploratorio en el que participaron niños de entre 6 y 7 años, junto con sus padres, para evaluar una aplicación de software llamada "Kids Story Builder". Los resultados del estudio revelaron que la tecnología refuerza la comprensión y vínculo de los niños con ellos mismos y sus familias, promoviendo incluso el pensamiento narrativo durante la creación de historias.

Jiahong y Yang [15] presentan los resultados de una revisión exploratoria que evalúa, sintetiza y expone la literatura más reciente sobre la IA en la educación infantil temprana. Sin embargo, el estudio aborda de manera superficial cómo se utiliza la IA en estos contextos.

1.1.4. Inteligencia artificial para desarrollar una educación inclusiva

Las tecnologías de inteligencia artificial (IA) y las nuevas herramientas tecnológicas están dejando una huella significativa en la sociedad y se están integrando cada vez más en el ámbito educativo [16]. Por esta razón, varios autores sugieren que es crucial poner en marcha estas herramientas de manera adecuada en la educación. Aunque en la literatura revisada no se encontraron implementaciones específicas de la IA Generativa (IAG) en la educación inclusiva, se observó la existencia de guías, consejos y recomendaciones destinadas a garantizar un impacto positivo.

Estas tecnologías tienen el potencial de transformar la educación al modificar las experiencias de los alumnos tanto dentro como fuera de las aulas [16]. Yu [17] destaca que la esencia educativa de ChatGPT radica en facilitar el acceso al conocimiento, crear contenido y promover la inclusión educativa. Además, resalta que la gestión ética, la transparencia y la responsabilidad son desafíos importantes planteados por la IA en el ámbito educativo. ChatGPT no solo debe mejorar las capacidades humanas, sino también contribuir de manera ética, guiando hacia una educación más inmersiva, dinámica, participativa e inclusiva.

Li y Lan [18] coinciden con Salas-Pilco et al. [16] y proporcionan una guía para una adopción adecuada de la tecnología, enfatizando la necesidad de promover la inclusión social.

2. Materiales y métodos

El sistema basado en IAG para generar cuentos con contenido que promueven la inclusión de personas con discapacidad, fue diseñado y desarrollado con base en la metodología Kanban, la cual permitió una entrega continua de tareas, ya que se pudo visualizar el progreso en las diferentes secciones y mantener un seguimiento de las tareas pendientes. Esta metodología fue elegida debido a su enfoque de entrega continua, donde el equipo trabaja en las tareas según van surgiendo, sin roles específicos asignados. Cualquier miembro del equipo tomó nuevas tareas de la lista según sea necesario. Además, se utilizó una combinación de tecnologías modernas para garantizar su robustez y eficiencia.

Como lenguaje de programación se usó TypeScript, debido a su capacidad para crear aplicaciones web robustas. Typescript puede compilar su código a JavaScript y ejecutarse en cualquier navegador, plataforma o sistema operativo [19].

Además de su potencial técnico, TypeScript es un lenguaje de programación de código abierto que amplía la sintaxis de JavaScript, garantizando la compatibilidad con los navegadores, servidores y sistemas operativos. Esta elección de la tecnología se vio respaldada por la facilidad de integración con Angular y otras bibliotecas, lo que facilitó el desarrollo y la escalabilidad de la aplicación [20].

En complemento con Typescript, se utilizó el framework Angular para la generación de las interfaces de usuario del sistema. Entre las ventajas de Angular se destaca su eficiente manejo del DOM (Document Object Model) y su capacidad para crear aplicaciones web escalables con Typescript. Además, Angular es conocido por su facilidad de aprendizaje y su capacidad para aumentar la productividad del desarrollo, lo que lo convirtió en una elección natural para este proyecto.

Se integró ChatGPT en la aplicación para implementar la funcionalidad de generación de cuentos. Es un colaborador creativo debido a su capacidad para generar ideas, dar forma a los personajes y crear líneas argumentales para las historias. ChatGPT ha sido utilizado con éxito en el campo de la narración interactiva y los juegos, permitiendo a los usuarios participar en la creación de experiencias narrativas dinámicas y personalizadas, donde la forma de la trama se ajusta a los gustos y experiencias del usuario. Además, tiene la capacidad de enriquecer cuentos o poemas con una variada selección de palabras realistas, emociones y personajes [21]. Estas características lo hacen muy útil y atractivo para la generación de cuentos con contenido inclusivo para las personas con discapacidad.

En la implementación de la aplicación, se consideraron tres etapas: el desarrollo de interfaces de usuario, la generación del prompt para el modelo y la implementación de la API de OpenAI. La arquitectura general del sistema desarrollado se resume de manera gráfica en la Figura 1.

Figura 1 Arquitectura del sistema 

2.1. Diseño de la estructura del prompt

Los LLM son entrenados con una gran cantidad de información, superando lo que una sola persona promedio puede leer en toda su vida. Esta basta cantidad de información hace posible que los LLM puedan generar textos prácticamente de cualquier tema que se les solicite. Sin embargo, el contar con instrucciones precisas resulta esencial en el proceso creativo [22], lo anterior es debido a que la calidad de las respuestas que genera ChatGPT dependen en gran medida de las solicitudes (llamadas prompts, o promotores de respuestas) que se le realizan, es responsabilidad del usuario redactar cuidadosamente los estimuladores de respuestas que generen contenido útil.

En la primera etapa del desarrollo del sistema, se reconoció la importancia de contar con una estructura general de un prompt adecuado que orientará al sistema hacia la generación de resultados coherentes, relevantes, precisos y adecuados para niños de habla hispana. Con este fin, se definieron tres elementos fundamentales de dicha estructura que el usuario puede personalizar, para garantizar una generación efectiva de cuentos. Estos son los siguientes:

Tipo de cuento: Se refiere a la extensión del cuento, es decir, el número de palabras que contiene. Nos basamos en la clasificación mostrada en [23], donde se mencionan que los tres tipos de cuentos infantiles son: microcuento, cuento flash y cuento corto; los cuales constan aproximadamente de 300, 750 y 2000 palabras, respectivamente.

Personajes: Este elemento de la estructura del prompt diseñado, hace referencia a las características físicas y de personalidad de cada uno de los personajes que aparecen en los cuentos. Inicialmente, estos personajes fueron sugeridos por ChatGPT; posteriormente se seleccionaron a los que consideraron apropiados para el objetivo del sistema: inculcar en la niñez los valores de respeto, tolerancia y empatía hacia las personas con discapacidad. Debido a la extensión de los cuentos, se decidió que cada historia puede tener un máximo de tres personajes.

Tema: Se trata del contexto o tema en el que se desarrollará la historia. Estos temas están centrados en fortalecer los valores éticos y de inclusión, como el respeto, la tolerancia y cuidado del medioambiente. Debido a que el sistema está diseñado para niños, y que los cuentos son distintos unos a otros en cada solicitud de generación de historia, se decidió incluir una cantidad máxima de cuatro temas.

En el bloque 4 de la Figura 1, se genera el prompt correspondiente a partir de los parámetros seleccionados por el usuario, el cual guiará al modelo para obtener resultados precisos y adecuados para los niños. La estructura propuesta incluye el rol que debe adoptar ChatGPT para generar las historias, así como las instrucciones precisas sobre el formato en que debe devolver la respuesta. Esta estructura se muestra en la Figura 2. En dicha figura, los parámetros mostrados entre signos de llave como {tipo_de_cuento}, {número_de_palabras}, etc., son sustituidos por valores específicos que el usuario (niño o niña) elija. Esto Además, se puntualizaron las características de los cuentos para obtener los resultados esperados. Las observaciones fueron las siguientes:

Definición del cuentacuentos. Se establece que el modelo es un cuentacuentos que inculca valores a personas con discapacidad.

Formato de respuesta. Se indica que la respuesta debe ser en formato JSON y se define su estructura.

Figura 2 Prompt para la generación de cuentos 

Creación del cuento. Se instruye al sistema para crear un cuento utilizando los parámetros entre llaves, que serán reemplazados por los valores elegidos por el usuario.

Consideraciones para el cuento. En esta sección se indica que el cuento debe ser original y centrarse en personajes con alguna discapacidad, quienes serán los protagonistas. El objetivo es reflejar las dificultades y conflictos que estas personas enfrentan en la vida real y cómo, a través de valores, se pueden superar las barreras y desafíos diarios. Para asegurar que el contexto en el que se desenvuelven los personajes sea realista y auténtico, se solicitó que el escenario del cuento incluya lugares, ideas, costumbres o historias relacionadas con la nacionalidad de los personajes, específicamente de países de Latinoamérica y el Caribe.

2.2. Conexión con ChatGPT

La tercera fase implica la integración de la API de OpenAI en el sistema desarrollado. Esta API proporciona una amplia gama de servicios para el procesamiento del lenguaje natural, síntesis de habla, generación de texto y otras funcionalidades no relevantes para los propósitos del sistema propuesto.

Para acceder a los servicios de OpenAI, se requiere de una autenticación mediante una clave API proporcionada por la plataforma (ver bloque 5 de la Figura 1). Es importante tener en cuenta que el uso de esta API está sujeto a tarifas, dependiendo del volumen y tipo de solicitudes realizadas.

Para la generación de las historias se utilizó el modelo gpt-3.5-turbo (bloque 6 de la arquitectura mostrada en Figura 1), usando la siguiente configuración de parámetros:

Mensaje. Este parámetro acepta un arreglo de objetos mensaje, que pueden ser en el rol de sistema, usuario o asistente, y su contenido [24]. Para el sistema desarrollado, el mensaje tiene la estructura mostrada en la Figura 2.

Modelo. Se usó el modelo gpt-3.5-turbo-instruct.

Número de tokens. Este parámetro define el límite máximo de tokens que el generador puede producir en una sola solicitud. Para nuestro caso, se estableció el valor de 2048 tokens.

Temperatura. Este parámetro controla el nivel de variabilidad y originalidad en el texto generado por el modelo. Una temperatura más alta produce respuestas más diversas y creativas, pero también aumenta la probabilidad de obtener respuestas incoherentes o irrelevantes. Por lo tanto, se utilizó una temperatura de 0.5 para la aplicación.

El modelo devuelve el contenido generado en formato JSON. La respuesta obtenida es procesada por la aplicación, extrayendo los contenidos y mostrándolos en la interfaz de usuario (bloque 7 de la arquitectura). Lo que el niño visualiza es la historia generada en forma de texto, con las imágenes de los personajes que intervienen en el cuento.

Además de mostrar el cuento en forma texto, el sistema desarrollado permite la narración las historias generadas mediante el uso de voces sintéticas. Esta funcionalidad se implementó debido a que los usuarios para los que fue desarrollada la aplicación son niños en edad de aprender a leer. Para lograr esto, se usó también la API TTS (Text To Speech) de OpenAI (bloque 6A en Figura 1). Esta última permite elegir seis voces integradas (aleación, eco, fábula, ónice, nova y brillo), las cuales pueden utilizarse para realizar narraciones en varios idiomas, incluyendo el español [25].

2.3. Medición de similitud entre cuentos

Una de las principales características del sistema cuentacuentos es la capacidad de generar cuentos diferentes en cada ejecución. Para medir esta diversidad, se usó el índice de Jaccard.

El índice de Jaccard es una medida estadística utilizada para comparar la similitud y la diversidad entre dos conjuntos, se calcula como se muestra en la Ecuación (1).

(1)

Donde A y B son los conjuntos a comparar; los valores de este índice están entre 0 y 1, donde 0 indica ninguna similitud entre los conjuntos y 1 indica que los conjuntos comparados son idénticos.

En el estudio de la similitud entre cuentos, se implementó un preprocesamiento que incluye las siguientes etapas:

Transformación de texto. Todos los caracteres se convirtieron a minúsculas para garantizar la uniformidad en el análisis.

Limpieza de textos. Se eliminaron todos los signos de puntuación, nombres de personajes, nacionalidades, números y cualquier carácter no alfabético. Además, se eliminaron los espacios extra para mantener la coherencia del texto.

Lematización. Este proceso implica la conversión de una palabra a su forma base o lema. Esta transformación permite que palabras diferentes, pero con significados similares, sean consideradas como la misma entidad. En los cuentos generados, las distintas conjugaciones verbales se identifican como la misma palabra base; se empleó la biblioteca spaCy, utilizando el modelo preentrenado denominado es_core_news_md, diseñado específicamente para el idioma español. Se aplicó el proceso de lematización a todas las palabras del documento.

3. Resultados y discusión

Se realizó una prueba de funcionamiento del sistema para verificar la correcta generación de cuentos. Posteriormente, se midió la diversidad entre los contenidos generados, y se llevó a cabo un análisis de las voces utilizadas en la producción de los cuentos. La prueba del sistema de cuentacuentos se llevó a cabo en un navegador web, utilizando una computadora con sistema operativo Windows 10.

3.1. Pruebas de funcionamiento

La prueba de funcionamiento del sistema consistió en ingresar los parámetros elegidos por un usuario. Para propósitos demostrativos, se presentan los siguientes:

Se seleccionó un microcuento utilizando la interfaz mostrada en la Figura 3.

Figura 3 Interfaz de selección del tipo de cuento 

Se eligieron tres personajes para el cuento: Andrés, Fernanda y Omar, esto se muestra en la Figura 4.

Figura 4 Interfaz de selección de los personajes 

3. Por último, se optó por el tema de tolerancia, como se indica en la Figura 5.

Figura 5 Interfaz de selección del tema 

Una vez establecidos los parámetros, se generó el cuento mostrado en la Figura 6. Este proceso de generación del cuento tomó aproximadamente 4816 ms.

Figura 6 Ejemplo de cuento generado 

En la interfaz del sistema, el usuario puede reproducir el cuento seleccionando el botón de audio ubicado en la esquina superior derecha. Este audio, generado por el modelo TTS-1-HD y narrado con la voz de Aleación (Alloy), tiene una duración de 1:01 minutos, y su proceso de creación tomó un total de 10.79 segundos.

3.2. Diversidad de contenidos generados

Para medir la diversidad de contenidos en los cuentos generados, es decir, que tan diferentes son las historias que genera el sistema; se realizaron dos experimentos.

El primer experimento consistió en mantener invariables a los personajes, temas y tipos de cuentos, solicitando al sistema que genere historias con esos parámetros fijos. Aunque los cuentos generados mostraron similitudes, en ninguna de las treinta ejecuciones se observaron historias idénticas (repetidas). Los contenidos generados en esta prueba pueden ser consultados libremente en el repositorio público de github.

La Figura 7 muestra un resumen de las palabras frecuentemente utilizadas en los títulos de los treinta cuentos generados. Se observa que algunas palabras no fueron indicadas explícitamente en el prompt diseñado, pero siguen las instrucciones para crear historias interesantes.

Figura 7 Nube de palabras de los títulos 

Por otra parte, en los cuentos generados se usan palabras que promueven la tolerancia y la colaboración, como se observa en la nube de palabras de la Figura 8, generada a partir de los contenidos de los cuentos.

Figura 8 Nube de palabras de los contenidos de los cuentos 

Se calcularon todos los índices de Jaccard entre pares de cuentos, estos valores se representan gráficamente en la Figura 9. Se observa que las historias tienen poca similitud entre ellas, ya que el valor máximo del índice de Jaccard fue de 0.2137, alcanzado por los microcuentos 23 y 29 que se encuentran en el repositorio indicado anteriormente.

El segundo experimento consistió en generar historias eligiendo aleatoriamente los personajes, temas y tipos de cuentos. Después de generar más de treinta cuentos, se observó una gran variedad en las historias, todas ellas alineadas con las instrucciones del prompt diseñado. La Figura 10 muestra gráficamente todos los índices de Jaccard entre los cuentos. El promedio de los índices de Jaccard fue de 0.0359 con una desviación estándar de 0.0427. El valor máximo encontrado fue de 0.2.

Al revisar los cuentos generados, se notó que cada uno de ellos contiene un mensaje que fortalece valores y respeto hacia los personajes de la historia que tienen algún tipo de discapacidad.

Figura 9 Índices de Jaccard entre cuentos con personajes, tipo y tema fijos 

Figura 10 Índices de Jaccard entre cuentos con tipo, personajes y temas elegidos aleatoriamente 

3.3. Análisis de las voces en la reproducción de cuentos

Para comparar las diversas voces proporcionadas por OpenAI, resultó esencial analizar el tiempo de generación del cuento, el tono de voz, la variación de entonación, la velocidad del habla y la claridad de pronunciación. El objetivo principal fue seleccionar la voz más adecuada para garantizar una experiencia auditiva clara, natural y emocionalmente atractiva para el público infantil.

3.3.1. Tiempos de generación

Se solicitó al sistema la generación de treinta cuentos, en los cuales se eligieron aleatoriamente el tipo, los personajes y los temas para cada historia. En cada solicitud, se midió el tiempo en que ChatGPT tarda en generar el archivo de audio correspondiente. En total, se obtuvieron ocho archivos de audio para historias de tipo micro cuento, once para cuento flash y once para cuento corto. La Tabla 1 muestra un resumen de los tiempos de creación y duración por cada tipo de cuento.

Tabla 1 Comparación de tiempos de creación y duración de los cuentos  

Como era de esperarse, el promedio de los tiempos para la creación de los archivos de audio para la narración aumenta conforme la longitud del cuento crece. Sin embargo, se observa una diferencia menor entre los promedios de tiempo para generación de audio entre cuento flash y cuento corto en comparación con los micro cuentos. Además, se observa que la generación de archivos de audio para cuentos de tipo flash tienen una desviación estándar más alta que en los demás tipos de cuentos.

Se confirma que la duración del audio de la narración concuerda con el tipo de cuento. La duración de los cuentos cortos presenta una desviación estándar más grande que los demás tipos de cuentos.

3.3.2. Evaluación de tono de voz

El tono de voz en un audio, nos permite evaluar la experiencia auditiva del usuario final, ya que influye en la comprensión, empatía y persuasión de los cuentos. Al analizar estos tonos en los audios generados, se observó que tres (Alloy, Nova y Shimmer) de las seis voces presentan un tono amigable y agradable durante la lectura de los cuentos (ver Tabla 2).

Tabla 2 Comparación de tonos de voz en la reproducción de cuentos 

Además, se notó que la voz de Onyx, a pesar de ser una voz con tonalidad seria, está particularmente enfocada hacia la narración de cuentos o historias, ya que posee una formalidad que se adapta a este tipo de narrativa.

3.3.3. Variación de entonación

Evaluar la variación de entonación en los audios, puede incidir en el tono emocional y persuasivo de la narrativa; específicamente en estos cuentos, repercute en la transmisión efectiva de los valores y el mensaje que se busca inculcar en los infantes. La Tabla 3 muestra las variaciones de entonación para los tipos de voz de la TTS de OpenAI.

Una entonación adecuada puede captar la atención del oyente, generar emociones y facilitar la comprensión de los temas tratados. Analizando este aspecto en los audios, es evidente que aunque la mayoría de las voces exhiben una variación de entonación constante, destaca la voz de Onyx, por su notable variación de entonación. Esta voz realiza pausas adecuadas, lo que enriquece la narrativa del cuento. En contraste, las demás voces presentan pausas muy cortas; y en el caso de la voz Nova, realiza una entonación menos eficiente, lo que resulta una narración lineal y sin matrices. Este factor podría afectar el interés de los niños al escuchar el audio.

Tabla 3 Variación de entonación en la reproducción de cuentos 

3.3.4. Velocidad del habla

La velocidad del habla es un aspecto que influye directamente en la comprensión de un cuento y la experiencia auditiva del público infantil. En el análisis realizado (ver Tabla 4), se observó que la voz Nova resulta ineficiente debido a su ritmo variable, lo que dificulta la comprensión del cuento por parte del infante. En cuanto a las voces Fable y Echo mantienen una velocidad constante, pero su estilo de narración tiende a ser demasiado simple y no se ajusta adecuadamente al formato de un cuento. En contraste, la vox Onyx se destaca por su velocidad de habla, la cual está perfectamente adaptada para la narración de cuentos, proporcionando una experiencia auditiva más envolvente y atractiva.

Tabla 4 Comparación de la velocidad del habla en la reproducción de cuentos 

3.3.5. Calidad de pronunciación

De acuerdo con la documentación de OpenAI, el modelo TTS soporta voces en diversos idiomas, incluido el español. Tras analizar los treinta audios, se detectaron palabras mal pronunciadas en las narraciones. Como se detalla en la Tabla 5, la voz Nova mostró una ineficiencia notable en la pronunciación de las palabras, además de que cambió de idioma en algunas ocasiones; por lo que evidencia una falta de estabilidad para mantener el español como idioma predeterminado. Se observó que en todas las voces, en ocasiones, los nombres de los personajes no se pronunciaban correctamente. Por otro lado, la voz con una mejor pronunciación resultó ser Onyx, a pesar de que presentó dificultades al pronunciar los nombres de los personajes.

4. Conclusiones

La IAG está siendo usada actualmente como una herramienta valiosa para atender una plétora de problemáticas de diversos tipos. Entre estos desafíos, la discapacidad es una de las problemáticas más significativas en América Latina y el Caribe, afectando a más de 85 millones de personas en la región.

En este artículo, se propuso el diseño de un sistema de generación de cuentos (cuenta cuentos) para niños de habla hispana basado en IAG. El sistema permite la creación de cuentos personalizados en los que participan personajes infantiles con algún tipo de discapacidad.

La inclusión de personajes con discapacidad en las historias es un factor crucial que contribuye significativamente a promover la diversidad y la igualdad desde una edad temprana. Aprovechando la IAG sobre la que se basa el sistema, se generan cuentos únicos en cada solicitud, incluso con los mismos parámetros, lo que proporciona una experiencia variada y enriquecedora en cada uso.

Tabla 5 Comparación de la claridad de pronunciación en la reproducción de cuentos 

En las diferentes pruebas realizadas al sistema, se realizó una comparación cuantitativa de la diversidad de las historias generadas, aplicando para ello el criterio del índice de Jaccard. Los valores encontrados confirman la poca similitud entre los cuentos analizados.

Además, se evaluó la entonación, velocidad y calidad de pronunciación de las voces sintéticas, encontrándose que todavía existen áreas de oportunidad en la tecnología del estado del arte para la generación de audio en la narrativa de las historias.

A pesar de los desafíos presentes, como el consumo de recursos durante el servicio de conversión de texto a voz, la falta de naturalidad en la voz, los errores en la pronunciación y la latencia del sistema, se puede afirmar que la propuesta presentada es novedosa y podría ser útil para los educadores que buscan instalar herramientas de educación inclusiva en sus aulas.

Actualmente, se continúa trabajando en el desarrollo de otros sistemas que ayuden a cerrar las brechas y mejorar la accesibilidad y la calidad de vida para las personas con discapacidad.

En cuanto a las futuras líneas de investigación, se contempla la colaboración de expertos de diversas disciplinas, como la psicología y la educación. El objetivo de esta colaboración será evaluar tanto el contenido como los mensajes transmitidos en los cuentos generados. Además, se analizará si estos cuentos son adecuados y comprensibles para los niños de Latinoamérica.

Agradecimientos

Los autores agradecen a la Universidad Autónoma del Estado de México, por el apoyo recibido a través del proyecto 7018/2024CIB.

Referencias

1 [] J. R., Casar Corredera, “Inteligencia artificial generativa,” Anales de la Real academia de Doctores, vol. 8, no. 3, pp. 475-489, 2023. [Online]. Available: https://is.gd/3kMGMXLinks ]

2 [] J., Sanabria-Navarro, Y., Silveira-Pérez, D., Pérez Bravo, and M., de Jesús-Cortina-Núñez, “In cidences of artificial intelligence in contemporary education,” Comunicar, vol. 77, pp. 97-107, 2023. [Online]. Available: 10.3916/C77-2023-08 [ Links ]

3 [] S., Droubi, A., Galamba, F. L., Fernandes, A. A., de Mendonça, and R. J., Heffron, “Transforming education for the just transition,” Energy Research & Social Science, vol. 100, p. 103090, 2023. [Online]. Available: 10.1016/j.erss.2023.103090 [ Links ]

4 [] S., Iruri Quispillo, and C. A., Villafuerte Alvarez, “Importancia de la narración de cuentos en la educación,” Comuni@cción: Revista de Investigación en Comunicación y Desarrollo, vol. 13, no. 3, pp. 233-244, Sep. 2022. [Online]. Available: 10.33595/2226-1478.13.3.720 [ Links ]

5 [] M., Pozas, C. J. G., Trujillo, and V., LetzelAlt, “Mexican school students’ perceptions of inclusion: A brief report on students’ social inclusion, emotional well-being, and academic self-concept at school,” Frontiers in Education, vol. 8, 2023. [Online]. Available: 10.3389/feduc.2023.1069193 [ Links ]

6 [] B., Mundial, “Rompiendo barreras - inclusión de las personas con discapacidad en américa latina y el caribe.” [Online]. Available: https://is.gd/diWoksLinks ]

7 [] K., Ramirez. (2023) Cuentacuentos. GitHub, Inc. [Online]. Available: https://is.gd/yHfQvWLinks ]

8 [] T., Bratitsis, and P., Ziannas, “From early childhood to special education: Interactive digital storytelling as a coaching approach for fostering social empathy,” Procedia Computer Science, vol. 67, pp. 231-240, 2015, proceedings of the 6th International Conference on Software Development and Technologies for Enhancing Accessibility and Fighting Info-exclusion. [Online]. Available: 10.1016/j.procs.2015.09.267 [ Links ]

9 [] P., Juppi, “Engagement and empowerment. digital storytelling as a participatory media practice,” Nordicom Review, vol. 39, 12 2017. [Online]. Available: https://is.gd/Wo91BcLinks ]

10 [] T., Tseng, Y., Murai, N., Freed, D., Gelosi, T. D., Ta, and Y., Kawahara, “Plushpal: Storytelling with interactive plush toys and machine learning,” in Proceedings of the 20th Annual ACM Interaction Design and Children Conference, ser. IDC ’21. New York, NY, USA: Association for Computing Machinery, 2021, pp. 236-245. [Online]. Available: 10.1145/3459990.3460694 [ Links ]

11 [] J., Haase, and P. H., Hanel, “Artificial muses: Generative artificial intelligence chatbots have risen to human-level creativity,” Journal of Creativity, vol. 33, no. 3, p. 100066, 2023. [Online]. Available: 10.1016/j.yjoc.2023.100066 [ Links ]

12 [] R., Li, “A “dance of storytelling”: Dissonances between substance and style in collaborative storytelling with ai,” Computers and Composition, vol. 71, p. 102825, 2024. [Online]. Available: 10.1016/j.compcom.2024.102825 [ Links ]

13 [] S., Habib, T., Vogel, X., Anli, and E., Thorne, “How does generative artificial intelligence impact student creativity?” Journal of Creativity , vol. 34, no. 1, p. 100072, 2024. [Online]. Available: 10.1016/j.yjoc.2023.100072 [ Links ]

14 [] S., Kalantari, E., Rubegni, L., Benton, and A., Vasalou, ““when i’m writing a story, i am really good” exploring the use of digital storytelling technology at home,” International Journal of Child-Computer Interaction, vol. 38, p. 100613, 2023. [Online]. Available: 10.1016/j.ijcci.2023.100613 [ Links ]

15 [] J., Su, and W., Yang, “Artificial intelligence in early childhood education: A scoping review,” Computers and Education: Artificial Intelligence, vol. 3, p. 100049, 2022. [Online]. Available: 10.1016/j.caeai.2022.100049 [ Links ]

16 [] S. Z., Salas-Pilco, K., Xiao, and J., Oshima, “Artificial intelligence and new technologies in inclusive education for minority students: A systematic review,” Sustainability, vol. 14, no. 20, 2022. [Online]. Available: 10.3390/su142013572 [ Links ]

17 [] H., Yu, “The application and challenges of chatgpt in educational transformation: New demands for teachers’ roles,” Heliyon, vol. 10, no. 2, January 2024. [Online]. Available: 10.1016/j.heliyon.2024.e24289 [ Links ]

18 [] L., Sijing, and W., Lan, “Artificial intelligence education ethical problems and solutions,” in 2018 13th International Conference on Computer Science & Education (ICCSE), 2018, pp. 1-5. [Online]. Available: 10.1109/ICCSE.2018.8468773 [ Links ]

19 [] E., Valverde, and P., Hernández, TypeScript, 2023. [Online]. Available: https://is.gd/WICHuRLinks ]

20 [] J., Collell, and A., Ferry, CSS3 y Javascript avanzado. Universitat Oberta de Catalunya, 2023. [Online]. Available: https://is.gd/JrhbAiLinks ]

21 [] A., Nazir, and Z., Wang, “A comprehensive survey of chatgpt: Advancements, applications, prospects, and challenges,” Meta-Radiology, vol. 1, no. 2, p. 100022, 2023. [Online]. Available: 10.1016/j.metrad.2023.100022 [ Links ]

22 [] M., Vicente-Yagüe-Jara, O., López-Martínez, V., Navarro-Navarro, and F., Cuéllar-Santiago, “Writing, creativity, and artificial intelligence. chatgpt in the university context,” Comunicar , vol. 77, pp. 47-57, 2023. [Online]. Available: 10.3916/C77-2023-04 [ Links ]

23 [] J. J., López. ¿cuántas palabra tiene un cuento o relato corto? [Online]. Available: https://n9.cl/rdykx Links ]

24 [] OpenAI. (2023) Text generation models. OpenAI Platform. [Online]. Available: https://is.gd/fkWCFZLinks ]

25 [] OpenAI (2023) Text to speech. OpenAI Platform. [Online]. Available: https://is.gd/XskwW5Links ]

Forma sugerida de citación

1Ramírez Vergara, K. M.; López-Chau, A. y Rojas Hernández, R. “Cuentacuentos basado en IA generativa para promover la inclusión de personas con discapacidades,” Ingenius, Revista de Ciencia y Tecnología, N.◦32, pp. 101-113, 2024. doi: https://doi.org/10.17163/ings.n32.2024.10

Recibido: 27 de Marzo de 2024; Revisado: 05 de Junio de 2024; Aprobado: 18 de Junio de 2024

Autor para correspondencia:kramirezv003@alumno.uaemex.mx.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons