SciELO - Scientific Electronic Library Online

 
vol.9 número1Estrategia para responder a incidentes de inseguridad informática ambientado en la legalidad ecuatorianaPosicionamiento en espacios interiores con Android, Bluetooth y RSSI índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Enfoque UTE

versión On-line ISSN 1390-6542versión impresa ISSN 1390-9363

Enfoque UTE vol.9 no.1 Quito ene./mar. 2018

http://dx.doi.org/10.29019/enfoqueute.v9n1.226 

Informática, TIC, ...

Un sistema experto basado en minería de datos y programación entera lineal para soporte en la asignación de materias y diseño de horarios en educación superior

An expert system based on data mining and linear integer programming to support the timetabling design and courses assignment in higher education

Daniel Calle-López1 

Javier Cornejo-Reyes1 

Fernando Pesántez-Avilés1 

Mónica Rodas-Tobar2 

César Vásquez-Vásquez1 

Vladimir Robles-Bykbaev1 

1 GI-IATa, Cátedra UNESCO Tecnologías de apoyo para la Incl. Educativa, Universidad Politécnica Salesiana, Cuenca - Ecuador dcallel@ups.edu.ec, jcornejor@ups.edu.ec, fpesantez@ups.edu.ec, cvasquez@ups.edu.ec, vrobles@ups.edu.ec.

2 Escuela de Psicología Organizacional, Universidad del Azuay, Cuenca - Ecuador mrodast@uazuay.edu.ec.

Resumen:

En general, varias de las organizaciones tienden a manejar la asignación de cargas horarias de sus empleados de manera tradicional (imposición de una jornada de trabajo de 8). Todo esto a fin de mantener cierto control sobre variables como asistencia y ausentismo del personal e incluso en algunos casos considerando aquello como sinónimo de eficacia laboral. Sin embargo, la nueva tendencia organizacional ha roto ciertos paradigmas con orientación mecanicista, pretendiendo crear un nuevo horizonte hacia la construcción de organizaciones orgánicas y dinámicas. Por lo expuesto, en este artículo se describe una propuesta de sistema experto basado en programación entera lineal y minería de datos para abordar el problema de asignación de materias y el diseño de horarios (considerado un problema NP-completo). Los resultados preliminares son alentadores, ya que han permitido realizar la asignación de materias en una base de 133.000 registros de docentes y generar horarios con un mínimo de coste computacional.

Palabras clave: programación entera lineal; minería de datos; diseño de horarios; asignación de materias; educación superior.

Abstract:

Commonly, the most of organizations tend to manage the timetables of their employees according to traditional guidelines (imposing an 8-hour work day). The primary objective of this approach is controlling some variables such as the attendance and absenteeism of the employees, and even, in some cases considering this situation as work efficiency. However, the new organizational tendencies have broken specific paradigms based on mechanistic orientation, trying to create a new horizon towards the construction of organic and dynamic organizations. For these reasons, in this paper, we present an expert system based on integer linear programming and data mining with the aim of addressing the problem of assigning courses to teachers and timetabling (considered an NP-complete problem). The preliminary results are encouraging, given that the system was able to assign courses on a database consisting off 133.000 registers of teachers, and at the same time, generate timetables with minimal computational costs.

Keywords: integer linear programming; data mining; timetabling design; courses assignment; higher education.

1. Introducción

Las universidades en particular, al ser su esencia la generación de conocimiento, se encuentran empeñadas en desarrollar estrategias en el ámbito de la gestión de lo académico, para asegurar, primero, la satisfacción laboral de sus cuerpos docentes y luego los resultados y logros académicos de sus alumnados. Se enfrentan al reto de armonizar la gestión horaria y lectiva además de las responsabilidades complementarias según el tipo de dedicación docente (CES, 2010); las características biográficas (edad, género, estado civil, maternidad, paternidad, lugar de vivienda) son también variables necesarias a la hora de definir los horarios de la docencia; por citar, en el caso de los profesores investigadores no es necesario asignar un horario establecido, al contrario, estos profesionales deben trabajar por resultados y avances de sus programas o proyectos de investigación.

Entre los aspectos más apreciativos por parte del profesorado universitario cuando les corresponde autovalorar su satisfacción tiene que ver con los horarios y la carga lectiva a ellos asignada para el ejercicio de sus tareas docentes. Considerando que las instituciones educativas como organización no manejan iguales lógicas que las empresas, sus directrices no pueden ser rígidas en cuanto al tema de gestión horaria, esto en función de diversas restricciones que se acumulan alrededor del propio ejercicio docente en relación incluso con factores biosociales del educador y del educando. La flexibilidad requerida en la gestión horaria docente ha de considerar que es común, en la actualidad, manejar públicos heterogéneos donde la presencia de estudiantes adultos y la de estudiantes jóvenes a tiempo parcial es habitual, la irrupción de sistemas y modalidades como la distancia, de convergencia de medios o en línea (online) ya no es novedad, al igual que la presencia de otros agentes formativos como profesionales y empresarios a los que se les favorece con gestiones horarios menos exigentes (Zabalza y Berraza, 2003).

La gestión horaria no solamente ha de verse desde la lógica de beneficio del enseñante, debe entenderse que esta afecta directamente al tema de rendimiento académico del estudiante, y es considerado un factor de orden institucional, al cual se le puede controlar, modificar en pro de los rendimientos (Garbanzo Vargas, 2007). Además, según el tipo de contrato y dedicación docente, sea este de medio tiempo, parcial, completo o de dedicación exclusiva, las tareas docentes interactúan a nivel de funciones universitarias, para unos la tarea es eminentemente formativa, mientras que para otros se mezcla con funciones de investigación, gestión y vinculación con la sociedad.

El sistema de recomendación horaria para el trabajo docente, al igual que otros sistemas inteligentes para la gestión del conocimiento (Sánchez, Comas y García, 2016), además de ubicar lo mejor posible a un docente en un horario específico de clase según sus variables biográficas y de orden institucional, permite la identificación de espacios de tiempo para otras acciones como la conformación de claustros docentes que interactúan alrededor de procesos de innovación educativa. En el Ecuador el Consejo de Educación Superior citando a Larrea (2016) y refiriéndose a las condiciones y factores de pertinencia de calidad en la educación superior, destaca el rol estratégico del talento humano para alcanzar la pertinencia en el contexto de calidad, e indica que los docentes han de “asumir sus nuevas funciones como profesores-investigadores, tutores del proceso de aprendizaje, creadores de ambientes de aprendizaje, fortalecimiento de sus ambientes de aprendizaje” (Larrera, 2016); por lo que la gestión efectiva de horarios del personal docente debe no solo ser igual de efectiva a nivel individual sino grupalmente y colectivamente acertada.

El problema de asignación de horarios en las universidades, como se ha mencionado, es de características multivalente y a consideración de Caballero y Arboleda (2012), radica en:

programar en un horizonte de planificación (generalmente una semana) las asignaturas que se dictan en un período académico determinado (año, trimestre o semestre), para las distintas asignaturas que las requieren, considerando los profesores necesarios en cada asignatura, los grupos de alumnos que toman un conjunto de asignaturas, los días o períodos disponibles, los salones requeridos de tal manera que pueda optimizar un conjunto de restricciones relacionadas con la organización del sistema de educación” (Caballero y Arboleda, 2012).

Por lo expuesto, en este artículo se presenta una propuesta para el desarrollo de un sistema experto que se fundamenta en minería de datos y programación entera lineal para realizar dos complejas tareas de la gestión universitaria: la asignación de cursos (materias o asignaturas) a docentes (considerando la pertinencia y perfil de los docentes) y la generación automática de horarios. Finalmente, es importante destacar que esta investigación constituye una versión extendida y ampliada del trabajo presentado en el Conferencia Internacional de Sistemas de Información y Ciencias de la Computación - INCISCOS (International Conference on Information Systems and Computer Science) (Pesántez et al., 2017).

2. Metodología

El sistema presenta un modelo organizado en tres capas y módulos que responden a la necesidad de asignación inteligente de distributivos y horarios. Esta estructura nos permite realizar cambios en los módulos sin afectar al funcionamiento de las demás capas. A continuación se describe la funcionalidad de dichas capas (Figura 1):

Fig. 1: Arquitectura general del sistema propuesto para la generación automática de horarios y la asignación de cursos a docentes 

2.1. Principales capas del sistema

A continuación se describirán las capas del sistema con su respectiva funcionalidad.

Interfaz de usuario: contiene módulos que permiten la interacción de las autoridades encargadas de la asignación de horarios y distributivos con las diferentes funcionalidades del sistema. Permite la interacción y control efectivo del recomendador al tiempo que este retroalimenta al usuario con la información procesada en la capa de soporte a la toma de decisiones.

La aplicación móvil pretende brindar consultas rápidas, como alternativa a la interfaz web. Su naturaleza de aplicación móvil permite la implementación de funcionalidades extras, tales como notificaciones, sincronización e integración con aplicaciones nativas del dispositivo. Asimismo, la interfaz web presenta las recomendaciones de manera clara y entendible, con varias opciones de búsqueda avanzada.

Soporte para la toma de decisiones: los módulos de esta capa se encargan de procesar la información que proviene de la capa de servicios.

Análisis de perfiles: este módulo asocia la clasificación de asignaturas y de docentes según lo especifica UNESCO en la Clasificación internacional normalizada de la educación (UNESCO, 2010). Aquí se comparan las clasificaciones tanto del perfil profesional y personal del docente con los de la asignatura definida dentro del currículo de la institución educativa.

Análisis de asignaturas: este componente se conforma de dos subprocesos, el análisis de rendimiento docente para asignaturas y el subproceso de análisis de históricos docente-asignatura que evalúan el desempeño que ha tenido un docente D con una asignatura A durante toda su experiencia como docente.

Generación de horarios: este componente está desarrollado con Algebra Lineal y Programación Entera Lineal para la resolución efectiva y generación de horarios de clases. Se toman las restricciones y el sistema penaliza a aquellos horarios que al momento de ser evaluados mediante la función objetivo no cumplen con los requerimientos con valores extremadamente negativos, de modo que al momento de minimizar, el modelo por sí solo se encargará de filtrar aquellos horarios que se han sabido adaptar de mejor manera a las restricciones impuestas.

Análisis de restricciones: en este módulo se aplican validaciones que permiten verificar la estructura y sintaxis de las restricciones introducidas por los directores de carrera, de tal manera que puedan ser correctamente interpretadas por el módulo de generación de horarios.

Capa de servicios: abstrae la implementación interna referente a las consultas en los repositorios de datos institucionales para los módulos de soporte a la toma de decisiones y centraliza el acceso a datos y funciones. Esto permite que las capas superiores sean agnósticas a la estructura interna de la institución y esta pueda cambiar libremente de versiones siempre y cuando los servicios mantengan la misma estructura.

Esquema de implementación del sistema: el enfoque descrito en la Figura 2 ayuda a los desarrolladores en varios aspectos de desarrollo, la integración y entrega continua permiten al desarrollador ejecutar pruebas automatizadas sobre las diferentes versiones, esto ayuda a evitar problemas típicos de integración al combinar los cambios sobre la rama principal.

Fig. 2: Esquema de implementación de la propuesta desarrollada 

La ventaja de tener pruebas automatizadas para todas las versiones que se compilen del sistema nos da la certeza que los cambios que se hayan realizado se puedan efectuar rápida y de manera sostenible. En otras palabras, además de tener una automatización del proceso de compilación y pruebas se puede liberar el sistema de manera automática e implementar cualquier versión con un esfuerzo mínimo.

2.2. Determinación de pares docente-asignatura:

Los pares docente-asignatura representan una relación de pertinencia en base a la suma ponderada de tres componentes: histórico docente, evaluación estudiantil y relación de perfil docente-asignatura. El valor de pertinencia se calcula mediante la ecuación (1):

(1)

Dónde:

es la nota máxima de la evaluación docente

representa el número de período lectivo a evaluar

resultado de la evaluación de un docente con una materia para un período lectivo

constante que indica el número de períodos hacia atrás que serán tomados en cuenta para el cálculo de pertinencia

representa la cantidad de docentes o asignaturas seleccionados para la consulta actual

es un factor de normalización que se aplica cuando se recomienda los docentes que pueden dictar cierta asignatura o viceversa

es un vector de títulos de tercer nivel o superiores correspondientes a un docente

indica que la clasificación de los títulos del docente coinciden con el dominio de las asignaturas, de acuerdo con la clasificación CINE (UNESCO, 2010)

indica que la clasificación de los títulos del docente coinciden con el subárea de las asignaturas, de acuerdo con la clasificación CINE (UNESCO, 2010)

indica que la clasificación de los títulos del docente coinciden con el área de las asignaturas, de acuerdo con la clasificación CINE (UNESCO, 2010)

p1,p2,p3 son pesos que permiten ponderar el nivel de importancia de cada componente. La sumatoria de pesos debe ser igual a 1.

El componente de evaluación estudiantil se compone de una suma ponderada de las evaluaciones para todo par docente-asignatura de la consulta multiplicada por un factor de penalización. Los valores se calcularán siempre desde el ciclo actual hasta N períodos lectivos hacia atrás, este factor se puede apreciar en la Figura 3:

Fig. 3: Factor de penalización 

Dicha penalización pretende dar más relevancia en el cálculo de pertinencia a las asignaturas más recientes que haya dictado un docente D. Como muestra en la Figura 4, las calificaciones más antiguas pierden relevancia, no pueden ser superiores al factor de penalización.

Fig. 4: Ejemplo de pérdida de relevancia para un caso de evaluación docente 

2.3. Generación de horarios

Se realizó la implementación de un algoritmo matemático mediante Álgebra Lineal y Programación Entera Lineal para la asignación automática mediante restricciones. Para este estudio se realizaron sendas entrevistas con el personal de la Universidad Politécnica Salesiana para poder llevar a cabo un análisis de los criterios que son tomados en cuenta al momento de diagramar un horario de clases.

Para nuestro estudio han sido consideradas las siguientes restricciones.

Un período no puede repetirse en un mismo día para una materia, de esta manera no se asignan varias materias de un mismo ciclo a un mismo periodo de clases.

Un docente no puede dar la misma materia en un mismo día.

Evitar cruces de varias materias que dé un docente en un mismo período de clases.

Garantizar que una materia no exceda el número de créditos en una semana de clases.

El modelo propuesto a utilizar es el modelo de Programación Lineal Entera. A continuación se presentará cada uno de los elementos matemáticos que conforman la propuesta.

2.3.1. Función objetivo

En virtud que se pretende maximizar los espacios utilizados por los docentes, emplearemos la función objetivo que se describe en la ecuación (2):

(2)

Dónde:

X(pqrst) Variable de decisión binaria, indica que el docente fue ubicado en un día de la semana, en un período de clases en una materia perteneciente a un ciclo.

D(pqs) es un parámetro de penalización, pues contiene la disponibilidad de un docente () en un período () en un día (). Por lo que en caso de asignar un docente en un período que no le corresponda, se obtendrá un valor de penalidad muy negativo para que la función objetivo que tiene por objeto el maximizar, pueda saber que no debe volver a asignar en un espacio equivocado. Si por el contrario la asignación es exitosa entonces el valor obtenido será 1 (ver Tabla 1).

Tabla 1 Ejemplo de la distribución de horas disponibles para dar clases de un docente. Estos datos se utilizan para el parámetro de penalización  

Ponderación obtenida de la API de Perfiles de Docentes (ver Tabla 2).

Tabla 2 Ejemplo de ponderaciones . Este factor relaciona al docente con la materia. 

Docente Ponderación Materia
Docente 1 0.9 Materia 1
Docente 1 0.1 Materia 2

2.3.2. Restricciones fuertes

Esta restricción evita que un período se repita en un mismo día para una materia, de tal manera que no se asignen varias materias de un mismo ciclo a un mismo período de clases.

Evita que un docente de la misma materia más de una vez en el mismo día.

Evita cruces de varias materias que de un docente en un mismo período de clases.

Garantiza que una materia no exceda el número de créditos en una semana de clases.

3. Resultados

La evaluación de los resultados se compone de dos etapas. Evaluamos primero la calidad de los pares docente-asignatura recomendados a base del análisis de históricos y desempeño docente y las consideraciones de similitud entre el perfil docente y las asignaturas de interés; a partir de dichos resultados se generaron varias distribuciones de horarios para los docentes y asignaturas seleccionados como mejores candidatos.

Las bases de datos utilizadas para esta propuesta tienen las siguientes consideraciones:

Se emplearon 3 mil registros correspondientes a evaluaciones estudiantiles e históricos académicos.

Se tomaron 133 mil registros acerca del perfil docente relacionado con la clasificación de las áreas de conocimiento correspondientes a su formación.

La referencia de ciclos lectivos analizados hacia atrás (constante N) ha sido definida para 10 ciclos.

En la Figura 5 observamos resultados que arroja una consulta de los mejores pares docente-asignatura filtrados por asignatura para “Control de calidad”, el valor de pertinencia se presenta escalado de 0 a 5. Además, el sistema permite generar una representación visual de los datos de la consulta para poder brindar un enfoque más claro del porqué se asigna dicho valor de pertinencia en comparación con los demás docentes.

Fig. 5: Ejemplo de resultados y reportes que genera el sistema en la generación de pares docente-asignatura. 

A fin de evaluar las recomendaciones que ha sugerido el sistema, se realizó una valoración con 5 expertos del ámbito académico. Para ello se empleó una encuesta mediante la escala de Likert (Echauri, Minami y Sandoval, 2014) y se consideraron los siguientes criterios: pertinencia de la recomendación, coherencia y el rendimiento general del sistema. En la Tabla 3 se pueden apreciar las evaluaciones iniciales que obtuvo el sistema en los criterios, y como se observa, esta valoración inicial es muy positiva.

Tabla 3 Resultados preliminares de la evaluación del sistema con los directivos universitarios. 

Pertinencia Coherencia Rendimiento
4 3 5
5 4 4
3 4 4
5 5 5
4 4 3
Promedio 4,2 4 4,2

Asimismo, a fin de probar el algoritmo encargado de la generación de horarios, se implementó un script en Python, utilizando la librería PuLP (Mitchell, OSullivan, y Dunning, 2011) y el Solver GLPK (Makhorin, 2008). Con ello, se realizó un estudio piloto que empleó como corpus la información del primer ciclo y una materia de segundo ciclo de la carrera de Ingeniería en Computación. De esta manera se pudo verificar que el algoritmo matemático está correctamente planteado, pues tanto los docentes como las materias y los horarios evitaron cruces que vayan en contra de las restricciones. El resultado que genera el sistema se puede apreciar en la Figura 6.

Fig. 6: Ejemplo de un horario generado de forma automática para el primer semestre de la carrera de Ingeniería en Computación 

A continuación se describe un ejemplo del proceso de cálculo que se realiza mediante la programación entera lineal durante la generación de los horarios. A fin de maximizar la función objetivo, se la presenta a continuación como la suma del producto de los elementos de la matriz por los elementos de penalización de horarios de los docentes:

…………………….

La función objetivo está sujeta a restricciones que permiten el ajuste del modelo matemático a las condiciones requeridas. En total se generaron 183 restricciones, las cuales vienen dadas por la combinación de los elementos binarios que conforman la matriz entera lineal sometida a las restricciones establecidas del modelo.

Cada una de las restricciones se presenta como se indica seguidamente:

4. Discusión

La generación de horarios es un tema con múltiples soluciones, la optimización en la construcción de horarios trata de encontrar las mejores distribuciones de asignaciones docentes, las aproximaciones relacionadas por lo general pretenden optimizar conjuntos de reglas para encontrar la mejor solución posible; entre estas soluciones podemos encontrar técnicas basadas en satisfacibilidad proposicional, reglas basadas en currículos institucionales, para optimizar asignaciones de cursos que comparten varios estudiantes, algoritmos genéticos, entre otras.

La propuesta presentada tiene un enfoque que, a más de encontrar soluciones a conjuntos de reglas, pretende que los docentes que se asignan tengan la mejor experiencia y formación profesional sobre la asignatura entre los docentes disponibles, a medida de lo posible. De esta manera se evidencia no solo la optimización de reglas sino el aumento del desempeño y calidad de docencia, aumentando el rendimiento académico general del estudiantado.

5. Conclusiones y recomendaciones

En este artículo se ha presentado una propuesta inicial de un sistema experto para la asignación de materias a docentes y la generación de horarios en el ámbito universitario. Como se ha podido apreciar, la propuesta inicial permite realizar la asignación de forma óptima a pesar que se cuente con grandes cantidades de registros tanto de asignaturas como de docentes.

Los métodos matemáticos empleados son bastante eficientes, ya que el consumo de recursos es mínimo (si tomamos en cuenta que las restricciones deben estar correctamente planteadas). De igual forma, las técnicas de minería de datos pueden ser remplazadas o enriquecidas con algoritmos de aprendizaje de máquina (redes neuronales y de creencia profunda, árboles de decisión, etc.).

A pesar de lo expuesto, consideramos oportuno señalar que el presente trabajo presenta algunas limitaciones tanto para la asignación de materias como para la generación de horarios. Principalmente, es fundamental considerar aspectos relacionados con la logística de los espacios físicos de estudio, así como de los materiales requeridos en determinadas asignaturas (física, redes inalámbricas, etc).

Como líneas de trabajo futuro se plantean las siguientes:

Desarrolla de un módulo de análisis de restricciones basado en algoritmos genéticos, a fin de analizar las ventajas y desventajas de esta técnica en la generación de horarios.

Desarrollar un módulo que permita extraer información de la producción científica de los docentes, a fin de incluir un eje más que permita enriquecer el perfil docente desde el punto de vista de la investigación.

Bibliografía

CES. (2010). Ley Orgánica de Educación Superior, República del Ecuador. Consejo de Educación Superior [ Links ]

Echauri, A. M. F., Minami, H., & Sandoval, M. J. I. (2014). “La Escala de Likert en la evaluación docente: acercamiento a sus características y principios metodológicos”. Perspectivas Docentes, (50). [ Links ]

Garbanzo Vargas, G. M. (2007). “Factores asociados al rendimiento académico en estudiantes universitarios, una reflexión desde la calidad de la educación superior pública”. Educación, 31 (1). [ Links ]

Larrea, E., y Granados, V. (2016). “El sistema de educación superior para la sociedad del buen vivir basada en el conocimiento”. Guayaquil: Universidad Católica de Santiago de Guayaquil. [ Links ]

Makhorin, A. (2008). GLPK (GNU linear programming kit). http://www. gnu. org/software/glpk/. [ Links ]

Mitchell, S., OSullivan, M., & Dunning, I. (2011). “PuLP: a linear programming toolkit for python”. The University of Auckland, Auckland, New Zealand. [ Links ]

Pesántez-Avilés, F., Calle-López, D., Robles-Bykbaev, V., Rodas-Tobar, M., y Vásquez-Vásquez, C. (2017). “A recommender system based on data mining techniques to support the automatic assignment of courses to teachers in higher education”. En Inciscos 2017: Proceedings of the 2nd international conference on information systems and computer science. [ Links ]

Sánchez Fleitas, N., Comas Rodríguez, R., García Lorenzo, M., y Riverol Quesada, A. (2016). “Modelo de manejo de datos, con el uso de inteligencia artificial, para un sistema de información geográfica en el sector energético”. Enfoque UTE, 7 (3). [ Links ]

UNESCO. (2013). “Clasificación Internacional Normalizada de la Educación -CINE”. [ Links ]

Zabalza, M. Á., y Beraza, M. Á. Z. (2003). Competencias docentes del profesorado universitario: calidad y desarrollo profesional (Vol. 4). Narcea Ediciones. [ Links ]

Recibido: 23 de Noviembre de 2017; Aprobado: 30 de Marzo de 2018

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons