SciELO - Scientific Electronic Library Online

 
 número29Control por ganancias programadas aplicado a un convertidor DC-DC para la regulación de la intensidad luminosa de una lámpara LEDRendimiento para la interoperabilidad entre Raspberry pi, ESP8266 y PLC con Node-RED para el IIoT índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Ingenius. Revista de Ciencia y Tecnología

versión On-line ISSN 1390-860Xversión impresa ISSN 1390-650X

Ingenius  no.29 Cuenca ene./jun. 2023

https://doi.org/10.17163/ings.n29.2023.07 

Articles

Predicción de arritmias e infartos agudos de miocardio usando aprendizaje automático

Improvement of the lactose grinding process for a company manufacturing dairy products

1Universidad de Guayaquil, Ecuador

2Universidad de Guayaquil, Ecuador

3University of Villanova, Pensilvania, Estados Unidos

4Universidad de Guayaquil, Ecuador

5Universidad de Guayaquil, Ecuador


Resumen

Las enfermedades cardiovasculares, como el infarto agudo de miocardio, son una de las tres principales causas de muerte en el mundo según datos de la OMS. De forma similar, las arritmias cardíacas¸ como la fibrilación auricular, son enfermedades muy comunes en la actualidad. El electrocardiograma (ECG) es el medio de diagnóstico cardíaco que se utiliza de forma estandarizada en todo el mundo. Los modelos de aprendizaje automático son muy útiles en problemas de clasificación y predicción. Aplicadas al campo de la salud, las redes neuronales artificiales (ANN) y las redes neuronales convolucionales (CNN) en conjunto con modelos basados en árboles como XGBoost, son de vital ayuda en la prevención y control de enfermedades del corazón. El presente estudio tiene como objetivo comparar y evaluar el aprendizaje basado en los algoritmos ANN, CNN y XGBoost mediante el uso de las bases de datos de ECG Physionet MITBIH y PTB, que proporcionan ECG clasificados con arritmias e infartos agudos de miocardio, respectivamente. Se comparan por separado los tiempos de aprendizaje y el porcentaje de exactitud de los tres algoritmos en las dos bases de datos, y finalmente se cruzan los datos para comparar la validez y seguridad de la predicción.

Palabras clave arritmias; infarto agudo miocardio; aprendizaje automático; red neuronal artificial; red neuronal convolucional; impulso del gradiente extremo

Abstract

Cardiovascular diseases such as Acute Myocardial Infarction are one of the 3 leading causes of death worldwide, according to WHO data. Similarly, cardiac arrhythmias, such as atrial fibrillation, are very common diseases at present. The electrocardiogram (ECG) is the means of cardiac diagnosis that is used in a standardized way worldwide. Machine learning models are very helpful in classification and prediction problems. Applied to the field of health, artificial neural networks (ANN) and convolutional neural networks (CNN) together with tree-based models such as XGBoost, are of vital help in the prevention and control of heart diseases. The objective of the present study is to compare and evaluate the learning based on the ANN, CNN and XGBoost algorithms using the Physionet MIT-BIH and PTB ECG databases, which provide ECGs classified with Arrhythmias and Acute Myocardial Infarctions, respectively. The learning times and the percentage of Accuracy of the 3 algorithms on the 2 databases are compared separately, and finally the data are crossed to compare the validity and safety of the prediction.

Keywords arrhythmias; acute myocardial infarction; machine learning; artificial neural network; convolutional neural network; extreme gradient boosting

Forma sugerida de citación:

Patiño, D.; Medina, J.; Silva, R.; Guijarro, A. y Rodríguez, J. “Predicción de arritmias e infartos agudos de miocardio usando aprendizaje automático,” Ingenius, Revista de Ciencia y Tecnología, N.◦ 29, pp. 79-89, 2023. DOI: https://doi.org/10.17163/ings.n29.2023.07

1. Introducción

Hoy en día se utiliza una multiplicidad de dispositivos (computadoras personales, teléfonos inteligentes, tabletas, teléfonos celulares, etc.) para acumular y procesar big data acerca del comportamiento humano. Esta base está disponible para una variedad de propósitos, incluyendo medicina [1, 2]. La salud móvil (mHealth, Mobile Health en inglés) y los dispositivos inteligentes permiten la detección temprana y la intervención inmediata en pacientes con fibrilación auricular (AF, Atrial Fibrillation en inglés). El ECG de una derivación y de múltiples derivaciones, la fotopletismografía (PPG, Photoplethysmography en inglés) y la medición oscilométrica con capacidades de diagnóstico validadas, pueden integrarse dentro de la práctica clínica para detectar AF. Las directrices existentes de práctica clínica sugieren que la evaluación del pulso con el examen ECG para la población de alto riesgo y para pacientes mayores a 65 años de edad, es apropiada para reducir las complicaciones. Sin embargo, los dispositivos de salud e inteligentes destinados al consumidor, fáciles de usar y económicos pueden ser una herramienta alternativa de examen no solo para la población mayor con comorbilidades, sino también para la población general de bajo riesgo con monitoreo frecuente [2,3,4,5,6,7].

Los dispositivos mHealth capaces de monitorear la frecuencia cardíaca y/o el ritmo cardíaco vienen en múltiples formas tales como apps para teléfonos inteligentes, relojes inteligentes, anillos, collares, sensores portátiles y parches [8,9,10]. Las compañías han creado productos capaces de generar un punto de cuidado a través de registros ECG, tales como la serie de dispositivos AliveCor Kardia Monitor [8]. En un estudio realizado en Hong Kong con un gran número de personas, la investigación sobre el dispositivo Kardia para ECG de una derivación encontró que un cardiólogo confirmó que 65 % de las AF detectadas por el dispositivo fueron precisas. En este estudio en más de diez mil pacientes con una edad promedio de 78 años, el número requerido para hacer nuevos diagnósticos de AF con precisión fue 145 participantes [8]. La sensibilidad y especificidad del monitor Kardia fueron 99.6 % y 97.8 %, respectivamente [11].

El término ‘salud ubicua’ (u-Health, Ubiquitous Health, en inglés), definido por Weiser como la integración de la computación en acciones y comportamientos humanos “en cualquier momento” y “en cualquier lugar” ha venido adquiriendo importancia [1, 2]. El principal atributo de u-Health es la capacidad de interacción entre individuos y dispositivos, de forma tal que la tecnología es transparente para el usuario [12]. No está claro cuál es el mejor algoritmo para detectar enfermedades cardiovasculares por medio de los dispositivos u-Health. Se requiere que la tecnología sea robusta, confiable y de bajo costo computacional, para que pueda ser ejecutada en los dispositivos, aun cuando están desconectados. El objetivo de este artículo es evaluar la mejor alternativa para la detección de arritmias con dispositivos u-Health.

Este trabajo es producto de una colaboración en curso entre la Universidad de Guayaquil y la Universidad de Villanova, bajo la cual se están desarrollando múltiples estrategias de inteligencia artificial para la detección de arritmias en tiempo real. El presente trabajo utiliza bases de datos existentes de arritmias para validar las estrategias, y el trabajo futuro intenta procesar data de dispositivos portátiles en tiempo real. Los resultados de esta investigación son altamente prometedores, y serán discutidos con mayor profundidad a lo largo del artículo.

2. Materiales y métodos

2.1. Metodología

Se utilizaron dos bases de datos Physionet de electrocardiogramas ECG, MIT (arritmias) con 109444 registros (21891 normales y 87553 anormales) y PTDB (infartos) con 14 550 registros (4045 normales y 10505 anormales). La base de datos MIT tiene cuatro categorías: Normal ‘N’ 0, Supraventricular ‘S’ 1, Ventricular ‘V’ 2, Fibrilación Ventricular ‘F’ 3, Otras no clasificadas ‘Q’ 4. La base de datos PTDB tiene 2 categorías: ‘N’ 0 y con problemas cardíacos ‘A’ 1. Se utilizó SMOTE para regularizar las categorías y evitar sobreajuste y subajuste.

El 80 % de los registros se utilizan para entrenamiento y el 20 % para prueba; el 20 % del 80 % del conjunto de entrenamiento se toma nuevamente para evaluar la predicción de los datos. Este proceso fue realizado por separado para las bases de datos MIT y PTDB, utilizando redes neuronales artificiales (ANN, artificial neural networks en inglés) y redes neuronales convolucionales (CNN, convolutional neural networks en inglés), además del algoritmo de decisión basado en árbol XGBoost o impulso del gradiente extremo; los tres algoritmos fueron evaluados con las dos bases de datos.

2.2. Enfermedades cardiovasculares e inteligencia artificial

Las enfermedades cardiovasculares (CVD, Cardiovascular Diseases en inglés) son la principal causa de mortalidad a nivel mundial, representando el 31 % de todas las muertes [13]. Una de las causas principales es el infarto agudo al miocardio (AMI, acute myocardial infarctation, en inglés). Existe una necesidad creciente de estudiar una amplia gama de técnicas de vanguardia para el análisis y diagnóstico de enfermedades cardíacas. Con el fin de evaluar la situación específica del paciente, los doctores frecuentemente analizan las señales del ECG (electrocardiógrafo) para obtener suficiente información que les ayude a hacer el diagnóstico. Muchos investigadores han aplicado algoritmos de aprendizaje automático (ML, Machine Learning, en inglés) para estudiar el problema de clasificación de arritmias [14]. Los avances en procesamiento de datos, capacidad de almacenamiento y métodos de aprendizaje automático han venido transformando el campo de la medicina, incluyendo la cardiología [15].

La AF es uno de los tipos más comunes de arritmia, que se caracteriza por un latido rápido e irregular [13]. La enfermedad cardíaca isquémica (IHD, Ischemic heart disease, en inglés) es una condición en la cual existe un suministro inadecuado de sangre y oxígeno a una parte del músculo cardíaco [16]. Esta condición ocurre usualmente cuando hay un desbalance entre el suministro de oxígeno y la demanda del músculo cardíaco (miocardio), debido típicamente a enfermedad cardíaca ateroesclerótica [17]. Usualmente los pacientes no muestran los signos y síntomas típicos (asintomático), hasta que la enfermedad cardíaca isquémica se manifiesta como angina, infarto al miocardio o muerte cardíaca repentina [18].

En el análisis de ECG, la clasificación de los latidos del corazón es la manera más común de automatizar el diagnóstico de la arritmia [19]. El flujo común de aprendizaje de ECG usando técnicas de aprendizaje automático incluye análisis señal-ruido, reconocimiento de los latidos del corazón, extracción de características y clasificación de los latidos del corazón. Para aprendizaje profundo, la extracción de características puede reemplazarse por el almacenamiento de fragmentos de latidos de una secuencia de ECG completa [20]. Los algoritmos reportados en la literatura para la identificación de señales de ECG incorporan tres puntos importantes: preprocesamiento, clasificación y desbalance del conjunto de datos. Para analizar las características que pueden estar directamente relacionadas a factores fisiológicos en el desarrollo de enfermedades, se consideraron tres algoritmos de aprendizaje profundo: redes neuronales convolucionales (CNN), redes neuronales artificiales (ANN) y el árbol reforzado de impulso de gradiente extremo o XGBoost.

Las redes neuronales artificiales son algoritmos de aprendizaje que pueden identificar relaciones complejas en los datos. Las ANN están diseñadas para imitar el sistema nervioso humano. Las ANN típicas están compuestas por tres tipos de capas: entrada, salida y ocultas. Cada capa está constituida por neuronas [21]. Las redes neuronales convolucionales (CNN), las redes neuronales recurrentes (RNN, recurrent neural networks en inglés) y el Naive Bayes se utilizan como clasificadores. Existen enfoques que combinas diferentes técnicas tales como Transformada Wavelet Discreta (DWT, Discrete Wavelet Transform, en inglés) y ANN para la clasificación de arritmias en ECG [22]. Cuando el número de características es mayor que el número de muestras, las ANN pueden manejar múltiples clases, no hay efecto de los grandes conjuntos sobre las ANN y no se requiere una memoria extensiva [23].

Un estudio basado en ANN clasifica IHD utilizando parámetros de variabilidad de la frecuencia cardíaca (HRV, heart rate variability en inglés) junto con una data clínica tal como la fracción de eyección del ventrículo izquierdo (LVEF, left ventricular ejection fraction en inglés), edad y género. Se probaron una serie de redes con diferente número de nodos de entrada (varía entre 7 y 15), nodos ocultos (entre 2 y 10) y dos nodos de salida. Los rangos de entrenamiento y prueba fueron 75 % y 25 %, respectivamente, del total de datos de entrenamiento [24]. Varios investigadores también han utilizado enfoques basados en redes neuronales artificiales para la clasificación diagnóstica de señales de ECG [16].

Las técnicas modernas de redes neuronales profundas (DNN, Deep Neural Networks en inglés) se utilizan para resolver el problema de selección y extracción manual de características en sistemas automáticos convencionales para el diagnóstico de imágenes de Infarto al Miocardio (MI, Myocardial Infartaction en inglés) [25]. El algoritmo de retropropagación se utiliza para entrenar redes neuronales profundas [26]. Las CNN se utilizan principalmente para analizar imágenes. El infarto al miocardio se predice utilizando imágenes características tomadas antes y después del ataque, como imágenes de entrada a una CNN [27]. Las capas comúnmente utilizadas en CNN son la convolucional (Conv), unidad lineal rectificada (ReLU, rectified linear unit, en inglés), pooling, normalización en lotes y capas totalmente conectadas [28]. Una matriz de entrada se alimenta a un modelo de detección constituido por CNN y una red de memoria larga de corto-plazo bidireccional (bi-LSTM, Long short-term memory network en inglés) con validación cruzada estratificada de cinco etapas [29].

Las DNN han mostrado ser exitosas en diferentes áreas, incluyendo imágenes, audio y texto [30]. En aplicaciones reales, el tipo de dato más común son los datos tabulados, que contienen muestras (filas) con el mismo conjunto de características (columnas). Los datos tabulados se utilizan en muchas áreas como medicina, finanzas, manufactura, ciencia climática y muchas otras [31].

Los métodos tradicionales de aprendizaje automático, tales como los árboles de decisión accionados por gradiente (GBDT, gradient-boosted decision trees en inglés) [32], dominan el modelado de datos tabulados y muestran un mejor desempeño que el aprendizaje profundo. A pesar de sus ventajas teóricas [33,34,35], las DNN plantean muchos retos cuando se aplican a datos tabulados, tales como falta de localidad, escasez de datos (valores faltantes), mezcla de diferentes tipos de características (numéricas, ordinales y categóricas) y falta de conocimiento previo acerca de la estructura del conjunto de datos (a diferencia del texto o las imágenes). La combinación de algoritmos de árboles, tal como el XGBoost, se consideran la opción recomendada para problemas reales involucren datos tabulados [32], [36].

Los XGBoost han sido utilizados para clasificar fibrilación auricular [37]. Un estudio propone un clasificador de señales de ECG basado en XGBoost y un conjunto de técnicas de descomposición empírica en modos (EEMD, ensemble empirical mode decomposition en inglés) que aprovecha funciones basadas en tiempo, frecuencia y características morfológicas [38].

Otro estudio propone crear un conjunto de características morfológicas en cinco dimensiones que incluyen complejos QRS e intervalos RR, así como también coeficientes de características wavelet, para construir el vector de características para una clasificación altamente eficiente de los latidos del corazón [21]. Las medidas de desempeño son entrenadas para encontrar características que sean clasificadas correctamente; entonces, la relación de aquellas que no son bien clasificadas se utiliza para encontrar la eficiencia del clasificador. Se puede obtener una proporción alta, aún si todas las clases importantes se clasifican de forma incorrecta. Para superar esto, la data debe estar adecuadamente balanceada [39]. La técnica de sobremuestreo de minorías sintéticas (SMOTE, Synthetic Minority Oversampling Technique, en inglés) puede superar algunas desventajas en la clasificación [40]. Este método ha mostrado ser mejor que otras mezclas de submuestreo y sobremuestreo.

Un estudio realizado en 2021 comparó el desempeño de un XGBoost y una DNN utilizando el optimizador Adamax y una función de pérdida de entropía cruzada con cuatro capas ocultas. Los resultados mostraron que el XGBoost tuvo un mejor desempeño que la DNN, ya que alcanzó una precisión de aprendizaje de 100 % y una precisión de predicción de 95.60 % y 93.08 % para las mismas fases [41]. El desempeño global de aprendizaje del modelo DNN fue 89.42 % y 81.23 %, mientras que su precisión en la predicción fue 80.50 % y 77.36 %, respectivamente, para las mismas variables [41]. El objetivo del presente estudio fue comparar los algoritmos para determinar la solución más económica para la detección de arritmias en tiempo real.

Los monitores de ECG de una sola derivación se utilizan frecuentemente debido a su naturaleza altamente productiva, corto tiempo de ejecución y bajo costo [42]. Sin embargo, los ECG de una derivación no pueden capturar toda la información debido a la gran diversidad de características de las CVD que pueden causar diagnósticos equivocados [43].

2.3. Inteligencia artificial

El objetivo de este trabajo es seleccionar un algoritmo para la clasificación de alteraciones cardíacas que pueda ser ejecutado en tiempo real, es decir, mientras se adquiere la señal electrocardiográfica. Considerando que los algoritmos evaluados se basan en la identificación y clasificación de un solo ciclo cardíaco, lo ideal sería tener un algoritmo capaz de capturar y clasificar las señales durante el período entre ondas, mejor conocido como segmento o intervalo T-P, como se muestra en la Figura 1.

Para ejecutar el algoritmo en tiempo real, el tiempo de ejecución debe ser menor que el intervalo T-P, es decir, menor a 200 ms. Se analizó la dispersión de los archivos de las bases de datos Physionet que están disponibles para investigación sobre electrocardiogramas (ECG). Dicha base de datos fue desarrollada por el Hospital Beth Israel en Boston (ahora el Beth Israel Deaconess Medical Center), juntamente con el Instituto de Tecnología de Massachussetts (MIT-BIH) [44] y el Physikalisch - Technische Bundesanstalt, the National Metrology Institute of Germany (PTB). La base de datos MIT-BIH tiene 109444 ECG y la base de datos PTB tiene 14550 ECG [45].

Figura 1.  Dos Ciclos Cardíacos Independientes A y B dentro de su ventana de detección correspondiente con el intervalo T-P identificado 

La MIT-BIH es una base de datos de arritmias, que tiene una clasificación etiquetada como ‘N’: 0, ‘S’: 1, ‘V’: 2, ‘F’: 3, ‘Q’: 4, donde 0 es NORMAL y de 1 a 4 son arritmias clasificadas como bradiarritmias y taquiarritmias, subclasificadas como taquiarritmias supraventriculares y ventriculares. En la base de datos PTB, la clasificación es 0 para NORMAL y 1 para ANORMAL, donde se consideran enfermedad cardíaca severa, tal como infarto al miocardio (principalmente), insuficiencia cardíaca y hemibloqueos. Los archivos csv disponibles en Kaggle tienen 187 columnas que representan la bioseñal del ECG y 188 columnas adicionales que clasifican el ECG. Este campo está disponible en ambas bases de datos y permite la aplicación de aprendizaje automático.

Se consideraron tres algoritmos: redes neuronales convolucionales (CNNs), redes neuronales artificiales (ANNs) y el árbol reforzado de impulso de gradiente extremo o XGBoost. Los trabajos publicados por Premanand S, disponibles en Analytics Vidhya, se tomaron como referencia para las redes neuronales.

Para evitar los problemas de subajuste y sobreajuste en aprendizaje automático, se aplicó la función SMOTE a ambas bases de datos por separado. Esto crea nuevos ECG sobre la base de la data original y balancea las categorías.

Se hizo una división por 80-20-20 a ambas bases de datos, obteniendo 289878-72470-90587 y 13446-3362- 4202 en datos de ECG para entrenamiento, prueba y validación en las bases de datos MIT y PTB, respectivamente. Las Figuras 2 y 3 incluyen gráficos de muestras de ECG de ambas bases de datos en las diferentes categorías normal y anormal.

Figura 2.  Señales clasificadas de la MIT- BIH 

Se entrenó utilizando los algoritmos ANN, CNN y XGBoost para las bases de datos MIT y PTB por separado, para hacer una comparación en términos de tiempos de entrenamiento y niveles de precisión en la predicción, es decir, exactitud, precisión y recall, generando las matrices de confusión correspondientes.

Los resultados del entrenamiento fueron inicialmente validados usando la data de validación y prueba de ambas bases de datos, MIT y PTB, por separado. Posteriormente, se valida el nivel de predicción cruzando datos de ambas bases de datos. Una arquitectura CNN propone seleccionar un grupo óptimo de capas individuales y el tamaño de los filtros. Se seleccionaron los siguientes valores: dos capas densas, tamaño de capa 128, número de capas convoluciones 2D y MaxPooling 2D [12 N] [46].

Figura 3.  Señales clasificadas de la PTB 

3. Resultados y discusión

Se procedió a entrenar con ANN, CNN y XGBoost sobre las bases de datos MIT y PTB por separado, para establecer comparaciones en términos de tiempos de entrenamiento y niveles de precisión en la predicción: exactitud, precisión y recall. Las matrices de confusión correspondientes se presentan en las Figuras 4 y 5.

Figura 4.  Resultados de clasificación sobre la PTB 

Figura 5.  Resultados de clasificación sobre la MIT-BIH 

Las Figuras 6 y 7 presentan Exactitud vs. Pérdida para cada uno de los algoritmos, sobre las bases de datos PTB y MIT.

Figura 6.  Exactitud vs. Pérdida para cada uno de los algoritmos sobre el conjunto de datos PTB 

Figura 7. Exactitud vs. Pérdida para cada uno de los algoritmos sobre el conjunto de datos MIT 

La Figura 8 presenta los tiempos FIT y la exactitud obtenidos para cada una de las bases de datos.

Figura 8.  Tiempos FIT y exactitud para los conjuntos de datos PTB y MIT 

Luego de evaluar los resultados del entrenamiento por separado, se hizo una validación cruzada del nivel de predicción de los algoritmos intercambiando datos de ambas bases de datos, como se muestra en la Figura 9. Para propósitos de validación, la base de datos PTB fue categorizada como 0 = normal y 1 = anormal, y procesada por los modelos aprendizaje basados en XGBoost y ANN.

Figura 9. Data de la PTB en validación cruzada con la data de la MIT usando ANN y XGBoost 

La fase de entrenamiento se completó a través de definiciones por ensayo y error; los hiperparámetros fueron configurados de acuerdo con la Tabla 1, para alcanzar el nivel de esperado de exactitud.

Se validó la predicción de los modelos de aprendizaje automático entrenados con los ECG de la base de datos MIT-BIH, sobre los ECG de la base de datos PTB, obteniendo niveles de exactitud de 85 % y 86 % para los ECG normales. Con respecto a la validación sobre las anormalidades, el XGBoost tuvo una exactitud de 11 % y la ANN tuvo 15 %. Esto se debe a que las bases de datos incluyen diferentes enfermedades cardíacas: arritmias en la MIT-BIH e infartos agudos al miocardio en la PTB.

Tabla 1.  Hiperparámetros 

Esto demuestra que las señales normales pueden ser reconocidas de manera cruzada entre bases de datos, pero la data correspondiente a ECG anormales no es interoperable entre una base de datos y otra.

Finalmente, a través de aprendizaje supervisado, los dos modelos de redes neuronales artificiales y el algoritmo XGBoost para predicción por clasificación fueron comparados utilizando una matriz de pesos, considerando criterios tales como exactitud en la predicción, sensibilidad de la data médica (falso positivo/- falso negativo), tiempo de aprendizaje y tiempo de predicción, tal como se muestra en la Tabla 2.

Tabla 2.  Data de la PTB en validación cruzada con la data de la MIT usando ANN y XGBoost 

Como se definió previamente, el objetivo de este trabajo es seleccionar un algoritmo para la clasificación de alteraciones cardíacas que pueda ser ejecutado en tiempo real, es decir, mientras se están adquiriendo la señal electrocardiográfica. Dados los resultados de la Tabla 2, puede hacerse una comparación para determinar cuál es el mejor algoritmo para una solución u-Health (Figura 10).

Para la fase de aprendizaje de los modelos se utilizaron los 123 994 registros, y a partir de los valores pronosticados se determinó el modelo que alcanza la más alta exactitud de predicción. Considerando que la inteligencia artificial ha logrado aprender cómo clasificar apropiadamente condiciones asociadas a las patologías cardíacas, se seleccionó el modelo más adecuado y aplicable para el diagnóstico de gente o grupos poblacionales. En temas de prevención, la predicción del riesgo para la población en general es de vital importancia ya que puede reducir el impacto de las muertes debido a patologías cardíacas, así como también reducir los costos asociados a estos casos.

Figura 10.  Comparación entre los tres algoritmos 

4. Conclusiones

A partir de la discusión, se usó una matriz de pesos para comparar la calidad de los tres algoritmos de predicción. Sobre la base de esos resultados, se concluye que las redes neuronales convolucionales (CNN) son mucho más precisas que los otros algoritmos (99 %); sin embargo, el tiempo de entrenamiento es largo (en términos de horas), comparado con el tiempo de entrenamiento del XGBoost que toma minutos. Dado que se está tratando con la salud humana, la precisión y exactitud en la predicción son más importantes que la rapidez de entrenamiento. En un punto intermedio está la red neuronal artificial (ANN), que alcanza un desempeño muy aceptable con una exactitud de 97 %.

Dada la naturaleza tabular de los datos, el XGBoost es la mejor alternativa, como se observa en la Figura 10.

La conclusión previa indica que es posible obtener información acerca de una arritmia dentro del intervalo RR. Dado que el objetivo del proyecto era procesar datos en tiempo real, los resultados son altamente prometedores. Como trabajo futuro, se pretende usar data de ECG generada por relojes inteligentes como parte de una investigación doctoral. La detección de arritmias a partir de relojes inteligentes sería una herramienta importante para la detección temprana de eventos potencialmente mortales, tales como fibrilación. Sin embargo, es necesario reducir los falsos positivos, y dado que se podría procesar la data en tiempo real, la distribución de probabilidad conjunta puede ser usada en trabajos futuros para aumentar la naturaleza predictiva del algoritmo. En resumen, esta es una contribución significativa en el campo de detección de arritmias en tiempo real.

Referencias

[1] K.-Y. Chin, K.-F. Lee, and Y.-L. Chen, “Using an interactive ubiquitous learning system to enhance authentic learning experiences in a cultural heritage course,” Interactive Learning Environments, vol. 26, no. 4, pp. 444–459, 2018. [Online]. Available: https://doi.org/10.1080/10494820.2017.1341939Links ]

[2] F. P. Mota, F. P. d eTôledo, V. Kwecko, S. Devincenzi, P. Núñez, and S. S. da C. Botelho, “Ubiquitous learning: Asystematic review,” in 2019 IEEE Frontiers in Education Conference (FIE), 2019, pp. 1–9. [Online]. Available: https://doi.org/10.1109/FIE43999.2019.9028361Links ]

[3] Y. Guo and G. Y. H. Lip, “Beyond atrial fibrillation detection: how digital tools impact the care of patients with atrial fibrillation,” European Journal of Internal Medicine, vol. 93, pp. 117–118, 2021. [Online]. Available: https://doi.org/10.1016/j.ejim.2021.08.026Links ]

[4] Y. Guo, H. Wang, H. Zhang, T. Liu, Z. Liang, Y. Xia, L. Yan, Y. Xing, H. Shi, S. Li, Y. Liu, F. Liu, M. Feng, Y. Chen, G. Y. H. Lip, and M.A.F.A. II Investigators, “Mobile photoplethysmographic technology to detect atrial fibrillation,” Journal of the American College of Cardiology, vol. 74, no. 19, pp. 2365–2375, Sep. 2019. [Online]. Available: https://doi.org/10.1016/j.jacc.2019.08.019Links ]

[5] M. V. Perez, K. W. Mahaffey, H. Hedlin, J. S. Rumsfeld, A. Garcia, T. Ferris, V. Balasubramanian, A. M. Russo, A. Rajmane, L. Cheung, G. Hung, J. Lee, P. Kowey, N. Talati, D. Nag, S. E. Gummidipundi, A. Beatty, M. T. Hills, S. Desai, C. B. Granger, M. Desai, and M. P. Turakhia, “Large-scale assessment of a smartwatch to identify atrial fibrillation,” New England Journal of Medicine, vol. 381, no. 20, pp. 1909– 1917, 2019, pMID: 31722151. [Online]. Available: https://doi.org/10.1056/NEJMoa1901183Links ]

[6] G. Boriani, R. B. Schnabel, J. S. Healey, R. D. Lopes, N. Verbiest-van Gurp, T. Lobban, J. A. Camm, and B. Freedman, “Consumer-led screening for atrial fibrillation using consumer-facing wearables, devices and apps: A survey of health care professionals by af-screen international collaboration,” European Journal of Internal Medicine, vol. 82, pp. 97–104, 2020. [Online]. Available: https://doi.org/10.1016/j.ejim.2020.09.005Links ]

[7] G. H. Mairesse and H. Heidbüchel, “Consumer-led screening for atrial fibrillation: What is the next step?” European Journal of Internal Medicine, vol. 90, pp. 16–18, 2021. [Online]. Available: https://doi.org/10.1016/j.ejim.2021.05.030Links ]

[8] J. R. Baman, D. T. Mathew, M. Jiang, and. Passman, R, “Mobile health for arrhythmia diagnosis and management,” Journal of General Internal Medicine, no. 37, pp. 188–197, 2022. [Online]. Available: https://doi.org/10.1007/s11606-021-07007-wLinks ]

[9] B. Freedman, J. Camm, H. Calkins, J. S. Healey, M. Rosenqvist, J. Wang, C. M. Albert, C. S. Anderson, S. Antoniou, E. J. Benjamin, G. Boriani, J. Brachmann, A. Brandes, T.-F. Chao, D. Conen, J. Engdahl, L. Fauchier, D. A. Fitzmaurice, L. Friberg, B. J. Gersh, D. J. Gladstone, T. V. Glotzer, K. Gwynne, G. J. Hankey, J. Harbison, G. S. Hillis, M. T. Hills, H. Kamel, P. Kirchhof, P. R. Kowey, D. Krieger, V. W. Y. Lee, L.-A. Levin, G. Y. H. Lip, T. Lobban, N. Lowres, G. H. Mairesse, C. Martinez, L. Neubeck, J. Orchard, J. P. Piccini, K. Poppe, T. S. Potpara, H. Puererfellner, M. Rienstra, R. K. Sandhu, R. B. Schnabel, C.-W. Siu, S. Steinhubl, J. H. Svendsen, E. Svennberg, S. Themistoclakis, R. G. Tieleman, M. P. Turakhia, A. Tveit, S. B. Uittenbogaart, I. C. V. Gelder, A. Verma, R. Wachter, B. P. Yan, A. A. Awwad, F. Al-Kalili, T. Berge, G. Breithardt, G. Bury, W. Caorsi, N. Chan, S. Chen, I. Christophersen, S. Connolly, H. Crijns, S. Davis, U. Dixen, R. Doughty, X. Du, M. Ezekowitz, M. Fay, V. Frykman, M. Geanta, H. Gray, N. Grubb, A. Guerra, J. Halcox, R. Hatala, H. Heidbuchel, R. Jackson, L. Johnson, S. Kaab, K. Keane, Y. Kim, G. Kollios, M. Lochen, C. Ma, J. Mant, M. Martinek, I. Marzona, K. Matsumoto, D. McManus, P. Moran, N. Naik, T. Ngarmukos, D. Prabhakaran, D. Reidpath, A. Ribeiro, A. Rudd, I. Savalieva, R. Schilling, M. Sinner, S. Stewart, N. Suwanwela, N. Takahashi, E. Topol, S. Ushiyama, N. V. van Gurp, N. Walker, and T. Wijeratne, “Screening for atrial fibrillation,”Circulation, vol. 135, no. 19, pp. 1851–1867, 2017. [Online]. Available: https://doi. org/10.1161/CIRCULATIONAHA.116.026693 [ Links ]

[10] M. V. McConnell, M. P. Turakhia, R. A. Harrington, A. C. King, and E. A. Ashley, “Mobile health advances in physical activity, fitness, and atrial fibrillation: Moving hearts,” Journal of the American College of Cardiology, vol. 71, no. 23, pp. 2691–2701, 2018. [Online]. Available: https://doi.org/10.1016/j.jacc.2018.04.030Links ]

[11] N. Brasier, C. J. Raichle, M. Dörr, A. Becke, V. Nohturfft, S. Weber, F. Bulacher, L. Salomon, T. Noah, R. Birkemeyer, and J. Eckstein, “Detection of atrial fibrillation with a smartphone camera: first prospective, international, two-centre, clinical validation study (DETECT AF PRO),” EP Europace, vol. 21, no. 1, pp. 41–47, 2018. [Online]. Available: https://doi.org/10.1093/europace/euy176Links ]

[12] M. Weiser, “The computer for the 21st century,” ScientificAmericanUbicompPaperafterSciAmediting, vol. 265, no. 3, pp. 94–104, 2011. [Online]. Available: https://bit.ly/3uYsmiULinks ]

[13] X. Ye, Y. Huang, and Q. Lu, “Explainable prediction of cardiac arrhythmia using machine learning,” in 2021 14th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI), 2021, pp. 1–5. [Online]. Available: https://doi.org/10. 1109/CISP-BMEI53629.2021.9624213 [ Links ]

[14] K. Mc Namara, H. Alzubaidi, and J. K. Jackson, “Cardiovascular disease as a leading cause of death: how are pharmacists getting involved?” Integrated pharmacy research & practice, vol. 8, pp. 1–11, Feb. 2019. [Online]. Available: https://doi.org/10.2147/iprp.s133088Links ]

[15] J. Bao, “Multi-features based arrhythmia diagnosis algorithm using xgboost,” in 2020 International Conference on Computing and Data Science (CDS), 2020, pp. 454–457. [Online]. Available: https://doi.org/10.1109/CDS49703.2020.00095Links ]

[16] G. Silveri, M. Merlo, L. Restivo, B. De Paola, A. Miladinović, M. Ajčević, G. Sinagra, and A. Accardo, “Identification of ischemic heart disease by using machine learning technique based on parameters measuring heart rate variability,” in 2020 28th European Signal Processing Conference (EUSIPCO), 2021, pp. 1309–1312. [Online]. Available: https: //doi.org/10.23919/Eusipco47968.2020.9287800 [ Links ]

[17] X. Wu, Y. Zheng, C.-H. Chu, and Z. He, “Extracting deep features from short ecg signals for early atrial fibrillation detection,” Artificial Intelligence in Medicine, vol. 109, p. 101896, 2020. [Online]. Available: https://doi.org/10.1016/j.artmed.2020.101896Links ]

[18] D. Kasper, A. Fauci, S. Hauser, D. Longo, J. Jameson, and J. Loscalzo, Harrison’s principles of internal medicine, 19th ed. Mc Graw Hill, 2014. [Online]. Available: https://bit.ly/3hqHin8Links ]

[19] I. Goldenberg, R. Goldkorn, N. Shlomo, M. Einhorn, J. Levitan, R. Kuperstein, R. Klempfner, and B. Johnson, “Heart rate variability for risk assessment of myocardial ischemia in patients without known coronary artery disease: The HRV-DETECT (heart rate variability for the detection of myocardial ischemia) study,” Journal of the American Heart Association, vol. 8, no. 24, p. e014540, Dec. 2019. [Online]. Available: https://doi.org/10.1161/jaha.119.014540Links ]

[20] E. J. da S. Luz, W. R. Schwartz, G. Cámara-Chávez, and D. Menotti, “Ecg-based heartbeat classification for arrhythmia detection: A survey,” Computer Methods and Programs in Biomedicine, vol. 127, pp. 144–164, 2016. [Online]. Available: https://doi.org/10.1016/j.cmpb.2015.12.008Links ]

[21] H. Zhu, Y. Zhao, Y. Pan, H. Xie, F. Wu, and R. Huan, “Robust heartbeat classification for wearable Single-Lead ECG via extreme gradient boosting,” Sensors (Basel), vol. 21, no. 16, Aug. 2021. [Online]. Available: https://doi.org/10.3390/s21165290Links ]

[22] S. Bhalerao, I. A. Ansari, and A. Kumar, “Reversible ecg data hiding: Analysis and comparison of ann, regression svm and random forest regression,” in 2020 International Conference on Communication and Signal Processing (ICCSP), 2020, pp. 0667–0671. [Online]. Available: https: //doi.org/10.1109/ICCSP48568.2020.9182219 [ Links ]

[23] M. Manjula and A. Sarma, “Comparison of empirical mode decomposition and wavelet based classification of power quality events,” Energy Procedia, vol. 14, pp. 1156–1162, 2012. [Online]. Available: https://doi.org/10.1016/j.egypro.2011.12.1069Links ]

[24] S. Murawwat, H. M. Asif, S. Ijaz, M. Imran Malik, and K. Raahemifar, “Denoising and classification of arrhythmia using memd and ann,” Alexandria Engineering Journal, vol. 61, no. 4, pp. 2807–2823, 2022. [Online]. Available: https://doi.org/10.1016/j.aej.2021.08.014Links ]

[25] M. Chandra Gaddam and S. Pattnaik, “An ann ensemble based ecg signal classification approach for accurate arrhythmia detection,” International Journal of Emerging Technology and Advanced Engineering, vol. 10, pp. 57–61, 2020. [Online]. Available: http://dx.doi.org/10.46338/IJETAE0820_08Links ]

[26] Y. LeCun, Y. Bengio, and G. Hinton, “Deep learning,” Nature, vol. 521, no. 7553, pp. 436–444, 2015. [Online]. Available: https://doi.org/10.1038/nature14539Links ]

[27] T. Kanai, N. Tanabe, Y. Miyagi, and J. Aoyama, “Cnn-type myocardial infarction prediction based on cardiac cycle determination,” in 2021 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS), 2021, pp. 1–2. [Online]. Available: https: //doi.org/10.1109/ISPACS51563.2021.9651000 [ Links ]

[28] A. Escontrela. (2020) Convolutional neural networks from the ground up. [Online]. Available: https://bit.ly/2EXtsnfLinks ]

[29] M. Dey, N. Omar, and M. A. Ullah, “Temporal feature-based classification into myocardial infarction and other cvds merging cnn and bi-lstm from ecg signal,” IEEE Sensors Journal, vol. 21, no. 19, pp. 21 688–21 695, 2021. [Online]. Available: https://doi.org/10.1109/JSEN.2021.3079241Links ]

[30] J. Devlin, M. Chang, K. Lee, and K. Toutanova, “BERT: pre-training of deep bidirectional transformers for language understanding,” NAACL, vol. abs/1810.04805, 2018. [Online]. Available: https://doi.org/10.48550/arXiv.1810.04805Links ]

[31] R. Shwartz-Ziv and A. Armon, “Tabular data: Deep learning is not all you need,” CoRR, vol. abs/2106.03253, 2021. [Online]. Available: https://doi.org/10.48550/arXiv.2106.03253Links ]

[32] T. Chen and C. Guestrin, “Xgboost: A scalable tree boosting system,” KDD ’16: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, vol. abs/1603.02754, 2016. [Online]. Available: https://doi.org/10.1145/2939672.2939785Links ]

[33] R. Shwartz-Ziv, A. Painsky, and N. Tishby, “Representation compression and generalization in deep neural networks,” in ICLR 2019 Conference Blind Submission, 2018. [Online]. Available: https://bit.ly/3YjzJz0Links ]

[34] T. Poggio, A. Banburski, and Q. Liao, “Theoretical issues in deep networks,” Proceedings of the National Academy of Sciences, vol. 117, no. 48, pp. 30 039–30 045, 2020. [Online]. Available: https://www.pnas.org/doi/abs/ 10.1073/pnas.1907369117 [ Links ]

[35] Z. Piran, R. Shwartz-Ziv, and N. Tishby, “The dual information bottleneck,” CoRR, vol. abs/2006.04641, 2020. [Online]. Available: https://doi.org/10.48550/arXiv.2006.04641Links ]

[36] A. V. Dorogush, A. Gulin, G. Gusev, N. Kazeev, L. O. Prokhorenkova, and A. Vorobev, “Fighting biases with dynamic boosting,” CoRR, vol. abs/1706.09516, 2017. [Online]. Available: https://doi.org/10.48550/arXiv.1706.09516Links ]

[37] H. Shi, H. Wang, Y. Huang, L. Zhao, C. Qin, and C. Liu, “A hierarchical method based on weighted extreme gradient boosting in ecg heartbeat classification,” Computer Methods and Programs in Biomedicine, vol. 171, pp. 1–10, 2019. [Online]. Available: https://doi.org/10.1016/j.cmpb.2019.02.005Links ]

[38] Z. Yue and Z. Jinjing, “Atrial fibrillation detection based on eemd and xgboost,” Journal of Physics: Conference Series, vol. 1229, no. 1, p. 012074, 2019. [Online]. Available: https: //dx.doi.org/10.1088/1742-6596/1229/1/012074 [ Links ]

[39] B. R. Manju and A. R. Nair, “Classification of cardiac arrhythmia of 12 lead ecg using combination of smoteenn, xgboost and machine learning algorithms,” in 2019 9th International Symposium on Embedded Computing and System Design (ISED), 2019, pp. 1–7. [Online]. Available: https: //doi.org/10.1109/ISED48680.2019.9096244 [ Links ]

[40] N. V. Chawla, K. W. Bowyer, L. O.Hall, and W. P. Kegelmeyer, “Smote: synthetic minority oversampling technique,” Journal of Artificial Intelligence Research, vol. 16, pp. 321–357, 2002. [Online]. Available: https://doi.org/10.1613/jair.95Links ]

[41] F. Giannakas, C. Troussas, A. Krouska, C. Sgouropoulou, and I. Voyiatzis, “Xgboost and deep neural network comparison: The case of teams’ performance,” in Intelligent Tutoring Systems, A. I. Cristea and C. Troussas, Eds. Springer International Publishing, 2021, pp. 343–349. [Online]. Available: https://doi.org/10.1007/978-3-030-80421-3_37Links ]

[42] P. D. Arini and E. R. Valverde, “Beat-to-beat electrocardiographic analysis of ventricular repolarization variability in patients after myocardial infarction,” Journal of electrocardiology, vol. 49, no. 2, pp. 206–213, Dec. 2015. [Online]. Available: https: //doi.org/10.1016/j.jelectrocard.2015.12.003 [ Links ]

[43] W. Liu, F. Wang, Q. Huang, S. Chang, H. Wang, and J. He, “MFB-CBRNN: A hybrid network for MI detection using 12-lead ECGs,” IEEE journal of biomedical and health informatics, vol. 24, no. 2, pp. 503–514, Apr. 2019. [Online]. Available: https://doi.org/10.1109/jbhi.2019.2910082Links ]

[44] M. R. Rajeshwari and K. S. Kavitha, “Arrhythmia ventricular fibrillation classification on ECG signal using ensemble feature selection and deep neural network,” Cluster Computing, vol. 25, no. 5, pp. 3085–3102, 2022. [Online]. Available: https://doi.org/10.1007/s10586-022-03547-wLinks ]

[45] H. M. Rai and K. Chatterjee, “Hybrid CNN-LSTM deep learning model and ensemble technique for automatic detection of myocardial infarction using big ECG data,” Applied Intelligence, vol. 52, no. 5, pp. 5366–5384, 2022. [Online]. Available: https://doi.org/10.1007/s10489-021-02696-6Links ]

[46] B. Król-Józaga, “Atrial fibrillation detection using convolutional neural networks on 2- dimensional representation of ecg signal,” Biomedical Signal Processing and Control, vol. 74, p. 103470, 2022. [Online]. Available: https://doi.org/10.1016/j.bspc.2021.103470Links ]

Recibido: 16 de Noviembre de 2022; Revisado: 06 de Diciembre de 2022; Aprobado: 12 de Diciembre de 2022

Creative Commons License Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.