SciELO - Scientific Electronic Library Online

 
 número25Algoritmo de predicción del consumo de combustible para mezcla de etanol anhídrido en ciudades de alturaAnálisis de la eficiencia de un disco de freno convencional ventilado con respecto a un disco hiperventilado mediante mecanizado índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Ingenius. Revista de Ciencia y Tecnología

versión On-line ISSN 1390-860Xversión impresa ISSN 1390-650X

Resumen

ESCALONA ESCALONA, Yosveni. Algoritmos para el reconocimiento de estructuras de tablas. Ingenius [online]. 2021, n.25, pp.50-61. ISSN 1390-860X.  https://doi.org/10.17163/ings.n25.2021.05.

Las tablas son una manera muy común de organizar y publicar datos. Por ejemplo, en el Internet se halla un enorme número de tablas publicadas en HTML integradas en documentos PDF, o que pueden ser simplemente descargadas de páginas web. Sin embargo, las tablas no siempre son fáciles de interpretar pues poseen una gran variedad de características y son organizadas en diferentes formatos. De hecho, se han desarrollado muchos métodos y herramientas para la interpretación de tablas. Este trabajo presenta la implementación de un algoritmo, basado en campos aleatorios condicionales (CRF, Conditional Random Fields), para clasificar las filas de una tabla como fila de encabezado, fila de datos y fila metadatos. La implementación se complementa con dos algoritmos para reconocer tablas en hojas de cálculo, específicamente, basados en reglas y detección de regiones. Finalmente, el trabajo describe los resultados y beneficios obtenidos por la aplicación del algoritmo para tablas HTML, obtenidas desde la web y las tablas en forma de hojas de cálculo, descargadas desde el sitio de la Agencia Nacional de Petróleo de Brasil.

Palabras clave : datos tabulados; tablas HTML; hoja de cálculo; campos aleatorios condicionales; aprendizaje automático.

        · resumen en Inglés     · texto en Español     · Español ( pdf )