SciELO - Scientific Electronic Library Online

 
vol.2 número22DESARROLLO DE UNA FORMULACIÓN PARA LA CURTICIÓN DE PIEL CAPRINA CON ÁCIDO HÚMICO Y TARADESARROLLO DE UN BANCO DE PRUEBA PARA COLECTORES SOLARES DE AGUA CON TUBOS AL VACÍO: ANÁLISIS DE FUNCIONAMIENTO Y COMPARACIÓN CON DISPOSITIVOS COMERCIALES índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Perfiles

versión On-line ISSN 2477-9105

Resumen

MORALES-ONATE, Víctor  y  MORALES-ONATE, Bolívar. UNA TÉCNICA DE AGRUPACIÓN ROBUSTA PARA UN ENFOQUE BIG DATA: CLARADB PARA TIPOS DE DATOS MIXTOS. Perfiles [online]. 2019, vol.2, n.22, pp.87-97. ISSN 2477-9105.  https://doi.org/10.47187/perf.v2i22.68.

Cuando el investigador no cuenta con un conocimiento apriori de la conformación de grupos en un conjunto de datos dado, emerge la necesidad de realizar una clasificación conocida como clasificación no supervisada. Además, el conjunto de datos puede ser mixto (datos cualitativos y/o cuantitativos) o presentarse en grandes volúmenes. El algoritmo k-medias, por ejemplo, no permite la comparación de datos mixtos y está limitado a un máximo de 65536 objetos en el software R. K-medoides, por su parte, permite la comparación de datos mixtos pero también tiene la misma limitación de objetos que k-medias. El algoritmo CLARA tradicional puede exceder fácilmente este limitante de volúmenes, pero no permite la comparación de datos mixtos. En este contexto, este trabajo es una extensión del algoritmo CLARA para datos mixtos, el algoritmo CLARABD. La distancia de Gower es central en CLARABD para realizar esta extensión, debido a que permite la comparación de datos mixtos y también es posible procesar un conjunto de datos con mas de 65536 observaciones. Para mostrar las bondades del algoritmo propuesto, se ha realizado un proceso de simulación así como una aplicación a datos reales obteniendo resultados consistentes en cada caso.

Palabras clave : Clasificación; CLARA; K-medoides; datos mixtos; R software.

        · resumen en Inglés     · texto en Español     · Español ( pdf )