Introducción
La compresión de imágenes es un conjunto de técnicas aplicables a imágenes digitales que permiten almacenarlas o transmitirlas de manera eficiente [1]. Se han desarrollado diferentes técnicas de compresión, ya que los archivos de imágenes pueden ocupar un espacio considerable, lo que limita su intercambio a través de correos electrónicos y otros medios electrónicos. Las técnicas de compresión se basan en algoritmos matemáticos, los cuales logran reducir el volumen del archivo y disminuir la cantidad de recursos que consume, así como el tiempo de transferencia [2].
Todos los algoritmos de compresión de imágenes tienen como objetivo lograr un tamaño reducido para la imagen comprimida (alto factor de compresión) y una imagen reconstruida de alta calidad (compresión de alta calidad), y su eficiencia se puede medir dependiendo de la aplicación, utilizando diferentes criterios [3]. El criterio más importante es el factor de compresión, que mide el tamaño de la imagen antes y después de la compresión. Por lo tanto, cuanto mayor sea el factor de compresión, más efectivo será el algoritmo de compresión [4].
Las formas más comunes de compresión son la compresión sin pérdida y la compresión con pérdida. En esta última, se pierde parte de la información de la imagen al comprimirse. Algunos algoritmos de compresión pueden generar formatos que utilizan ambas técnicas para comprimir [5]. La compresión también dependerá del tipo de imagen. Si es una imagen de mapa de bits, es decir, una imagen formada por una cuadrícula de celdas o píxeles de un tamaño determinado, pierde resolución si se modifica [2]. Por otro lado, las imágenes vectoriales se construyen a partir de vectores, que son objetos matemáticamente definidos formados por una serie de puntos, con controladores que permiten modificar la dirección de las líneas, lo que les brinda gran flexibilidad. Estos vectores se crean utilizando curvas de Bézier [6].
En cuanto a la compresión con o sin pérdida, Ruiz et al. [7] mencionan que la compresión sin pérdida es una técnica que utiliza algoritmos matemáticos complejos para condensar cadenas de código mientras se preserva toda la información disponible de la imagen, permitiendo que se regenere de manera intacta cuando se descomprime, aunque requiere cierto tiempo para codificación y decodificación. Este tipo de compresión se usa en formatos como Portable Networks Graphics (.png). Por otro lado, Rojatkar et al. [8] mencionan que la compresión con pérdida implica algoritmos que descartan cierta información, que supuestamente es apenas visible en la imagen, lo que provoca la pérdida de parte de los datos del archivo original cuando la imagen se comprime. Esta es la compresión que se utiliza en formatos de imagen como Joint Photographic Experts Group (.jpeg).
Entre los tipos más comunes de compresión de imágenes sin pérdida podemos mencionar Run Length Encoding (.rle), que, como indican Hardi et al. [9], representa el esquema de compresión más simple. Se basa en la sustitución de una secuencia de bits por un código. El método analiza la imagen para seleccionar píxeles del mismo color, por lo que cuando se guarda la imagen, solo se registran el valor del color y las posiciones de los píxeles de color. Cuando las imágenes consisten en grandes áreas del mismo color, la compresión se logra sin pérdida de calidad. El método Lemple-Zif-Welch (.lzw) es bastante similar al .rle, pero se usa para más formatos, incluidos .tiff, .pdf y .gif [2]. Es muy eficaz para imágenes con grandes áreas de color y para imágenes simples, pero su eficacia disminuye cuando se comprimen imágenes con una amplia gama de colores de tipo fotográfico. La codificación de Huffman asigna códigos de bits cortos a los datos que aparecen con mayor frecuencia y códigos más largos a los datos menos comunes, lo que lo hace ampliamente utilizado por su simplicidad y alta velocidad [1]. La codificación aritmética utiliza una secuencia de símbolos representados en forma binaria, obtenidos a partir de intervalos con valores reales en un rango entre cero y uno [10].
Los modelos de compresión con pérdida más frecuentes incluyen la codificación por transformada. Esta técnica utiliza una transformada discreta de Fourier para hacer coincidir la imagen con los coeficientes de la transformada, seguida de un proceso de cuantización. Los coeficientes con valores pequeños e insignificantes se eliminan a través de la cuantización, lo que da como resultado en la pérdida de información sin una distorsión apreciable de la imagen [11]. El método de cuantización vectorial selecciona un conjunto representativo de píxeles de la imagen original, descartando aquellos que no lo son, mediante la construcción de tablas dinámicas o mediante agrupaciones para la clasificación vectorial [1]. La compresión fractal trata las imágenes como objetos fractales, lo que significa que están compuestas por una estructura básica fragmentada que se repite. A partir de esto, se crea una serie de funciones que llevan a transformaciones que dividen la imagen original en partes similares. La aplicación iterativa de las transformaciones produce una imagen muy cercana a la original, pero de menor tamaño, ya que se pierde información durante la división de la imagen [10].
La compresión de imágenes digitales ha sido estudiada desde diversas perspectivas, desde la investigación sobre los algoritmos utilizados para la compresión [12,13] [3,4] hasta estudios específicos sobre la aplicación de la compresión de imágenes en campos como las ciencias forestales [14], las ciencias forenses [15,16], las ciencias médicas [17,19] y otras disciplinas. La mayoría de los trabajos de investigación se centran en los algoritmos para el análisis de archivos de imágenes digitales, pero hay poca referencia a comparaciones de herramientas y formatos para seleccionar los óptimos. Por lo tanto, este trabajo busca determinar si los formatos, herramientas y su interacción influyen en el tamaño del archivo de imagen. El objetivo de la investigación es determinar si la interacción de formatos y herramientas influye en el tamaño de los archivos de imágenes digitales.
Materiales y métodos
Metodología
La investigación tuvo un enfoque metodológico cuantitativo, con un diseño experimental y de nivel explicativo. La población estuvo compuesta por archivos de imágenes fotográficas con extensión .bmp y la muestra estuvo formada por cinco archivos de imágenes digitales con extensión .bmp, tomados en diferentes escenarios y momentos, a discreción del investigador. La técnica utilizada fue el análisis de archivos de imágenes digitales, y como instrumento se empleó una matriz de doble entrada, donde se registraron las conversiones de los archivos .bmp a seis diferentes extensiones de archivos de imágenes digitales con cuatro herramientas (programas) distintas para la manipulación de imágenes digitales.
El diseño estadístico consistió en un diseño factorial, donde los dos factores fueron los formatos de compresión de imágenes y las herramientas, y la variable dependiente fue el tamaño final del archivo de imagen. Se estableció un diseño experimental con seis niveles del primer factor (formato) y cuatro niveles del segundo factor (herramienta), para un total de 24 tratamientos aplicados a una muestra de cinco imágenes, lo que resultó en 120 valores de la variable dependiente. Los formatos utilizados fueron .jpg, .png, .psd, .pdf, .tiff y .tga, y las herramientas de edición de imágenes fueron CorelDRAW, Photoshop, Illustrator y GIMP. Las imágenes tomadas como muestra fueron codificadas según lo que se muestra en la Tabla 1.
El análisis estadístico se realizó utilizando un ANOVA factorial, donde se midió tanto el efecto individual de cada factor como el de su interacción sobre la variable dependiente, con un nivel de confianza del 95 %. El paquete estadístico aplicado fue SPSS 25.
Resultados y discusión
Análisis y resultados
De los 120 datos registrados, se observó que, al usar la herramienta CorelDRAW, el formato .pdf [20] fue el más pequeño, y al convertir al formato .tga, los archivos fueron los más grandes. Al usar la herramienta Photoshop, el formato más pequeño fue .jpg y el más grande fue .tiff. Con la herramienta Illustrator, también se obtuvo una extensión más pequeña al convertir al formato .jpg, y el formato .psd generó los archivos más grandes. Al usar la herramienta GIMP, al igual que con las anteriores, el formato más pequeño fue .jpg y el más grande fue .psd. Como se puede observar, el formato con la extensión más pequeña fue .jpg, el cual, aunque se comprime con pérdidas, esto se compensa con técnicas para suavizar los bordes y las áreas donde hay colores similares, lo que hace que la falta de información no sea visible a simple vista, permitiendo un alto grado de compresión, aunque hay pérdidas en la imagen que solo serán visibles si se aplica un zum considerable [2]. En este sentido, Tan [19] considera que la elección del formato está determinada principalmente en función del contenido de la imagen. En general, las imágenes fotográficas o con tonos suaves y pocos bordes definidos se comprimen mejor con un formato con pérdidas como .jpeg.
También se obtuvo que al considerar las cuatro herramientas para la conversión de archivos con extensión .bmp, la conversión a .jpg tuvo el valor promedio más bajo, igual a 210152480 bytes, mientras que al convertir a .psd se obtuvo el valor promedio más alto de 7042890180 bytes. El archivo con la extensión más pequeña fue el formato .jpg obtenido con la herramienta Illustrator, cuyo tamaño fue de 50474220 bytes, y, por el contrario, la extensión más grande se obtuvo al convertir al formato .psd, con un tamaño de 10044601140 bytes, también obtenida con la herramienta Illustrator. Como se menciona en el portal de Adobe Photoshop, el formato .psd está predeterminado para esta herramienta, compatible con otras como Illustrator, y su extensión máxima es de 2 GB, por lo que el valor promedio es superior a este, lo que indica que algunas herramientas no son capaces de convertir correctamente las imágenes .bmp a este formato, mientras que Illustrator, con aproximadamente 1 GB, fue la que mejor lo convirtió. Por su parte, Parmar y Pancholi [21] (2013) mencionan que el formato .jpg es uno de los más utilizados en fotografía debido a su calidad en términos de millones de colores, y que, aunque se comprime con pérdidas, su calidad sigue siendo buena.
Para medir la influencia de los factores (formato y herramienta) sobre la variable dependiente (tamaño de la imagen), se llevó a cabo la prueba ANOVA factorial, cuyos resultados se muestran en la Tabla 2.
En la Tabla 2, el valor de significancia p es de suma importancia, ya que permite medir la influencia de los factores en la variable dependiente. En el caso de la influencia del factor formato, p < 0.05 indica que ejerce una influencia estadísticamente significativa en el tamaño del archivo final convertido, lo cual es comprensible debido a la diferencia en tamaños obtenidos para los distintos formatos. En contraste, la influencia de las herramientas no es relevante, ya que p > 0.05, por lo que se puede afirmar que el tamaño final de las imágenes no depende del tipo de herramienta utilizada. La interacción entre los factores no muestra ninguna influencia en el tamaño final de las imágenes, lo que resalta que solo el tipo de formato es el factor principal a tener en cuenta para definir la extensión final de las imágenes .bmp, independientemente de la herramienta utilizada para la conversión.
La diferencia entre los tipos de formato es esperada y coherente con el hecho de que cada uno utiliza un algoritmo diferente para la compresión, lo que influye directamente en su tamaño final [1]. Lo anterior también es mencionado por Salomón [22], quien destaca que cada formato se comprime basado en una metodología diferente y, por lo tanto, las herramientas de conversión y compresión, al trabajar según dichas metodologías, no presentaron diferencias entre sí. Es evidente, según lo obtenido, que la compresión de una imagen a un determinado formato se puede realizar con cualquier herramienta, ya que el resultado en cuanto a tamaño no será estadísticamente diferente, lo que se observó en la no significancia de la interacción entre los factores. De acuerdo con lo obtenido, AbuBaker et al. [12] también informaron que existen diferencias en el tamaño y la calidad de las imágenes de mamografía digital cuando se utilizan diferentes métodos de compresión, lo cual fue evidenciado en la diferencia observada entre los diferentes formatos de salida, que utilizan métodos distintos. De manera similar, Wahba y Maghari [23] también demostraron que las técnicas de compresión específicas de cada formato son factores determinantes en la extensión o tamaño de la imagen comprimida.
Cuando se observaron diferencias entre los formatos, se encontró que .jpg es el de menor tamaño, con una calidad aceptable y similar a la de los otros formatos. Esto también fue informado por Dhawan [24] al comparar la compresión de diferentes formatos de imagen basados en los distintos algoritmos utilizados para este fin. Estos tamaños de imagen más pequeños para el formato .jpg se obtuvieron con la aplicación Illustrator, lo que sugiere que, aunque no se observó una diferencia estadística entre los resultados de las herramientas, esta sería indicada para obtener un tamaño de imagen más pequeño, como también lo señalan Sakshica y Gupta [25,26], quienes destacan que esta herramienta es particularmente útil en la compresión de imágenes vectoriales [27,30].
Conclusiones
Se concluye, basándose en los resultados obtenidos, que el tamaño final al comprimir imágenes con diferentes herramientas diseñadas para este propósito presenta diferencias en función del tipo de formato elegido para la compresión y no de la herramienta utilizada. Aun así, el tamaño de imagen más pequeño se obtuvo con el formato .jpg y el programa Illustrator, ya que esta herramienta es particularmente útil para comprimir imágenes vectoriales.
El formato .jpg, aunque fue el más pequeño en tamaño, presenta un método de compresión con pérdida, lo que provoca que se pierdan parte de los píxeles de la imagen, por lo que su resolución puede verse afectada al descomprimirla. Por lo tanto, se recomienda continuar investigando y probando con otras herramientas que permitan obtener resultados que faciliten una mejor elección del formato de imagen a comprimir y que aseguren una calidad acorde a lo que se busca.