imágenes digitales
TRANSCRIPT
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 1/16
TSM
Imágenes digitales
Trabajo 2
Víctor Morales Martín
Cristina Tévar Moratalla
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 2/16
Tratamiento de señales multimedia
1
En este trabajo, se analizarán los distintos tipos de imágenes binarias, escala de
grises y en color y se compararán sus características, ventajas, inconvenientes,
aplicaciones, etc., según se ha presentado en clase. Además, se compararán los
espacios de color RGB y HSI, teniendo en cuenta sus semejanzas, diferencias,componentes, aplicaciones, conversión entre uno y otro, etc.
1. Análisis de los distintos tipos de imágenes:
En esta primera parte del trabajo vamos a definir cada uno de los tipos de
imágenes para posteriormente, realizar una comparación entre ellos y por último,
crear un sencillo código en matlab para representar cada de los ejemplos de imágenes.
1.1 Definiciones
Imagen binaria: La binarización de una imagen consiste en un proceso de reducción de
la información de la misma, en la que sólo persisten dos valores: verdadero y falso. En
una imagen digital, estos valores, verdadero y falso, pueden representarse por los
valores 0 y 1, o más frecuentemente, por los colores negro (valor de gris 0) y blanco
(valor de gris 255). De esta forma, para cada imagen solo tenemos dos valores de píxel.
En el proceso y análisis de imagen, la binarización se emplea para separar las regiones
u objetos de interés en una imagen del resto.
Imagen de intensidad : Representa una imagen donde cada elemento tiene un valor
que se corresponde a cuan brillante u oscuro debería ser coloreado el píxel en la
posición correspondiente. Por tanto, es una imagen cuyos valores de píxeles
corresponden a una escala de grises. Las imágenes representadas de este tipo están
compuestas de sombras de grises, que van desde el negro más profundo variando
gradualmente en intensidad de grises hasta llegar al blanco.
Imagen indexada: Es una forma práctica de representar las imágenes a color. Son
imágenes cuyos píxeles tienen valores que son índices directos a un mapa de color
RGB. Una imagen indexada almacena una imagen como dos matrices.La primera matriz tiene el mismo tamaño que la imagen y un
número para cada píxel. La segunda matriz se denomina mapa de color
y su tamaño puede diferir del de la imagen. Los números de la primera
matriz son una instrucción de qué color usar según el mapa de color.
Imagen en color : Una imagen en color o RGB es aquella cuyos píxeles son especificados
por 3 valores, uno para cada componente de color (rojo, verde y azul) de cada píxel.
Se les suele referenciar como imágenes de color verdadero. Una imagen RGB no
necesita paleta de colores ya que la combinación de las tres componentes básicas de
color guardadas en cada plano define el propio color a representar en el píxelcorrespondiente. Los formatos de ficheros gráficos guardan imágenes RGB de 24 bpp,
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 3/16
Tratamiento de señales multimedia
2
donde cada componente de color es de 8 bits nos dan una gama de hasta 16 millones
de colores. La precisión con la que una imagen de la vida real puede ser replicada ha
dado el nombre al término comúnmente utilizado como color verdadero.
1.2 Comparación de los diferentes tipos de imágenes.
Tipo de imagen Clase de
almacenamiento
Tipo de notación Rango de valores
Binaria logical Números enteros [0,1]
Intensidad Doublé
Uint8 ó Uint16
Punto flotante
Números enteros
[0,1]
[1,p-1]
Indexada Doublé
Uint8 ó Uint16
Números enteros
Números enteros
[1,p]
[1,p-1]
RGB Doublé
Uint8 ó Uint16
Punto flotante de
mxnx3
Números enteros
de mxnx3
[0,1]
[0,65535]
Apoyándonos en el código de matlab que se detallará posteriormente, hemos
realizado una nueva clasificación para mediante un ejemplo comprobar la ocupación
en disco y la profundidad de bits de cada tipo de imagen.
RGB Indexada Intensidad Binaria
Filename:
'leon.png'
FileSize: 175438
Format: 'png'
Width: 512
Height: 512
BitDepth: 24
ColorType:
'truecolor'
Filename:
'leonind.png'
FileSize: 70819
Format: 'png'
Width: 512
Height: 512
BitDepth: 8
ColorType:
'grayscale'
Filename:
'leonint.png'
FileSize: 67382
Format: 'png'
Width: 512
Height: 512
BitDepth: 8
ColorType:
'grayscale'
Filename:
'leonbin.png'
FileSize: 3063
Format: 'png'
Width: 512
Height: 512
BitDepth: 1
ColorType:
'grayscale'
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 4/16
Tratamiento de señales multimedia
3
1.3 Aplicaciones, ventajas e inconvenientes
En este aparatado se desarrollarán las aplicaciones relacionándolas con las
ventajas e inconvenientes de cada tipo de imágenes:
En cuanto a las imágenes binarias podemos decir, que se usan para segmentar
regiones de interés dentro de otras imágenes mayores, rellenado de regiones,
adelgazamiento, engrosamiento y reconocimiento óptico de caracteres.
Por ejemplo, la aplicación de engrosamiento se desarrolla por la operación
morfológica de dilatación, aquí vemos que en un texto con una resolución pobre
utilizando este método podemos distinguir mejor sus caracteres.
Por otra parte, el reconocimiento óptico consiste en comparar dos caracteres
con unos patrones o plantillas que contiene todos los posibles caracteres y esto es
posible puesto que, solo tenemos dos niveles de gris.
Con estas características, podemos decir que la mayor ventaja de este tipo de
imagen es que son muy útiles para aplicaciones sencillas con la menor ocupación de
disco posible. Si queremos más calidad deberíamos elegir alguno de los siguientes
tipos de imagen.
Por su parte, las imágenes de intensidad se utilizan para la detección de bordes
en todas las direcciones en una imagen multinivel por la operación de gradiente
morfológico.
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 5/16
Tratamiento de señales multimedia
4
Otras aplicaciones típicas de las imágenes intensidad son la creación de
texturas y granulometrías dentro de una imagen ya existente.
Por así decirlo, están un escalón por encima de las imágenes binarias en
relación a su calidad, consiguiendo las mayores características en cuanto a
intensidades se refiere. Poseen algoritmos para el cambio de contraste lo que supone
una gran ventaja para la aplicación de detección de bordes detallada anteriormente. Si
necesitamos realizar cualquier operación en color debemos optar por las imágenes
indexadas o por las imágenes RGB.
Las imágenes indexadas se usan para aplicaciones multimedia, como por
ejemplo en los espacios web de buscador de imágenes. Este proceso se realiza una vez
que han sido convertidas a partir de un RGB, porque ocupan mucho menos espaciopara su transporte.
La desventaja de las imágenes indexadas la encontramos cuando necesitamos
una calidad mayor para el tratamiento de imagen, ya que este tipo de imagen está
comprimida y por tanto perderemos cierta información, por ejemplo, en aplicaciones
médicas, donde necesitamos la máxima resolución y calidad de imagen.
Pero este mismo aspecto, también es una ventaja la imagen indexada, ya que esta
compresión es idónea a la hora de archivar imágenes, donde buscamos la mayor
cantidad de archivos en el menor espacio posible como se referenció anteriormente.
Por último, las imágenes RGB o de “color verdadero” se usan para aplicaciones
donde necesitamos mayor calidad para la representación de la imagen a estudio
puesto que, tienen mayor profundidad de bit que nos marca la cantidad de tonos que
podemos representar.
Como ya podemos deducir, este tipo de imágenes son ideales cuando
necesitemos gran resolución y calidad en una imagen, pero el gran inconveniente que
podemos encontrar es su gran tamaño.
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 6/16
Tratamiento de señales multimedia
5
1.4 Código de matlab:
%En esta parte del trabajo vamos a cargar 1 imagen para su
procesamiento %Realizaremos a partir de esta imagen distintas conversiones y serán %mostradas por pantalla
%primera inicial i=imread('leon.png');%cargamos la primera imagen figure(1) imshow(i)%mostramos la imagen cargada info=imfinfo('leon.png')%mostramos por pantalla la información de la
%imagen ecualizada
i2=im2bw(i);%creamos una imagen binaria por el metodo de dithering imwrite(i2,'leon2.png');%guardamos la imagen en formato png figure(2) imshow(i2)%mostramos la imagen binaria info2=imfinfo('leon2.png')%mostramos por pantalla la información de la
%imagen ecualizada
[i3,map]=rgb2ind(i,64);%creamos una imagen indexada por el comando
rgb2ind imwrite(i3,'leon3.png');%guardamos la imagen en formato png figure(3) image(i3), colormap(map) info3=imfinfo('leon3.png')%mostramos por pantalla la información de la
%imagen ecualizada
i4=ind2gray(i3,map);%creamos una imagen en escalada de grises a partir
de
imwrite(i4,'leon4.png');%guardamos la imagen en formato png %la imagen indexada
figure(4) imshow(i4) info4=imfinfo('leon4.png')%mostramos por pantalla la información de la
%imagen ecualizada
1.5 Representación de imagines
Imagen RGB
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 7/16
Tratamiento de señales multimedia
6
Imagen indexada
Imagen de intensidad
Imagen binaria
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 8/16
Tratamiento de señales multimedia
7
Comparación de los espacios de color RGB y HSI, teniendo en cuenta sus semejanzas,
diferencias, componentes, aplicaciones, conversión entre uno y otro, etc.
Un modelo o espacio de color nos indica la manera en que un color estádefinido. Generalmente, un espacio de color está determinado por una base de n
vectores, cuyas combinaciones lineales generan todos los elementos del espacio.
Los espacios de color más utilizados son los tridimensionales RGB, HSI, YIQ. Los
dos primeros los detallaremos en las secciones siguientes, pues en ellos está basado
nuestro trabajo.
El modelo de color RGB, es un subespacio euclidiano conformado por el cubo unitario.
Los colores aparecen con sus componentes primarias de rojo, verde y azul. Los
valores de R, G y B se encuentran a lo largo de tres ejes. En otras palabras, en el eje del
rojo, en el eje del verde y en el eje del azul se encuentran las intensidades de cada
color.
Por conveniencia los colores se han normalizado de forma que el cubo sea unitario. Esdecir todos los valores de R, G y B están en el intervalo [0,1].
Operar en el espacio RGB para imágenes digitales, es operar con píxeles que
tienen información de R, G y B. Una matriz almacena los valores de R, otra los valores
de G y la tercera contiene los valores de B.
Este espacio de color no es el más conveniente para el procesamiento de
imágenes en color, pues las operaciones en este espacio pueden producir colores
metámeros no deseados; además de que el sistema RGB es muy sensible a lascondiciones de iluminación de la escena.
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 9/16
Tratamiento de señales multimedia
8
Por estas razones es útil hacer procesamientos en otros espacios de colores, en
los que podemos llegar a través de transformaciones, partiendo del espacio RGB; y
después, para visualizar la imagen transformada, aplicar las respectivas
transformaciones inversas.
Modelo de color HSI, en el modelo de color HSI los colores se distinguen unos de otros
por su Tono (H Hue), Saturación (S Saturation) e Intensidad (I Intensity).
El tono esté asociado con la longitud de onda dominante en una mezcla de
ondas luminosas. Así, el tono representa el color dominante tal y como lo percibimos;
cuando decimos que un objeto es rojo, verde o café estamos indicando su tono.
La intensidad representa la iluminación percibida. La intensidad da la sensación
de que algún objeto refleja más o menos luz. Este atributo lo podemos ver claramente
en un televisor en blanco y negro.
La saturación se refiere a la cantidad de luz blanca mezclada con el color
dominante. La saturación es un atributo que nos diferencia un color intenso de uno
pálido. Cada uno de los colores primarios tiene su mayor valor de saturación antes de
ser mezclados con otros.
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 10/16
Tratamiento de señales multimedia
9
Tono y saturación están definidos por el triángulo de color que se muestra:
Se observa que el tono H es una medida angular, medida desde el eje rojo. Así,
cuando H=0°, el color es rojo, cuando H es 60° el color es amarillo, y así sucesivamente.
La saturación S es proporcional a la distancia desde el punto 0 hasta el centro del
triángulo. Entre mayor sea esta distancia la saturación será mayor.
El valor de intensidad del punto 0 es proporcional a la distancia medida desde
el punto negro hasta donde inicia el vector del punto 0. De esta forma, para cualquier
punto de color en la pirámide triangular, si su respectivo valor de intensidad tiende al
punto del blanco, entonces el color será más claro. Pero si tiende al punto negro el
color será más oscuro.
Una imagen digital en el espacio HSI consta de tres matrices m x n, las cuales
guardan los valores de H, S e I de manera respectiva. Así, cada píxel de la imagen
digital en este espacio de color tiene tres datos: tono, saturación e intensidad.
Conversión de RGB a HSI
El tono (H) y la saturación (S) están dados en términos de las ecuaciones denominadas
coordenadas cromáticas que están definidas como:
Ecuación 1
Ecuación 2
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 11/16
Tratamiento de señales multimedia
10
Ecuación 3
Que no son otra cosa que los valores normalizados de R, G y B. Sumando las
Ecs. (1) a (3) resulta la ecuación del plano en el espacio euclidiano rgb que pasa por los
puntos (1,0,0), (0,1,0) y (0,0,1).
La figura geométrica sobre el plano delimitado por estos puntos es un triángulo
equilátero. Se conoce que la gama de colores resultantes por la combinación de tres
colores está modelada precisamente por este tipo de triángulos:
La conversión de RGB a HSI es muy complicada pero calcular el parámetro I es
el más fácil de todos.
Al asumir que la intensidad está normalizada y que los valores de R, G y B se
encuentran entre 0 y 1, el punto P se encontrará dentro o sobre la superficie de color.
Por lo que la intensidad I, está definida como el promedio de R, G y B:
Cuyo valor está también en el intervalo [0,1].
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 12/16
Tratamiento de señales multimedia
11
Para hallar el tono nos auxiliaremos del siguiente triángulo equilátero donde su
centro tiene coordenadas (1/3,1/3,1/3)
Utilizando la ecuación del producto punto entre dos vectores obtenemos:
‖ ‖‖ ‖
Donde:
w: vector que va desde el origen a W
o: va del origen al punto O
er: vector que termina en el punto (1,0,0)
Realizando las operaciones concernientes, finalmente obtenemos:
Los valores estarán entre -180º a +180º
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 13/16
Tratamiento de señales multimedia
12
Para ver más detenidamente todos los pasos realizados hasta llegar a la
ecuación final podemos ir a:
http://fourier.eng.hmc.edu/e161/lectures/color_processing/node3.html
Para el cálculo de la saturación prolongamos la recta definida por los puntos W
y O hasta que corte algún lado del triángulo, el punto donde se corta lo denotamos por
O’
La podremos decir por:
||
||
Para obtener S, necesitamos conocer las coordenadas de O’ . Estas coordenadas
las podemos obtener resolviendo el sistema de ecuaciones, que es resultado de la
intersección de la recta que pasa por W y O’ y que matemáticamente se expresa así:
( )
( )
( )
Con “k” dentro del intervalo [0,1], la recta que pasa por e r, eg y resolviendo el
sistema de ecuaciones descubriendo las coordenadas d 0’.
Sustituimos las coordenadas de W, O y 0’ en la ecuación ||||:
Donde b0 es el mínimo de r0, g0 y b0 en el área delimitada por los puntos er, W,
y eg (igual al área denominada A1), con lo que la ecuación se transforma en:
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 14/16
Tratamiento de señales multimedia
13
Conversión de HSI a RGB
Para el caso en el que el punto se encuentre en A1 (0<=H<120), obtenemos:
ro la hallaremos teniendo en cuenta que es proyección de O:
[
]
g0 pon tanto será:
De las ecuaciones 1 y 3:
Sustituyendo en las ecuaciones anteriores:
Para 0≤H<120
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 15/16
Tratamiento de señales multimedia
14
Aplicaciones
En los últimos años se han dedicado muchos esfuerzos al estudio del análisis de
imágenes en color. Originalmente muchas técnicas fueron empleadas sobre imágenes
en niveles de grises. Los trabajos más recientes están relacionados con segmentaciónde imágenes a color, análisis de textura, morfología matemática, estandarización de
imágenes a color y localización de objetos.
La asignación de falso color a los objetos de las imágenes significa modificar el
color a una o varias regiones contenidas en la imagen digital. Esta técnica se utiliza
para enfatizar los objetos.
Por otra parte, el método de reproducción del color utilizado en las pantallas de
cristal líquido, denominado sistema aditivo consiste en partir del negro, e ir añadiendo
mayor o menor cantidad de luz de los tres colores básicos (rojo, verde y azul). Con´estos, a su vez se pueden conseguir una extensa variedad de colores, incluyendo la luz
blanca. Estos tres colores básicos forman el espacio de color RGB
No obstante, este espacio de color no es el más conveniente para el
procesamiento de imágenes en color, por lo que deberemos recurrir a la conversión
HSI.
5/16/2018 Im genes digitales - slidepdf.com
http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 16/16
Tratamiento de señales multimedia
15