imágenes digitales

5/16/2018 Im genes digitales - slidepdf.com

http://slidepdf.com/reader/full/imagenes-digitales-55ab50e63ea82 1/16

TSM

Imágenes digitales

Trabajo 2

Víctor Morales Martín

Cristina Tévar Moratalla



Tratamiento de señales multimedia

1

En este trabajo, se analizarán los distintos tipos de imágenes binarias, escala de

grises y en color y se compararán sus características, ventajas, inconvenientes,

aplicaciones, etc., según se ha presentado en clase. Además, se compararán los

espacios de color RGB y HSI, teniendo en cuenta sus semejanzas, diferencias,componentes, aplicaciones, conversión entre uno y otro, etc.

1. Análisis de los distintos tipos de imágenes:

En esta primera parte del trabajo vamos a definir cada uno de los tipos de

imágenes para posteriormente, realizar una comparación entre ellos y por último,

crear un sencillo código en matlab para representar cada de los ejemplos de imágenes.

1.1 Definiciones

Imagen binaria: La binarización de una imagen consiste en un proceso de reducción de

la información de la misma, en la que sólo persisten dos valores: verdadero y falso. En

una imagen digital, estos valores, verdadero y falso, pueden representarse por los

valores 0 y 1, o más frecuentemente, por los colores negro (valor de gris 0) y blanco

(valor de gris 255). De esta forma, para cada imagen solo tenemos dos valores de píxel.

En el proceso y análisis de imagen, la binarización se emplea para separar las regiones

u objetos de interés en una imagen del resto.

Imagen de intensidad : Representa una imagen donde cada elemento tiene un valor

que se corresponde a cuan brillante u oscuro debería ser coloreado el píxel en la

posición correspondiente. Por tanto, es una imagen cuyos valores de píxeles

corresponden a una escala de grises. Las imágenes representadas de este tipo están

compuestas de sombras de grises, que van desde el negro más profundo variando

gradualmente en intensidad de grises hasta llegar al blanco.

Imagen indexada: Es una forma práctica de representar las imágenes a color. Son

imágenes cuyos píxeles tienen valores que son índices directos a un mapa de color

RGB. Una imagen indexada almacena una imagen como dos matrices.La primera matriz tiene el mismo tamaño que la imagen y un

número para cada píxel. La segunda matriz se denomina mapa de color

y su tamaño puede diferir del de la imagen. Los números de la primera

matriz son una instrucción de qué color usar según el mapa de color.

Imagen en color : Una imagen en color o RGB es aquella cuyos píxeles son especificados

por 3 valores, uno para cada componente de color (rojo, verde y azul) de cada píxel.

Se les suele referenciar como imágenes de color verdadero. Una imagen RGB no

necesita paleta de colores ya que la combinación de las tres componentes básicas de

color guardadas en cada plano define el propio color a representar en el píxelcorrespondiente. Los formatos de ficheros gráficos guardan imágenes RGB de 24 bpp,

http://es.wikipedia.org/wiki/Sombra

http://es.wikipedia.org/wiki/Gris

http://es.wikipedia.org/wiki/Negro_(color)


http://es.wikipedia.org/wiki/Blanco_(color)

http://es.wikipedia.org/wiki/Blanco_(color)


http://es.wikipedia.org/wiki/Negro_(color)


http://es.wikipedia.org/wiki/Sombra




2

donde cada componente de color es de 8 bits nos dan una gama de hasta 16 millones

de colores. La precisión con la que una imagen de la vida real puede ser replicada ha

dado el nombre al término comúnmente utilizado como color verdadero.

1.2 Comparación de los diferentes tipos de imágenes.

Tipo de imagen Clase de

almacenamiento

Tipo de notación Rango de valores

Binaria logical Números enteros [0,1]

Intensidad Doublé

Uint8 ó Uint16

Punto flotante

Números enteros

[0,1]

[1,p-1]

Indexada Doublé

Uint8 ó Uint16

Números enteros

Números enteros

[1,p]

[1,p-1]

RGB Doublé

Uint8 ó Uint16

Punto flotante de

mxnx3

Números enteros

de mxnx3

[0,1]

[0,65535]

Apoyándonos en el código de matlab que se detallará posteriormente, hemos

realizado una nueva clasificación para mediante un ejemplo comprobar la ocupación

en disco y la profundidad de bits de cada tipo de imagen.

RGB Indexada Intensidad Binaria

Filename:

'leon.png'

FileSize: 175438

Format: 'png'

Width: 512

Height: 512

BitDepth: 24

ColorType:

'truecolor'

Filename:

'leonind.png'

FileSize: 70819

Format: 'png'

Width: 512

Height: 512

BitDepth: 8

ColorType:

'grayscale'

Filename:

'leonint.png'

FileSize: 67382

Format: 'png'

Width: 512

Height: 512

BitDepth: 8

ColorType:

'grayscale'

Filename:

'leonbin.png'

FileSize: 3063

Format: 'png'

Width: 512

Height: 512

BitDepth: 1

ColorType:

'grayscale'




3

1.3 Aplicaciones, ventajas e inconvenientes

En este aparatado se desarrollarán las aplicaciones relacionándolas con las

ventajas e inconvenientes de cada tipo de imágenes:

En cuanto a las imágenes binarias podemos decir, que se usan para segmentar

regiones de interés dentro de otras imágenes mayores, rellenado de regiones,

adelgazamiento, engrosamiento y reconocimiento óptico de caracteres.

Por ejemplo, la aplicación de engrosamiento se desarrolla por la operación

morfológica de dilatación, aquí vemos que en un texto con una resolución pobre

utilizando este método podemos distinguir mejor sus caracteres.

Por otra parte, el reconocimiento óptico consiste en comparar dos caracteres

con unos patrones o plantillas que contiene todos los posibles caracteres y esto es

posible puesto que, solo tenemos dos niveles de gris.

Con estas características, podemos decir que la mayor ventaja de este tipo de

imagen es que son muy útiles para aplicaciones sencillas con la menor ocupación de

disco posible. Si queremos más calidad deberíamos elegir alguno de los siguientes

tipos de imagen.

Por su parte, las imágenes de intensidad se utilizan para la detección de bordes

en todas las direcciones en una imagen multinivel por la operación de gradiente

morfológico.




4

Otras aplicaciones típicas de las imágenes intensidad son la creación de

texturas y granulometrías dentro de una imagen ya existente.

Por así decirlo, están un escalón por encima de las imágenes binarias en

relación a su calidad, consiguiendo las mayores características en cuanto a

intensidades se refiere. Poseen algoritmos para el cambio de contraste lo que supone

una gran ventaja para la aplicación de detección de bordes detallada anteriormente. Si

necesitamos realizar cualquier operación en color debemos optar por las imágenes

indexadas o por las imágenes RGB.

Las imágenes indexadas se usan para aplicaciones multimedia, como por

ejemplo en los espacios web de buscador de imágenes. Este proceso se realiza una vez

que han sido convertidas a partir de un RGB, porque ocupan mucho menos espaciopara su transporte.

La desventaja de las imágenes indexadas la encontramos cuando necesitamos

una calidad mayor para el tratamiento de imagen, ya que este tipo de imagen está

comprimida y por tanto perderemos cierta información, por ejemplo, en aplicaciones

médicas, donde necesitamos la máxima resolución y calidad de imagen.

Pero este mismo aspecto, también es una ventaja la imagen indexada, ya que esta

compresión es idónea a la hora de archivar imágenes, donde buscamos la mayor

cantidad de archivos en el menor espacio posible como se referenció anteriormente.

Por último, las imágenes RGB o de “color verdadero” se usan para aplicaciones

donde necesitamos mayor calidad para la representación de la imagen a estudio

puesto que, tienen mayor profundidad de bit que nos marca la cantidad de tonos que

podemos representar.

Como ya podemos deducir, este tipo de imágenes son ideales cuando

necesitemos gran resolución y calidad en una imagen, pero el gran inconveniente que

podemos encontrar es su gran tamaño.




5

1.4 Código de matlab:

%En esta parte del trabajo vamos a cargar 1 imagen para su

procesamiento %Realizaremos a partir de esta imagen distintas conversiones y serán %mostradas por pantalla

%primera inicial i=imread('leon.png');%cargamos la primera imagen figure(1) imshow(i)%mostramos la imagen cargada info=imfinfo('leon.png')%mostramos por pantalla la información de la

%imagen ecualizada

i2=im2bw(i);%creamos una imagen binaria por el metodo de dithering imwrite(i2,'leon2.png');%guardamos la imagen en formato png figure(2) imshow(i2)%mostramos la imagen binaria info2=imfinfo('leon2.png')%mostramos por pantalla la información de la

%imagen ecualizada

[i3,map]=rgb2ind(i,64);%creamos una imagen indexada por el comando

rgb2ind imwrite(i3,'leon3.png');%guardamos la imagen en formato png figure(3) image(i3), colormap(map) info3=imfinfo('leon3.png')%mostramos por pantalla la información de la

%imagen ecualizada

i4=ind2gray(i3,map);%creamos una imagen en escalada de grises a partir

de

imwrite(i4,'leon4.png');%guardamos la imagen en formato png %la imagen indexada

figure(4) imshow(i4) info4=imfinfo('leon4.png')%mostramos por pantalla la información de la

%imagen ecualizada

1.5 Representación de imagines

Imagen RGB




6

Imagen indexada

Imagen de intensidad

Imagen binaria




7

Comparación de los espacios de color RGB y HSI, teniendo en cuenta sus semejanzas,

diferencias, componentes, aplicaciones, conversión entre uno y otro, etc.

Un modelo o espacio de color nos indica la manera en que un color estádefinido. Generalmente, un espacio de color está determinado por una base de n

vectores, cuyas combinaciones lineales generan todos los elementos del espacio.

Los espacios de color más utilizados son los tridimensionales RGB, HSI, YIQ. Los

dos primeros los detallaremos en las secciones siguientes, pues en ellos está basado

nuestro trabajo.

El modelo de color RGB, es un subespacio euclidiano conformado por el cubo unitario.

Los colores aparecen con sus componentes primarias de rojo, verde y azul. Los

valores de R, G y B se encuentran a lo largo de tres ejes. En otras palabras, en el eje del

rojo, en el eje del verde y en el eje del azul se encuentran las intensidades de cada

color.

Por conveniencia los colores se han normalizado de forma que el cubo sea unitario. Esdecir todos los valores de R, G y B están en el intervalo [0,1].

Operar en el espacio RGB para imágenes digitales, es operar con píxeles que

tienen información de R, G y B. Una matriz almacena los valores de R, otra los valores

de G y la tercera contiene los valores de B.

Este espacio de color no es el más conveniente para el procesamiento de

imágenes en color, pues las operaciones en este espacio pueden producir colores

metámeros no deseados; además de que el sistema RGB es muy sensible a lascondiciones de iluminación de la escena.




8

Por estas razones es útil hacer procesamientos en otros espacios de colores, en

los que podemos llegar a través de transformaciones, partiendo del espacio RGB; y

después, para visualizar la imagen transformada, aplicar las respectivas

transformaciones inversas.

Modelo de color HSI, en el modelo de color HSI los colores se distinguen unos de otros

por su Tono (H Hue), Saturación (S Saturation) e Intensidad (I Intensity).

El tono esté asociado con la longitud de onda dominante en una mezcla de

ondas luminosas. Así, el tono representa el color dominante tal y como lo percibimos;

cuando decimos que un objeto es rojo, verde o café estamos indicando su tono.

La intensidad representa la iluminación percibida. La intensidad da la sensación

de que algún objeto refleja más o menos luz. Este atributo lo podemos ver claramente

en un televisor en blanco y negro.

La saturación se refiere a la cantidad de luz blanca mezclada con el color

dominante. La saturación es un atributo que nos diferencia un color intenso de uno

pálido. Cada uno de los colores primarios tiene su mayor valor de saturación antes de

ser mezclados con otros.




9

Tono y saturación están definidos por el triángulo de color que se muestra:

Se observa que el tono H es una medida angular, medida desde el eje rojo. Así,

cuando H=0°, el color es rojo, cuando H es 60° el color es amarillo, y así sucesivamente.

La saturación S es proporcional a la distancia desde el punto 0 hasta el centro del

triángulo. Entre mayor sea esta distancia la saturación será mayor.

El valor de intensidad del punto 0 es proporcional a la distancia medida desde

el punto negro hasta donde inicia el vector del punto 0. De esta forma, para cualquier

punto de color en la pirámide triangular, si su respectivo valor de intensidad tiende al

punto del blanco, entonces el color será más claro. Pero si tiende al punto negro el

color será más oscuro.

Una imagen digital en el espacio HSI consta de tres matrices m x n, las cuales

guardan los valores de H, S e I de manera respectiva. Así, cada píxel de la imagen

digital en este espacio de color tiene tres datos: tono, saturación e intensidad.

Conversión de RGB a HSI

El tono (H) y la saturación (S) están dados en términos de las ecuaciones denominadas

coordenadas cromáticas que están definidas como:

Ecuación 1

Ecuación 2




10

Ecuación 3

Que no son otra cosa que los valores normalizados de R, G y B. Sumando las

Ecs. (1) a (3) resulta la ecuación del plano en el espacio euclidiano rgb que pasa por los

puntos (1,0,0), (0,1,0) y (0,0,1).

La figura geométrica sobre el plano delimitado por estos puntos es un triángulo

equilátero. Se conoce que la gama de colores resultantes por la combinación de tres

colores está modelada precisamente por este tipo de triángulos:

La conversión de RGB a HSI es muy complicada pero calcular el parámetro I es

el más fácil de todos.

Al asumir que la intensidad está normalizada y que los valores de R, G y B se

encuentran entre 0 y 1, el punto P se encontrará dentro o sobre la superficie de color.

Por lo que la intensidad I, está definida como el promedio de R, G y B:

Cuyo valor está también en el intervalo [0,1].




11

Para hallar el tono nos auxiliaremos del siguiente triángulo equilátero donde su

centro tiene coordenadas (1/3,1/3,1/3)

Utilizando la ecuación del producto punto entre dos vectores obtenemos:

‖ ‖‖ ‖

Donde:

w: vector que va desde el origen a W

o: va del origen al punto O

er: vector que termina en el punto (1,0,0)

Realizando las operaciones concernientes, finalmente obtenemos:

Los valores estarán entre -180º a +180º




12

Para ver más detenidamente todos los pasos realizados hasta llegar a la

ecuación final podemos ir a:

http://fourier.eng.hmc.edu/e161/lectures/color_processing/node3.html

Para el cálculo de la saturación prolongamos la recta definida por los puntos W

y O hasta que corte algún lado del triángulo, el punto donde se corta lo denotamos por

O’

La podremos decir por:

||

||

Para obtener S, necesitamos conocer las coordenadas de O’ . Estas coordenadas

las podemos obtener resolviendo el sistema de ecuaciones, que es resultado de la

intersección de la recta que pasa por W y O’ y que matemáticamente se expresa así:

( )

( )

( )

Con “k” dentro del intervalo [0,1], la recta que pasa por e r, eg y resolviendo el

sistema de ecuaciones descubriendo las coordenadas d 0’.

Sustituimos las coordenadas de W, O y 0’ en la ecuación ||||:

Donde b0 es el mínimo de r0, g0 y b0 en el área delimitada por los puntos er, W,

y eg (igual al área denominada A1), con lo que la ecuación se transforma en:




13

Conversión de HSI a RGB

Para el caso en el que el punto se encuentre en A1 (0<=H<120), obtenemos:

ro la hallaremos teniendo en cuenta que es proyección de O:

[

]

g0 pon tanto será:

De las ecuaciones 1 y 3:

Sustituyendo en las ecuaciones anteriores:

Para 0≤H<120




14

Aplicaciones

En los últimos años se han dedicado muchos esfuerzos al estudio del análisis de

imágenes en color. Originalmente muchas técnicas fueron empleadas sobre imágenes

en niveles de grises. Los trabajos más recientes están relacionados con segmentaciónde imágenes a color, análisis de textura, morfología matemática, estandarización de

imágenes a color y localización de objetos.

La asignación de falso color a los objetos de las imágenes significa modificar el

color a una o varias regiones contenidas en la imagen digital. Esta técnica se utiliza

para enfatizar los objetos.

Por otra parte, el método de reproducción del color utilizado en las pantallas de

cristal líquido, denominado sistema aditivo consiste en partir del negro, e ir añadiendo

mayor o menor cantidad de luz de los tres colores básicos (rojo, verde y azul). Con´estos, a su vez se pueden conseguir una extensa variedad de colores, incluyendo la luz

blanca. Estos tres colores básicos forman el espacio de color RGB

No obstante, este espacio de color no es el más conveniente para el

procesamiento de imágenes en color, por lo que deberemos recurrir a la conversión

HSI.




15

imágenes digitales

Documents