análisis de la fragmentación mitocondrial en imágenes de

108
I NSTITUTO P OLITÉCNICO N ACIONAL C ENTRO DE I NVESTIGACIÓN EN C OMPUTACIÓN “Análisis de la fragmentación mitocondrial en imágenes de microscopio para la evaluación del cáncer de mama” TESIS QUE PARA OBTENER EL GRADO DE MAESTRÍA EN CIENCIAS DE LA COMPUTACIÓN PRESENTA I NG.F RANCISCO J AVIER V ÁZQUEZ V ÁZQUEZ DIRECTORES : DR.J UAN CARLOS CHIMAL EGUÍA DRA.ERANDI CASTILLO MONTIEL Ciudad de México Diciembre, 2018

Upload: others

Post on 10-Jul-2022

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de la fragmentación mitocondrial en imágenes de

INSTITUTO POLITÉCNICONACIONAL

CENTRO DE INVESTIGACIÓN EN

COMPUTACIÓN

“Análisis de la fragmentación

mitocondrial en imágenes de

microscopio para la evaluación del

cáncer de mama”

TESIS

QUE PARA OBTENER EL GRADO DE

MAESTRÍA EN CIENCIAS DE LA

COMPUTACIÓN

PRESENTA

ING. FRANCISCO JAVIER VÁZQUEZ VÁZQUEZ

DIRECTORES:

DR. JUAN CARLOS CHIMAL EGUÍA

DRA. ERANDI CASTILLO MONTIEL

Ciudad de México

Diciembre, 2018

Page 2: Análisis de la fragmentación mitocondrial en imágenes de
Page 3: Análisis de la fragmentación mitocondrial en imágenes de
Page 4: Análisis de la fragmentación mitocondrial en imágenes de
Page 5: Análisis de la fragmentación mitocondrial en imágenes de
Page 6: Análisis de la fragmentación mitocondrial en imágenes de
Page 7: Análisis de la fragmentación mitocondrial en imágenes de

I

Resumen

El procesamiento de imágenes biológicas ha tenido un gran impacto en los últimos

años, para ello se han empleado tanto algoritmos tradicionales de procesamiento de imá-

genes como algoritmos de inteligencia artificial, los cuales se han implementado en imá-

genes biológicas, permitiendo encontrar patrónes de relevancia en específicos casos de

estudio. En este trabajo se hace uso de algunos algoritmos de procesamiento de imágenes

aplicados en el estudio y análisis de imágenes biomédicas, tomando como caso de estu-

dio las morfologías mitocondriales presentes en imágenes de células asociadas al estudio

del cáncer de mama. Estos algoritmos son utilizados para encontrar los distintos niveles

de fragmentación y realizar una clasificación de las diferentes morfologías. Se presentan

resultados de clasificación en las imágenes, con base en las morfologías obtenida en dife-

rentes líneas celulares.

Page 8: Análisis de la fragmentación mitocondrial en imágenes de
Page 9: Análisis de la fragmentación mitocondrial en imágenes de

III

Abstract

The processing in biomedical images has have a considerable impact in the recent years,

either traditional image processing algorithms or artificial intelligence algorithms have

been used in this field, finding several patterns in order to evaluate different biological

problems. In this work some image processing and machine learning algorithms are used

to assess biomedical images, with an approach in mitochondrial morphologies images

which have been associated to different types of breast cancer. These algorithms are im-

plemented to find levels of fragmentation and classify the studied morphologies. Finally

some results are presented as a result of the obtained images in different cell lines.

Page 10: Análisis de la fragmentación mitocondrial en imágenes de
Page 11: Análisis de la fragmentación mitocondrial en imágenes de

V

Agradecimientos

Agradezco a mi familia, a mis padres Francisco y Rosa, por todo su apoyo y motivación

a lo largo de este periodo, y a mis hermanas Lizbeth y Soreli por su apoyo incondicional.

A mis asesores el Dr. Juan Carlos Chimal Eguía y la Dra. Erandi Castillo Montiel, por

su guía y sus sabios consejos.

Al Centro Biomédico de Oriente de la Ciudad de Puebla y en especial a la Dra. Paola

Maycotte González, por la colaboración y acceso a los datos necesarios para la elabora-

ción de este trabajo.

Al Instituto Politécnico Nacional y al Centro de Investigación en Computación por

brindarme las herramientas necesarias para desarrollar el presente trabajo. Finalmente

al Consejo de Nacional de Ciencia y Tecnología (Conacyt), por el apoyo económico brin-

dado durante mi preparación bajo el número de apoyo 458426.

Page 12: Análisis de la fragmentación mitocondrial en imágenes de
Page 13: Análisis de la fragmentación mitocondrial en imágenes de

VII

Índice general

Resumen I

Abstract III

Agradecimientos V

1. Introducción 1

1.1. Descripción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1. Biomarcador en el estudio del cancer de mama . . . . . . . . . . . . . 2

1.2. Morfología mitocondrial y su relación al estudio cáncer de mama . . . . . . 2

1.2.1. Tipos de morfologías . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Completamente tubulares . . . . . . . . . . . . . . . . . . . . . . . . . 3

Fragmentadas con algunos túbulos . . . . . . . . . . . . . . . . . . . . 4

Completamente Fragmentadas . . . . . . . . . . . . . . . . . . . . . . 4

Page 14: Análisis de la fragmentación mitocondrial en imágenes de

Índice general VIII

Tubulares con fragmentos . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4. Justificación del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.6. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2. Estado del arte 9

2.1. Casos de estudio de morfologías mitocondriales . . . . . . . . . . . . . . . . 9

2.1.1. La inhibición de la fisión mitocondrial previene la progresión del

ciclo celular en el cáncer de pulmón . . . . . . . . . . . . . . . . . . . 10

2.1.2. Imágenes revelan la morfología mitocondrial como un biomarcador

del fenotipo del cáncer y la respuesta a los medicamentos. . . . . . . 10

2.1.3. Estudio de parámetros asociados a la dinámica mitocondrial en

cáncer de mama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2. Análisis de imágenes para el estudio de morfologías mitocondriales . . . . . 12

2.2.1. Árboles de decisión para clasificación de tres tipos de morfologías . 13

3. Marco teórico 17

3.1. Análisis de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Page 15: Análisis de la fragmentación mitocondrial en imágenes de

Índice general IX

3.1.1. Filtros de reducción de ruido . . . . . . . . . . . . . . . . . . . . . . . 18

Filtro promedio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Filtro Gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.1.2. Algoritmos de segmentación . . . . . . . . . . . . . . . . . . . . . . . 20

Segmentación global . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Segmentación Otsu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.1.3. Morfología matemática en imágenes biomédicas . . . . . . . . . . . . 23

Algoritmo de adelgazamiento . . . . . . . . . . . . . . . . . . . . . . . 23

3.2. Medidas en redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2.1. Longitud promedio de la trayectoria . . . . . . . . . . . . . . . . . . 25

3.2.2. Centralidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2.3. Excentricidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2.4. Densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3. Redes neuronales multicapa y algoritmo backpropagation . . . . . . . . . . 26

3.3.1. Entrenamiento por backpropagation . . . . . . . . . . . . . . . . . . . 29

4. Metodología y experimentos 31

Page 16: Análisis de la fragmentación mitocondrial en imágenes de

Índice general X

4.1. Clasificación empleando medidas de grafos y clasificación con k-means . . 32

4.1.1. Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.2. Adelgazamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1.3. Extracción de características . . . . . . . . . . . . . . . . . . . . . . . . 38

4.1.4. Clasificación utilizando algoritmo K-means . . . . . . . . . . . . . . . 39

4.1.5. Análisis de resultados del experimento anterior . . . . . . . . . . . . 41

4.2. Análisis empleando redes neuronales convolucionales . . . . . . . . . . . . . 44

4.2.1. Convolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.2. Función de activación . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2.3. Función Submuestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2.4. Capa completamente conectada . . . . . . . . . . . . . . . . . . . . . 47

4.2.5. Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.2.6. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 clases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.3. Análisis por segmentación usando algoritmo K-means . . . . . . . . . . . . 51

4.3.1. Algoritmo de segmentación basado en k-means . . . . . . . . . . . . 52

Page 17: Análisis de la fragmentación mitocondrial en imágenes de

Índice general XI

4.3.2. Identificación de objetos usando búsqueda a lo ancho en grafos . . . 55

4.3.3. Identificación de regiones fragmentadas y tubulares usando redes

neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.3.4. Entrenamiento y clasificación usando método de centroide mas cer-

cano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.4. Método de clasificación usando detección de bordes y medidas de grafos

complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.4.1. Extracción de bordes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.4.2. Extracción de características . . . . . . . . . . . . . . . . . . . . . . . 63

4.4.3. Entrenamiento y clasificación usando centroide mas cercano . . . . . 69

4.4.4. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.4.5. Clasificación por votación . . . . . . . . . . . . . . . . . . . . . . . . . 73

5. Conclusiones 77

5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.2. Trabajo a futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Page 18: Análisis de la fragmentación mitocondrial en imágenes de
Page 19: Análisis de la fragmentación mitocondrial en imágenes de

XIII

Índice de figuras

2.1. Imágenes del proceso seguido en: Computational imaging reveals mito-

chondrial morphology as a biomarker of cancer phenotype and drug res-

ponse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2. Resultados obtenidos en el artículo reportado en el estado del arte . . . . . . 15

3.1. Modelo perceptrón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.2. Modelo perceptrón multicapa . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.1. Clases definidas para el proceso de clasificación . . . . . . . . . . . . . . . . 33

4.2. Etapas del método de clasificación emplando un algoritmo no supervisado 34

4.3. Resultado del proceso de segmentación, en la parte izquierda se muestra

la imagen de entrada(escala de grises), mientras que en la parte derecha se

muestra el resultado de aplicar el método Otsu . . . . . . . . . . . . . . . . . 36

Page 20: Análisis de la fragmentación mitocondrial en imágenes de

Índice de figuras XIV

4.4. Resultado de aplicar el algoritmo de adelgazamiento, la imagen que se em-

plea para ser procesada es resultado de la segmentación aplicada en el pro-

cesso anterior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.5. Operación convolución empleada sobre la imagen de entrada . . . . . . . . 45

4.6. Función de pooling en donde se descarta el 75 porciento de los pixeles

contenidos en una cierta región . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.7. Arquitectura implementada para la clasificación de las imágenes, se em-

plea un modelos con dos capas convolucionales, cada una con sus funcio-

nes de activación y pooling, posteriormente se procesan estan capas en un

modelo completamente conectado . . . . . . . . . . . . . . . . . . . . . . . . 47

4.8. Diferencia entre imagen binaria y escala de grises . . . . . . . . . . . . . . . 49

4.9. Análisis y clasificación basado en K-means y redes neuronales . . . . . . . . 52

4.10. Segmentación basada en método elbow utilizada para localizar regiones de

interés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.11. Segmentación por k-means aplicada en cada uno de las imágenes . . . . . . 54

4.12. Proceso de separación de formas empleando el algoritmo de búsqueda a lo

ancho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.13. Ejemplos de imágenes para entrenamiento . . . . . . . . . . . . . . . . . . . 57

Page 21: Análisis de la fragmentación mitocondrial en imágenes de

Índice de figuras XV

4.14. Clasificación basada en porcentaje de fragmentación, las regiones de color

rojo representan los objetos que fueron identificados como fragmentos y las

regiones de color azul aquellos que se identificaron como regiones túbulares 59

4.15. Análisis y clasificación basado en K-means y redes neuronales . . . . . . . . 62

4.16. Proceso de detección de bordes mediante algoritmo Canny . . . . . . . . . . 64

4.17. Región para obtener la matriz de ocurrencia . . . . . . . . . . . . . . . . . . . 68

4.18. Matriz de co-ocurrencia obtenida para los primeros 4 nivéles en la imagen . 69

Page 22: Análisis de la fragmentación mitocondrial en imágenes de
Page 23: Análisis de la fragmentación mitocondrial en imágenes de

XVII

Índice de cuadros

1.1. Porcentajes asignados por los expertos a cada tipo de morfología . . . . . . 5

4.1. Conjunto de imágenes disponibles . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2. Matriz de confusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.3. Datos empleados para entrenamiento . . . . . . . . . . . . . . . . . . . . . . 48

4.4. Arquitectura de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.5. Matriz de confusión método clasificación redes neuronales . . . . . . . . . . 50

4.6. Matriz de confusión método clasificación redes neuronales . . . . . . . . . . 50

4.7. Parámetros de la red de entrenamiento . . . . . . . . . . . . . . . . . . . . . . 58

4.8. Matriz de confusión método clasificación por k-means y redes neuronales . 60

4.9. Matriz de confusión método clasificación por k-means y redes neuronales . 61

4.10. Resultado de aplicar longitud del camino mas corto . . . . . . . . . . . . . . 65

4.11. Número de subgrafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

Page 24: Análisis de la fragmentación mitocondrial en imágenes de

Índice de cuadros XVIII

4.12. Resultado de aplicar promedio del radio del grafo . . . . . . . . . . . . . . . 67

4.13. Otras medidas probadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.14. Resultado de aplicar entropía en matriz de co-ocurrencia . . . . . . . . . . . 70

4.15. Medidas obtenidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.16. Matriz de confusión método clasificación extracción de bordes y medidas

de grafos(3 clases) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.17. Matriz de confusión método clasificación extracción de bordes y medidas

de grafos (4 clases) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.18. Ejemplo del proceso de clasificación por votación . . . . . . . . . . . . . . . 73

4.19. Matriz de confusión método clasificación por votación . . . . . . . . . . . . 73

4.20. Matriz de confusión método clasificación por votación . . . . . . . . . . . . 74

4.21. Porcentajes de los métodos aplicados en 3 clases . . . . . . . . . . . . . . . . 74

4.22. Porcentajes de los métodos aplicados en 4 clases . . . . . . . . . . . . . . . . 75

Page 25: Análisis de la fragmentación mitocondrial en imágenes de

XIX

Índice de algoritmos

1. Proceso de clasificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2. Algoritmo región de segmentación de objetos . . . . . . . . . . . . . . . . . 55

Page 26: Análisis de la fragmentación mitocondrial en imágenes de
Page 27: Análisis de la fragmentación mitocondrial en imágenes de

1

Capítulo 1

Introducción

1.1. Descripción

Las mitocondrias de una célula son organelos que pueden variar en número, masa o

forma, en la mayoría de ellas se establece una relación entre su función y morfología.

Existen dos procesos que se involucran en la morfología mitocondrial dentro de una cé-

lula, el primer proceso se lleva acabo mediante una fisión (la división de una mitocondria

en dos o mas partes) y el segundo mediante fusión (la unión de dos o mas mitocondrias),

estos procesos forman un balance que permite definir una determinada morfología mi-

tocondrial, que se puede interpretar como una red de mitocondrias, esta red cumple con

demadas metabólicas y asegura la remoción de organelos dañnados. Todos estos eventos

se han asociado con la proliferación y redistribución de mitocondrias durante la división

y diferenciación celular. Las alteraciones en este tipo de dinámicas se han asociado con

distintas enfermedades, como por ejemplo el cáncer de mama. Esta asociación se realiza

Page 28: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 2

buscando diferencias en morfología mitocondrial entre distintas líneas celulares perten-

cientes a muestras de pacientes de cáncer de mama. El estudio de estas morfologías mi-

tocondriales permite tener una sospecha de ser un biomarcador en el la evaluación del

cáncer de mama.

1.1.1. Biomarcador en el estudio del cancer de mama

Un marcador biológico es un indicador que se emplea para medir el estado de un siste-

ma biológico, y puede proporcionar información sobre la respuesta a un tratamiento, en el

caso de las mitocondrias, se asocian como un posible biomarcador en diferentes subtipos

de cáncer de mama, tales como: CDIP(carcinoma ductal invasivo papilar), DCI(carcinoma

ductual invasivo) y enfermedad fiboquística no tumoral.

1.2. Morfología mitocondrial y su relación al estudio cán-

cer de mama

Dentro de un estudio llevado a cabo por investigadoras del Centro Biomédico de Orien-

te de la ciudad de Puebla [9], se hace un enfoque en el estudio de las siguientes líneas

celulares BT549, MCF7, MDAMB231, T47D Y MCF-10A en los siguientes subtipos de cán-

cer de mama: CIP, DCI y enfermedad fibroquística no tumoral. Dentro de este estudio se

analizaron los cambios en los niveles de expresión de las protéinas relacionadas a la di-

námica mitocondrial, empleando bases de datos de tumores de pacientes.

Page 29: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 3

El proceso del estudio de la dinámica mitocondrial se llevó a cabo usando una tin-

ción mitocondrial realizada con Mitotracker red(Invotrogen), las células se sembraron en

cubreobjetos, se fijaron y se observaron en un microscopio PALM Zeiss con un sistema

Apotome. Dentro de este estudio se capturaron imágenes de cada experimento y línea ce-

lular. En resumen [9] reporta que las líneas estudiadas tienen morfologías mitocondriales

diversas, clasificando estos tipos en cuatro grupos: (1=completamente tubular; 2=tubular

con algunos fragmentos; 3=fragmentada con túbulos, 4=completamente fragmentada). Se

puede percibir a un túbulo como una sección de la red mitocondrial que mantiene una

forma estable de acuerdo a la percepción del experto, y un fragmento como una sección

que asimila una forma no estable y asimila ser resultado de la división de la mitocon-

dria. La clasificación de estos cuatro tipos de morfologías fue realizada con base en la

experiencia de los investigadores y fundamentada de acuerdo a las pruebas reportadas.

1.2.1. Tipos de morfologías

Las clases observadas en el estudio previo se identifican de forma general de la siguien-

te manera:

Completamente tubulares

En esta clase se describe una red de morfologías mitocondriales en donde la mayor

parte de su estructura son túbulos y el resto de la estructura son fragmento. Cabe destacar

Page 30: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 4

que la forma, longitud y grosor de los tubulos y fragmentos puede variar, sin embargo el

porcentaje de túbulos predomina de forma considerable sobre los fragmentos.

Fragmentadas con algunos túbulos

Dentro de este tipo de morfología se hace un enfoque en el porcentaje de fragmentos,

pues de tiene una mayor medida de ellos. Se define una estructura perteneciente a esta

clase, el porcentaje de fragmentación es mayor al de túbulos, sin embargo, se perciben

regiones fragmentadas. Se puede interpretar como una disminución considerable del nú-

mero de túbulos en contra del número de fragmentos.

Completamente Fragmentadas

El porcentaje de fragmentos es mayor al de tubulación, en esta clase se puede defi-

nir un caso opuesto al de la morfología de mitocondrias completamente tubulares. Estas

morfologías contienen muy pocas regiones tubulares o en algunos casos ninguna.

Y se tiene la conjetura de una cuarta morfología

Tubulares con fragmentos

En este grupo se disminuye el porcentaje de túbulos y por ende incrementa el porcen-

taje de fragmentos sobre la red de mitocondrias, este tipo de morfología debe contener

un porcentaje mayor de fragmentación , destacando que el porcentaje de túbulos sigue

Page 31: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 5

siendo mayor que el porcentaje de fragmentación. Es importante mencionar que muchas

de las estructuras son evaluadas acorde a los experimentos realizados en laboratorio y los

porcentajes varian en cada experimento.

Se contó con algunos porcentajes de fragmentación en las diferentes clases analizadas,

estos porcentajes fueron propuestos por los investigadores expertos en el área, sin embar-

go estas cantidades fueron asignadas con base en la experiencias de los expertos, dichos

porcentajes pueden mantenecerse alrededor de estos valores.

Tubular % Fragmento % Descripción100 0 Tubular

. . Tubular81 19 Tubular80 20 Tubular con fragmentos. . Tubular con fragmentos

51 49 Tubular con fragmentos50 50 Tubular con fragmentos49 51 Fragmentada con túbulos. . Fragmentada con túbulos

20 80 Fragmentada con túbulos19 81 Completamente fragmentada. . Completamente fragmentada0 100 Completamente fragmentada

CUADRO 1.1: Porcentajes asignados por los expertos a cada tipo de morfolo-gía

1.3. Planteamiento del problema

El estudio del tipo de morfologías estudiandas en los distintos tipos de cáncer se enfoca

en obtener resultados estadísticos sobre grandes cantidades de experimentos, empleando

Page 32: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 6

diferentes procesos de laboratorio en diferentes tipos de experimentos. Los datos obteni-

dos a partir de los experimentos y pruebas de laboratorio son analizados de forma esta-

dística, dicha distribución requiere de un conteo del porcentaje de fragmentación y por-

centaje de tubulos, involucrando un proceso riguroso que normalmente se lleva a cabo

de forma manual, basado en la experiencia de los investigadores. Dicho estudio es tenta-

tivamente pensado en aplicarse en grandes conjuntos de imágenes, donde el proceso de

análisis de forma manual sería una tarea ardua y efectuada en un tiempo prolongado.

1.4. Justificación del problema

La inteligencia artificial ha tenido una evolución bastante acelerada en los últimas de-

cadas, especificamente el aprendizaje máquina se ha empleado en diferentes problemas

de visión por computadora y algoritmos aplicados en análisis de imágenes. Si bien el uso

de una computadora como herramienta de apoyo en el campo de la salud y la biología

no ha sustituido del todo la experiencia y conocimiento de los científicos, diferentes ti-

pos de software han servido como apoyo para acelerar el análisis y estudio de diferentes

patologías y fenómenos capturados en imágenes biomédicas. Tomando como enfoque la

clasificación de las morfologías mitocondriales, esto lleva a la necesidad de un herramien-

ta que sirva de apoyo para un estudio profundo del tema, sustituyendo un proceso que

normalmente se lleva a cabo de forma manual, basado en la experiencia de los investi-

gadores, siendo de gran utilidad un estudio computacional que ayude en el análisis de

estas morfologías. Con esto se pretende obtener una clasificación mas precisa mediante

Page 33: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 1. Introducción 7

medidas que sirvan como parámetros computacionales y se pueda formalizar la caracte-

rización de imágenes de este tipo.

1.5. Objetivo

Realizar un análisis computacional sobre imágenes de morfologías mitocondriales, pro-

bando distintos algoritmos de procesamiento y clasificación, proponiendo medidas para

la caracterización de las formas presentes en líneas celulares asociadas al cáncer de mama.

1.6. Objetivos específicos

1. Realizar una clasificación sobre morfología presente en las imágenes de mitocon-

drias.

2. Encontrar medidas que ayuden a la clasificación de las morfologías.

3. Verificar la existencia de cuatro tipos de morfologías.

4. Probar diferentes metologías para evaluar la clasificación de las morfologías mito-

condriales estudiadas.

Page 34: Análisis de la fragmentación mitocondrial en imágenes de
Page 35: Análisis de la fragmentación mitocondrial en imágenes de

9

Capítulo 2

Estado del arte

2.1. Casos de estudio de morfologías mitocondriales

La evaluación de las morfologías mitocondriales se ha empleado como caso de estudio

en recientes investigaciónes, los siguientes estudios han trabajado este tema: “ Inhibition

of mitochondrial fission prevents cell cycle progression in lung cancer” y “ Computatio-

nal imaging reveals mitochondrial morphology as a biomarker of cancer phenotype and

drug response” que abordan la problemática de las morfologías en mitocondrias. Sin em-

bargo el trabajo presentado toma como base el poster publicado en la revista CONACY “

Estudio de Parámetros Asociados a la Dinámica Mitocondrial en Cáncer de Mama” , este

poster presenta de forma resumida el estudio previo realizado por las investigadoras de

la ciudad de puebla, remarcando el gran interés en el estudio de las morfologías descritas

y su asociación como posibles biomarcadores. A continuación se describe el contenido de

cada una de las investigaciones:

Page 36: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 10

2.1.1. La inhibición de la fisión mitocondrial previene la progresión del

ciclo celular en el cáncer de pulmón

En este artículo se aborda la relación entre la dinámica de redes de mitocondrias, to-

mando como punto de partida los eventos de fusión y fisión, sin embargo el enfoque

tomado en este estudio se basa principalmente en el estudio del cancer de pulmón, y se

hace un estudio de la proteína Drp-1 que promueve fusión dentro de los experimentos

realizados. También se reporta en [13] un balance en las líneas celulales Drp/Mfn-2. Se

emplean estudios profundos de la relación entre las redes de mitocondrias y una posible

asociación como biomarcadores, además se explica que los eventos llevados a cabo du-

rante los experimentos resultan en la detención de la proliferación de uno de los tumores

asociados con el cáncer de pulmón y se destaca que los procesos de fusión y fisión juegan

un papel muy importante en el balance de los estudio del cáncer, se establece también

que contribuyen de gran utilidad en el uso de terapías para futuros tratamientos.

2.1.2. Imágenes revelan la morfología mitocondrial como un biomarca-

dor del fenotipo del cáncer y la respuesta a los medicamentos.

Se aborda inicialmente una descripción de las mitocondrias y el estudio previo que se

tiene sobre sus características y comportamiento en un sistema biológico, se hace mención

de trabajos previos en donde se ha aplicado el uso de morfologías como biomarcadores

y como objeto de estudio en respuesta a determinadas drogas y tratamientos. El traba-

jo propuesto [6] se basa en la propuesta de una técnica análitica para diferentes tipos de

Page 37: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 11

morfologías en diferentes tipos de cáncer (mama, pancreas, entre otros), demostrando que

las líneas celulares de diferentes tipos de cáncer expresan diferentes tipos de morfologías

mitocondriales. Por otra parte se hace mención a estudios recientes del uso de morfo-

log’ias mitocondriales para el estudio del cáncer y se destaca principalmente la existencia

de los siguientes tipos de morfologías: corta, fragmentadas,punteada, fragmentación in-

termedia, alargada y altamente ramificada con filamentos. Sin embargo se toman como

referencia estos tipos de morfologías para proponer tres principales morfologías dentro

de su estudio. Se proponen tres clases fragmentada, intermedia y filamentos, además de

propone una herramienta computacional que apoya en la clasificación de las morfologías

estudiadas. Mas adelante se explicará a fondo la estructura de dicha herramienta. Este

estudio obtiene resultados remarcables y muestra una gran aportación en el estudio de

las morfologías asociadas como biomarcadores para evaluar etapas de diferentes tipos de

cáncer, además remarcan el eficiente uso de la computadora para dicho estudio.

2.1.3. Estudio de parámetros asociados a la dinámica mitocondrial en

cáncer de mama

El estudio presentado en este poster fue publicado en la revista CONACYT con mo-

tivo de la conmemoración de los 45 a nios del Consejo Nacional de Ciencia y Tecnolo-

gía [9]. En este poster la Dra. Paola Maycotte González y su equipo de colaboradores

presentaron un análisis de los parámetros encontrados en la dinámica mitocondrial, se

describe de igual forma la existencia del fenómeno de fusión y fisión y la formación de

Page 38: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 12

redes de mitocondrias, utilizadas también para evaluar los cambios en los niveles de ex-

presión de algunas proteínas relacionadas a la dinámica mitocondrial en bases de datos

de tumores de pacientes, especificamente tomando como estudio los diferentes subtipos

de cancer de mama: (CDIP, DCI y enfermedad fibroquistica no tumoral), realizando ex-

perimentos con tinción mitocondrial empleando Mitotrackter red(Invitrogen). Las líneas

celulares estudiadas fueron BT549, MCF7, MDAMB231, T47D y MCF10A. Dentro del es-

tudio de estas líneas celulares de cáncer de mama, se hace propuesta de cuatro principa-

les tipos de morfologías: (1.-Completamente tubular , 2.-Tubular con algúnos fragmentos,

3.-Fragmentada con algúnos túbulos y 4.- Completamente fragmentada). En las gráficas

mostradas en el estudio se tiene como objetivo obtener los porcentajes de fragmentación

por cada línea celular, sin embargo, el proceso de clasificación de las correspondientes cla-

ses se realizó de forma manual, dejando a un lado el apoyo de una herramienta compu-

tacional para el análisis de las imágenes.

2.2. Análisis de imágenes para el estudio de morfologías

mitocondriales

El análisis de imágenes biomédicas ha tenido un profundo estudio dentro de área de

las ciencias de la computación, empleando tanto algoritmos clasicos de visión por compu-

tadora y algunos otros de aprendizaje máquina, sin embargo el enfoque sobre el caso de

estudio específico de las morfologías mitocondriales en imágenes de células, no ha tenido

Page 39: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 13

un avance considerable dentro del campo de la computación, si bien pareciera ser un pro-

blema de clasificación trivial, se requiere hacer un estudio mas profundo en cuanto análi-

sis de imágenes y sistemas de clasificación. A continuación se cita un trabajo realizado en

el artículo “ Computational imaging reveals mitochondrial morphology as a biomarker

of cancer phenotype and drug response” en donde se propone un script computacional

para el análisis de las morfogías

2.2.1. Árboles de decisión para clasificación de tres tipos de morfolo-

gías

El script desarrollado en el trabajo [13], se basa principalmente en la clasificación de

imágenes de los tres tipos de morfologías mitocondriales propuestos en el artículo. Co-

mo primer punto se seleccionan celulas individuales de forma manual para el análisis

de morfologías, se aplica un algoritmo de tranformación de una escala de grises a bi-

naria, empleando un umbral basado en los siguientes pasos: se emplea un algoritmo de

estructuración en pila basado en “all-in-focus algorithm”, para realizar la separación del

background, a continuación se aplica la transformada rápida de fourier empleada como

un filtro pasa banda y eliminar el ruido contenido en cada imágen, posteriormente se

hace la extracción del foreground (también conocido como región de interés), que corres-

ponde a la umbralización de la imagen de grises en una imagen binaria, para el proceso

de aplicación del umbral se hace uso del algoritmo segmentación por adaptación de um-

bral, extracción de las morfologías concentradas en la forma de la imagen, despues se

registran los indices de formas aplicados en la región de interés, con el objetivo de asociar

Page 40: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 14

FIGURA 2.1: Imágenes del proceso seguido en: Computational imaging re-veals mitochondrial morphology as a biomarker of cancer phenotype and

drug response

cada una las imágenes a una de las tres clases correspondientes. El algoritmo se presenta

como un clasificador supervisado, cuyo entrenamiento y predicción se realiza con árboles

de decisión, el sistema fue implementado bajo el ambiente de cómputo Matlab, se utili-

zó un conjunto de entrenamiento de aproximadamente 1000 imágenes, en este sistema

unicamente se miden los porcentajes de cambios entre lo tres diferentes tipo de morfolo-

gías. La figura 2.1 , muestra una gráfica de los resultados obtenidos a tráves del script

computacional.

En este artículo se grafican algúnos porcentajes de fragmentación, tubulación o formas

intermedias, la imagen 2.2 muestra los resultados obtenidos en diferentes experimentos.

Cabe destacar que dicha clasificación no se realizó utilizando la imagen completa.

Page 41: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 2. Estado del arte 15

FIGURA 2.2: Resultados obtenidos en el artículo reportado en el estado delarte

Page 42: Análisis de la fragmentación mitocondrial en imágenes de
Page 43: Análisis de la fragmentación mitocondrial en imágenes de

17

Capítulo 3

Marco teórico

3.1. Análisis de imágenes

Dentro del campo de visión por computadora se han empleado diferentes tipos de algo-

ritmos para el análisis de las imágenes biomédicas y biológicas, tanto para la eliminación

de ruido, como para procesos de segmentación, transformaciones morfológicas y geo-

métricas. El caso mas estudiado dentro de este campo, es el de imágenes de tomografía

computarizada, para el procesamiento de este grupo de imágenes se toman en cuenta

dos factores principales, la eliminación de ruido y la segmentación en imágenes. Estos

procesos son fundamentales para la caracterización y resultados de la imagen. En este

trabajo se emplearon algoritmos probados en imágenes biomédicas y que han entrega-

do buenos resultados. A continuación se describen a detalle algúnos de los algoritmos

empleados para el tratamiento de las imágenes de morfologías mitocondriales, algúnos

de ellos fueron modificados de acuerdo a las necesidades en el tratamiento de las imáge-

nes de morfología mitocondrial. En resumen, se utilizaron algoritmos de eliminación de

Page 44: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 18

ruido, segmentación y algoritmos de procesamiento morfológico dentro de las primeras

pruebas, posteriormente se emplearon algoritmos de aprendizaje máquina.

3.1.1. Filtros de reducción de ruido

El ruido en una imagen digítal proviene principalmente durante la adquisición y pro-

cesamiento de la señal, este puede ser debido a una mala iluminación dentro del ángulo

de captura del dispositivo y durante el procesamiento de conversión de una señal analó-

gica a digital. Considerando una imagen como una función f (x, y), el análisis del ruido

puede realizarse en el dominio espacial o en el dominio de frecuencia. En el presente

trabajo se emplea el estudio del ruido en espacio, este tipo de ruido se puede clasificar

en diferentes categorias de acuerdo con el comportamiento estadistíco de los niveles de

intensidad de cada uno de los pixeles en una imagen, dentro de los principales tipos de

ruidos se encuentran: ruido Gaussiano, Rayleigh, Erlang, ruido exponencial, ruido unifor-

me, ruido sal y pimienta, entre otros. Existen varios filtros empleados para restauración

de imágenes, dependiendo del comportamiento estadístico, se determina el método de

restauración. A continuación se describen algúnos metódos de eliminación de ruido.

Filtro promedio

Es uno de los métodos mas utilizados para la eliminación de ruido y consiste basica-

mente en reemplazar el valor de un pixel por el promedio de las intensidades de una

Page 45: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 19

vecindad del mismo, formalmente se puede definir como:

f (x, y) = promedio(s,t)∈Sx,y f (s, t) (3.1)

En la ecuacion 3.1, f (s, t) representa la imagen con ruido, y Sx,y, la región dentro de la cual

se consideran los pixeles a promediar, normalmente regiones de 3x3 o 4x4 son aplicadas

en este tipo de filtros.

Filtro Gaussiano

En este tipo de filtrado se emplea usando una distribución dentro de un espacio 2D que

contiene una distribución Gaussiana de forma discreta en terminos del espacio en pixeles,

para lograr eliminar el ruido se realiza una operación convolución entre el espacio 2D

también conocido como kernel y los pixeles que se encuentren dentro del espacio que

ocupa. Se puede decir que un kernel Gaussiano se deriva de la siguiente funcion :

G(x, y) =1

2πσ2 ex2+y2

2σ2 (3.2)

Donde σ es la desviacion estandar y se asume una media de zero, esta función es dis-

cretizada en un kernel de determinados valores, normalmente se aplica una convolución

usando un kernel de 5x5 con una varianza de 1.

Page 46: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 20

3.1.2. Algoritmos de segmentación

Muchos algoritmos tradicionales de procesamiento de imágenes que se emplean en

imágenes biomédicas se aplican sobre escala de grises, sin embargo en algúnos de ellos

se requiere segmentar la imágen para detectar regiones de interés sobre la forma que se

analiza, en otros casos se emplean algoritmos de segmentación para obtener imagenes

binarias (blanco y negro) de imágenes en escala de grises. El problema principal de los al-

goritmos de segmentación es buscar el umbral adecuado para dividir una imagen f (x, y)

en N segmentos dentro del rango de intensidades, dependiendo el número deseado de

segmentación, se emplean determinados algoritmos. A continuación se muestran algunos

algoritmos empleados para encontrar los umbrales adecuados.

Segmentación global

El algortimo mas simple para determinar una segmentación dentro del rango de in-

tensidades en una imágen, es establecer un umbral equivalente a la mitad del rango de

grises, en el cual los valores por debajo del umbral son establecidos en negro y los ni-

veles iguales o mayores en blanco, hablando específicamente de imágenes binarias, sin

embargo en muchas de ellas la distribución de los grupo de intensidades no siempre es

simétrica, dado esto se establece uno de los algoritmos mas utilizados en imágenes bina-

rias, teniendo como objetivo encontrar el mejor umbral. El primer paso para encontrar un

umbral global en un conjunto de pixeles dentro de una imagen se resumen de la siguiente

forma:

Page 47: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 21

1. Seleccionar un umbral t inicial, este puede ser aleatorio

2. Segmentar la imagen usando el umbral para formar dos grupos G1 y G2 donde los

niveles mayores a t pertenecen a G1 y los menores o iguales son G2

3. Obtener el promedio de las intensidades de cada grupo, definidos por m1 y m2

4. Obtener un nuevo umbral t basado en la siguiente formula t = 12(m1 + m2)

5. Repetir el agrupamiento de los pixeles y la obtención del nuevo umbral, la condición

de paro se determina cuando el valor de t tiene un cambio mínimo entre al valor

anterior y el calculado, este cambio se termina de forma análitica

Segmentación Otsu

El algoritmo anterior se enfoca principalmente en obtención de un umbral para imá-

genes binarias, es decir donde solo se necesita un determinado umbral t, sin embargo

existen aplicaciones en donde se requiere hacer una segmentación de imágenes en n gru-

pos o también denominado clases, elegir los umbrales que segmenten correctamente el

conjunto de pixeles en n grupos no es una tarea trivial, el método Otsu [12] ha sido uno

de los algoritmos mas eficientes para este trabajo. Este método consiste en maximizar la

varianza entre clases usando un análisis estadístico, dado el conjunto de niveles de inten-

sidades de los pixeles 0, 1, 2, ...., L− 1 dentro de una imagen de tamaño M×N, se obtiene

un histograma normalizado empleando p1 = niMN , suponiendo una segmentación en dos

grupos, se selecciona un umbral k que se encuentra en0 < k < L − 1, después se ob-

tiene la probabilidad por cada uno de los grupos separados por el umbral. Empleando

Page 48: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 22

estas fórmulas se obtienen los promedios pertenecientes cada una de las clases: Para este

algoritmo se obtiene un promedio global considerando todos los pixeles.

P1(k) =k

∑i=0

pi (3.3)

P2k) =L−1

∑i=k+1

pi (3.4)

m1(k) =1

P1(k)

k

∑i=0

ipi (3.5)

m2(k) =1

P2(k)

L−1

∑i=k+1

ipi (3.6)

mG =L−1

∑i=0

ipi (3.7)

Utilizando estas ecuaciones principalmente se puede obtener la varianza entre clases, de-

finida formalmente como σ2B = P1(k)(m1 −mG)

2 + P2(k)(m2 −mG)2, el objetivo del méto-

do Otsu es encontrar el valor k en el cual la varianza entre clases sea máxima, es decir

σ2B(k∗) = max0≤k≤L−1σ2

B(k), entonces se establece que el este valor de k∗ es el umbral op-

timo de segmentación, este algoritmo puede generalizarse para grupos de n umbrales en

G clases.

Page 49: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 23

3.1.3. Morfología matemática en imágenes biomédicas

Se puede definir a la morfología matemática como aquellos algoritmos basados en teo-

ría de conjuntos, los cuales aplicados en imágenes modifican las propiedades de la ima-

gen como bordes, geometría, o determinadas formas que pueden caracterizar a la imagen

[12]. Estos algoritmos se han empleado teniendo como base a una sub-imagen determina-

da en la literatura llamada elemento estructural, la idea fundamental es realizar operacio-

nes de conjuntos usando el elemento estructural y la imagen deseada. Dichos elementos

estructurales se encuentran ya definidos en la literatura y varian dependiendo el objetivo

a tratar, a continuación se describe uno de los algoritmos de adelgazamiento utilizado en

muchos casos en imágenes médicas.

Algoritmo de adelgazamiento

El objetivo de este algoritmo es obtener una imagen binaria a partir de los bordes o

fronteras de la forma de la imagen, el resultado esperado es la representación de la for-

ma original reduciendo sus bordes hasta llegar al mínimo grosor que se puede obtener

de la forma. Este algoritmo consiste en operar la imagen procesada A con un elemento

estructural B , la operación principal para el algoritmo de adelgazamiento es definida

como: A ⊗ B = A − (A ~ B), donde A ~ B es la operación acierto o fallo la se define

como A ~ B = (A B1)− (A⊕ B2) , basicamente la operación acierto o fallo opera apli-

cando una operación dilatación A sobre el elemento estructural B1 que corresponde al

foreground de la figura (pixeles que definen la forma) menos el resultado de la operación

Page 50: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 24

dilatación de A y B2, donde B2 es el background del elemento estructural.

Tomando como base las formulas anteriores, el algoritmo de adelgazamiento basado

en morfología matemática se define como:

A⊗ B = ((...((A⊗ B1)⊗ B2)...)⊗ BN9 (3.8)

El proceso es aplicar la operación adelgazamiento sobre la imagen A, empleando cada

uno de los elementos estructurales B, esta operación se realiza en n cantidad de veces

hasta que no existan cambios en el resultado obtenido por esta operación. Este algoritmo

permite obtener una representación geométrica de la forma, con un ancho para cada una

de las líneas que lo forman, de un pixel. Este algoritmo se ha implementado en diferentes

aplicaciones como la detección de huella dactilar, análisis de imágenes de retina ocular,

entre otras.

3.2. Medidas en redes complejas

En el contexto de teoría de redes, se ha empleado el término de redes complejas para

denominar a un grafo de determinadas características y cuya principal característica es

la cantidad de nodos que lo conforman, se pueden tomar determinadas varios tipos de

redes como ejemplo de un grafo complejo, por ejemplo la red computadoras conectadas

a internet alrededor del mundo, redes formadas por los enrutadores de las compañias

Page 51: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 25

telefónicas, etc. El comportamiento en este tipo de grafos se determina a partir de un con-

junto de medidas que proporcionan información en cuanto a su estructura, cantidad de

nodos, y la topología formada por ellos, a continuación se determinan algunos conceptos

empleados en las redes complejas o también denominados grafos complejos:

3.2.1. Longitud promedio de la trayectoria

Se define a w como el promedio de pasos a tráves de la distancia(camino mas corto)

de todos los posibles pares de nodos. Donde N es el número total de nodos v y dvivj es la

distancia del nodo vi al nodo vj

w =1

N(N − 1) ∑i 6=j

dvivj (3.9)

3.2.2. Centralidad

Sea dij el camino mas corto posible entre los nodos vi y vj (también conocida como

distancia geodésica). La centralidad x mide la distancia de un nodo, con respecto al nodo

mas cercano.

x =N − 1

∑i 6=j dij(3.10)

Page 52: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 26

3.2.3. Excentricidad

La excentricidad y se define como la máxima distancia geodésica entre los nodos vi y

vj donde i 6= j. En otras palabras es las máxima distancia de todos los pares de nodos.

y = maxNvivj{dvivj} (3.11)

3.2.4. Densidad

Se puede definir a z como el radio de aristas en el grafo G con relación al número

máximo de posibles aristas. Donde N es el número total de nodos en el grafo y E el

número total de aristas.

z =2E

N(N − 1)(3.12)

3.3. Redes neuronales multicapa y algoritmo backpropaga-

tion

Las redes neuronales multicapa se construyen por capas de perceptones, un perceptrón

se define como un modelo computacional que aprende una función lineal de decisión que

divide dos conjuntos separables linealmente. El modelo perceptrón se basa en la siguiente

Page 53: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 27

FIGURA 3.1: Modelo perceptrón

fórmula:

d(x) =n

∑i=1

wixi + wn+1 (3.13)

Los componentes denotados como wi donde i = 1, 2, ..., n, n + 1 son llamados pesos,

modifican las entradas antes de que estas pasen por un umbral establecido, de esta forma

se hace una analogía con las conexiones sinapticas del sistema neuronal del humano. La

función que que establece dicho umbral y procesa la multiplicación de estos valores de

entrada se conoce como función de activación. Cuando el valor de salida de d(x) > 0,

el valor del umbral en el perceptron es 1, indicando que el patrón de entrada se ha re-

conocido que pertenece a la clase w1 y -1 para una clase w2, este modelo de percepton

representado por la ecuación anterior es la representación de un hiperplano n dimensio-

nal en un espacio, geométricamente los primeros n coeficientes establecen la orientación

del hiperplano y el coeficiente wn+1 es proporcionar a la distancia del origen al hiper-

plano.

Page 54: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 28

FIGURA 3.2: Modelo perceptrón multicapa

El objetivo del entrenamiento de un modelo percepton es calcular los valores w que

formen ese hiperplano para poder tener una frontera de decisión de dos clases.

Para la clasificación de dos o mas clases se emplea un modelo percepton multicapa, este

modelo consiste en varias capas de neuronas cada una de ellas tiene el mismo modelo del

perceptron descrito anteriormente, el objetivo de formar una arquitectura com estas es

que se tengan mas valores de w que determinen la clasificación de dos o mas clases.

La figura 3.2 muestra un ejemplo de la arquitectura percepton multicapa:

En este modelo las entradas de cualquier capa es la suma del producto de los pesos w

por la salida de las neuronas anteriores, por ejemplo la capa K denota la capa que precede

a la capa J, la salida de cada nodo en J se define como:

Ij = ∑k=1

wjkOk (3.14)

Page 55: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 29

Donde

Ok = hk(Ik) (3.15)

En este caso hk(Ik) representa la salida de la capa anterior definida por el modelo la

multiplicación de los pesos por las entradas usando también la función de activación:

hj(Ij) =1

1 + e−(∑Nk=1 wjkOk+θj)/θsigma

(3.16)

3.3.1. Entrenamiento por backpropagation

Este algortimo se basa en el error total cuadrático entre la respuesta deseada rq y la

respuesta actual Oq de los nodos de la última capa Q:

EQ =12

NQ

∑q=1

(rq −Oq)2 (3.17)

El objetivo es desarrollar un algortimo de entrenamiento que permita el ajuste de los

parámetros w en cada una de las capas de tal forma que se disminuya el error.

Esto se realiza ajustando los pesos empleando la formula:

∆wqp = −α∂EQ

∂qp(3.18)

Page 56: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 3. Marco teórico 30

Donde P es la capa que precede a Q , ∆wqp es el algoritmo de correción delta [12], α es

el coeficiente de aprendizaje y EQ la función de las salidas Qq que estan en función de las

entradas Iq. Este actulización de pesos permite generar las fronteras de decisión.

El número de neuronas y capas depende del conjunto de datos y número de clases,

existen modelos simples que resuelven problemas de multiples clases, sin embargo el

objetivo siempre es encontrar de forma heurística el modelo mas acertado.

Page 57: Análisis de la fragmentación mitocondrial en imágenes de

31

Capítulo 4

Metodología y experimentos

Dentro del tratamiento de imágenes existen diferentes formas de procesar imágenes

biológicas, sin embargo no existe como tal un camino establecido para reconocimiento

de patrónes, de acuerdo al estado del arte, existen pocos trabajos que han atacado pro-

blemas relacionados a la morfología de mitrocondrias en el estudio del cáncer. Dentro de

esta sección se describen los experimentos realizados para el tratamiento de las imáge-

nes mitocondriales, de acuerdo al estudio realizado por las investigadoras expertas en el

área, existen 3 tipos de clases: (tubulares, fragmentadas con túbulos y fragmentadas ), en

el estudio publicado se tiene la conjetura de la existencia de 4 tipos de morfologías, (tu-

bulares, tubulares con fragmentos, fragmentadas con túbulos y fragmentadas), además se

emplearon imágenes clasificadas por el experto y etiquetadas de acuerdo a la línea celular

pertenenciente. Dentro de este conjunto se utilizaron las siguientes imágenes:

En la figura 4.1 se pueden observar algunas muestra de las imágenes pertenecientes

a cada grupo. Dada su caracterización, descrita en el capítulo 1, es complicado notar la

diferencia de una forma simple, por lo cual nuestro punto de partida es la clasificación

Page 58: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 32

CUADRO 4.1: Conjunto de imágenes disponibles

Clase TotalTubulares 729

Tubulares con fragmentos 428Fragmentadas 321

proporcionada por los expertos.

Se puede observar que en algunas clases el conjunto es mayor que en otras, esto se debe

a que dada la naturaleza del experimento, no es tan común obtener imágenes correspon-

dientes a unas clases. Otros parámetros descritos por los expertos fueron el uso del teñido

en la mitocondria y el reflejo del lente del microscopio, lo cual en algunas imágenes no

permite visualizar de una forma clara a la red mitocondrial. A continuación se describen

las pruebas realizadas en el tratamiento de las imágenes empleandos diferentes técnicas

de procesamiento.

4.1. Clasificación empleando medidas de grafos y clasifica-

ción con k-means

Dentro de este experimento se propone un análisis basado en medidas de grafos y algo-

ritmos tradicionales de procesamiento de imágenes. La figura 4.2 representa el diagrama

de las etapas de procesamiento. Las etapas de este procesamiento se pueden resumir de la

siguiente forma: en la primera etapa se aplican dos algoritmos (segmentación y adelgaza-

miento) con objetivo de mantener la morfología de la red de mitocondrias en la imagen y

tratar a esta morfología como un grafo. En la segunda etapa se obtienen medidas de redes

Page 59: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 33

(A) Completamentetubular

(B) Tubular confragmentos

(C) Completamentefragmentada

FIGURA 4.1: Clases definidas para el proceso de clasificación

Page 60: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 34

1 -Segmentación

y adelga-zamiento

2- Extrac-ción de

características

3-Agrupamiento

FIGURA 4.2: Etapas del método de clasificación emplando un algoritmo nosupervisado

complejas de la morfología obtenida en la etapa previa. Finalmente se define el algoritmo

no supervisado que emplea las medidas obtenidas para utilizar el método K-means.

4.1.1. Segmentación

El objetivo de esta etapa es aplicar un algoritmo que obtenga la región de interés de

la imagen, en la red de mitcondrias. Este procedimiento es aplicado debido a que las

imágenes contienen elementos (pixeles) que corresponden al núcleo de la célula, además

representan parte de la reacción química con la cual se tiñe la red de mitocondrias durante

la captura de la imagen. Este proceso de segmentación se aplica sobre la imagen analiza-

da, podemos definirla como una funcion f (x, y), donde las variables x, y representan la

posición de cada pixel. Dada esta función es posible emplear el método de segmentación

Otsu.

El algoritmo Otsu consiste en obtener umbrales de segmentación dentro de un rango

de intensidades 0-255 utilizando el histograma de la imagen tratada, siendo el número de

umbrales la cantidad de secciones entre las cuales se desea dividir el rango de escala de

grises, para este trabajo se definen dos umbrales t1 y t2 que permiten extraer la geometría

de la red de mitocondrias. La propuesta de tener dos umbrales es agrupar el histograma

de cada imagen en dos conjuntos de tal forma que el grupo de las intensidades mayores

Page 61: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 35

a t2 corresponda a la región de interés, que corresponde a la red mitocondrial.

Para encontrar los umbrales t1 y t2 se obtiene un histograma con las probabilidades de

intensidad de cada nivel en la imagen, estos son separados obteniendo la probabilidad

de tres clases con fronteras establecidas por t1 y t2, con el objetivo de encontrar los valo-

res t1 y t2 para los cuales la varianza de cada una de las tres clases es la máxima, estos

umbrales definen la segmentación de las intensidades en el rango 0-255. En la ecuación

4.1 se muestra la función obtenida después de aplicar los umbrales encontrados usando

el método Otsu, esta nueva imagen g(x, y) contiene solo la geometría de la red en una

escala binaria.

g(x, y) =

0 f (x, y) < t1

0 t1 ≤ f (x, y) ≤ t2

1 f (x, y) > t2

(4.1)

En la figura 4.3 muestra la imagen obtenida despues de aplicar el proceso de seg-

mentación Otsu, la región de interés se define en la imagen con el nivel de intensidad

blanco(255) y la región azul representa el grupo de intensidades entre t1 y t2, que serán

descartadas dentro de la extracción de características y procesamiento de la imagen. En

resumen solo la sección de color blanco se utilizará para aplicar los posteriores algorit-

mos.

Page 62: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 36

(A) Imagen en esca-la de grises f(x,y).

(B) Imagen g(x,y)obtenida mediante

método Otsu

FIGURA 4.3: Resultado del proceso de segmentación, en la parte izquierdase muestra la imagen de entrada(escala de grises), mientras que en la parte

derecha se muestra el resultado de aplicar el método Otsu

4.1.2. Adelgazamiento

Previo a la extracción de características se emplea un algoritmo de adelgazamiento de

la morfología de la imagen. El objetivo de este proceso es realizar el adelgazamiento de

la imagen binaria, manteniendo la morfología pero representando dicha morfología con

el mínimo ancho en cada una de sus formas, de esta manera se podra tratar el resultado

de este algoritmo como un grafo, manteniendo las partes conexas y representando a cada

uno de los pixeles como un vertice y la conexión entre ellos como aristas.

El método de adelgazamiento utilizado se basa en la morfología matemática aplicada

en imágenes, este tipo de morfología consiste en definir una imagen como un conjunto

de elementos(pixeles) y aplicar determinadas operaciones utilizando conjuntos estable-

cidos, estos conjuntos establecidos son llamados elementos estructurales, los cuales se

Page 63: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 37

encuentran ya definidos en la literatura. El algoritmo consiste en realizar una operación

denominada acierto ó fallo g(x, y)⊗ b utilizando ocho elementos estructurales b, esta ope-

ración acierto o fallo se aplica sobre la imagen utilizando cada uno de los ocho elementos

estructurales, y aplicando la operación sobre el resultado de operar el elemento n − 1

sobre la imagen, tal como se define en la ecuación 4.

h(x, y) = (..((g(x, y)⊗ b1)⊗ b2...⊗ b8) (4.2)

Donde g(x, y) es la imagen obtenida en la etapa de y {b1...b8)} son los conjuntos o elemen-

tos estructurales que operan sobre la imagen, permitiendo obtener un adelgazamiento de

la geometría sin afectar sus propiedades conexas. En la figura 4.4 se muestra la imagen

h(x, y) obtenida a apartir de g(x, y), geometría que determina el grafo que representa a la

red de mitocondrias en la imagen.

En esta imagen se puede apreciar que se mantiene la geometría de la región de inte-

rés establecida por el método Otsu, existe un algortimo que obtiene un esqueleto de la

imagen, él cual entrega una forma similar a la obtenida en esta proceso, sin embargo el

algortimo de adelgazamiento preserva la totalidad de la geometría de la imagen, mien-

tras que el método de obtener esqueleto, solo preserva una parte de la geometría de la

imagen.

Page 64: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 38

(A) Imagen seg-mentada f(x,y)

(B) Imagen h(x,y)obtenida despuésde algoritmo de

adelgazamiento

FIGURA 4.4: Resultado de aplicar el algoritmo de adelgazamiento, la imagenque se emplea para ser procesada es resultado de la segmentación aplicada

en el processo anterior

4.1.3. Extracción de características

Debido a que la clasificación realizada por los expertos se realiza de forma supervisada

y con base en su experiencia, no tenemos definidas características computacionales que

permitan caracterizar a la imagen, dado esto es necesario encontrar dicha caracterización

de una forma computacional. En esta etapa se propone un conjunto de características que

puedan definir a la morfología de la red mitocondrial, estas propiedades son normal-

mente aplicadas a redes complejas, que topológicamente son grafos de miles o millones

de nodos y vertices, con estas características se pretende establecer una diferencia cuanti-

tativa en cada grupo de imágenes, con el objetivo de poder implementar algún algoritmo

de clasificación en aprendizaje máquina.

Las medidas propuestas se obtienen estableciendo un nodo v como la unidad mínima

Page 65: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 39

dentro de la imagen(pixel), por otro lado las adyacencias de v con sus pixeles vecinos

se definidas como las aristas e, un nodo v dentro de la imagen se toma en cuenta si el

valor del pixel es igual al nivel de intensidad blanco en escala binaria. A continuación

se emncionan las características utilizadas en cada una de las imágenes, las cuales se

describen en la introducción:

1. Longitud promedio de la trayectoria

2. Centralidad

3. Excentricidad

4. Densidad

Estas medidas fueron obtenidas por cada uno de los grafos generados por el algoritmo

de adelgazamiento, cabe mencionar que en un grafo(imagen) puede ser completamente

conectado o no, lo cual puede involucrar mayor cantidad de subgrafos, el escalar que se

obtiene es el resultado de promediar cada una de las medidas obtenidas en cada subgrafo.

4.1.4. Clasificación utilizando algoritmo K-means

En este experimento se aplicó el algoritmo de clasficación no supervisada k-means ,

teniendo en cuenta que antes de contar con el conjunto de imágenes total, se realizaron

las pruebas con 30 imágenes, por lo tanto se utilizó para encontrar una posible caracte-

rización con las medidas de redes complejas, para realizar esto se asigna el valor escalar

obtenido en cada características w , x y z a un vector de cuatro dimensiones (w, x, y, z)

Page 66: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 40

por cada imagen, posteriormente se definen cuatro grupos correspondientes a los tipos

de morfologías definidas[1], después se aplica el algoritmo K-means para establecer el

agrupamiento de las cuatro clases. La ecuación 4.3 muestra la terminología establecida

para el algoritmo [8].

I(w, x, y, z) Vector imagen

mk centroide del cluster k

rnk Elemento rnasignado al cluster k

Xn Vector X de la imagen n

J Distancia de los vectores del grupo k respecto a su centroide

(4.3)

Una vez establecido el vector (w, x, y, z) , el algoritmo busca minimizar el error J de-

terminado por la suma de las distancias euclideanas de los vectores r con respecto al

centroide mk, pertenecientes a la clase k, obtiendo cada uno de los centroides por cada

iteración, hasta que el error total sea menor a una condición de paro establecida, de es-

ta forma se obtienen los cuatro grupos de imágenes que corresponden a los cuatro tipos

de morfología (completamente tubular, tubular con fragmentos, fragmentada con túbu-

los, completamente fragmentada). El valor de K se define con referencia al número de

conjuntos entre los cuales se desea dividir el conjunto de datos. La condición de paro en

el error se define como 0.001 de forma computacional, esto permite la convergencia del

algortimo.

Page 67: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 41

algoritmo 1 Proceso de clasificación

1: while J >error2: for 1 to N

3: rnk =

{1 k = min||xn −mk||2

0 otro

4: mk =∑N rnkxn

∑N rnk

5: J = ∑Nn=1 ∑K

k=1 ||xn −mk||26: end for7: end while

4.1.5. Análisis de resultados del experimento anterior

Dentro de esta sección se describen los resultados obtenidos en este primer algoritmo,

realizando la colaboración con las biologas investigadoras, se recibió información de la

sospecha de tener posiblemente cuatro clases de imágenes, en este primer experimento

se busca explorar los resultados separando el conjunto de datos en cuatro. Se utilizó un

conjunto de 30 imágenes prueba correspondientes a los tipos de morfología de las re-

des mitocondriales, este conjunto fue clasificado por el expertos en el área despues de

presentar los resultados obtenidos por el algoritmo de clasificación k-means. Para pro-

bar la eficiencia del clasificador y obtener algunas medidas de calidad (exactitud, error,

sensibilidad, especificidad) se implementó el algoritmo y se compararon los resultados

contra los resultados asignados por el experto: 5 completamente tubulares, 8 tubulares

con fragmentos, 10 fragmentadas con túbulos y 7 fragmentadas, con estos datos se cal-

culó la matriz de confusión mostrada en la tabla 4.2 . Las filas de la tabla representan

la clase a la cual pertenece la imagen, y las columnas representan la clase a la cual fue

asignada la imagen por el clasificador. De esta forma se puede obtener el porcentaje de

aciertos y fallas del conjunto de prueba.

Page 68: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 42

. Tubular Tubular confragmentos

Fragmentadacon túbulos

Fragmentada

Tubular 3 4 1 1

Tubular confragmentos

2 2 1 0

Fragmentadacon túbulos

1 4 6 0

Fragmentada 0 2 0 3

CUADRO 4.2: Matriz de confusión

En esta matriz de confusión, se puede visualizar en donde se encuentra acumulado la

mayor cantidad de aciertos y fallos. Por ejemplo en la clase 1 (Completamente tubular) y

la clase 4 (Fragmentadas) se obtienen los mejores resultados de clasificación obteniendo

mayor número de aciertos. Por otro lado se observa que el mayor porcentaje de fallo en

la clasificación se deriva de las clases 2 (Tubular con fragmentos) y 3 (Fragmentada con

túbulos).

Exactitud : 46,66 % (4.4)

El mayor porcentaje de aciertos corresponde a las clases 1 y 4, esto es debido a que al-

gunas de las medidas propuestas aplicadas en el grafo de la morfología presentan una

diferencia notable las medidas propuestas, sin embargo las medidas como excentricidad,

centralidad y longitud promedio, son vulnerables a escalabilidad en la imagen, lo que

provoca una disminución o aumento en la magnitud obtenida, factor que influye en el

porcentaje de aciertos.

Error : 43,33 % (4.5)

Page 69: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 43

El mayor porcentaje de error es obtenido en la clasificación de grupos intermedios (2 y

3), debido a que presentan similitudes en las medidas propuestas, en estas circunstancias,

el algoritmo de agrupamiento juega un factor importante, pues al aplicar el algoritmo

K-means no se obtienen los clusters y el error no disminuye.

Especi f icidad : 34,09 % (4.6)

Este porcentaje se obtuvo debido a la incorrecta clasificación en las clases intermedias

(2 y 3), las magnitudes en los escalares obtenidos para las características en estas clases,

no presentan diferencia notable, por lo tanto un elemento puede ser mal clasificado con

una mayor probabilidad.

Las medidas propuestas para la caracterización de las redes mitocondriales muestran

discrepancia entre clases de i mágenes usando un entrenamiento supervisado. Sin embar-

go se desea que el error obtenido disminuya con el objetivo de arrojar mejores resultados

en los estudios realizados. Las propiedades empleadas para la obtención de característi-

cas son vulnerables a factores como escalabilidad en la imagen, tiempo de procesamiento

y rotación, un ejemplo de esta afectación es la distancia entre pares de nodos, cuya magni-

tud puede ser afectada por escalabilidad o rotación de la imagen. Debido a estos factores,

en los experimentos posteriores se implementa un aprendizaje supervisado, en el cual los

factores de afectación descritos, no jueguen un papel importante en el proceso de clasifica-

ción, además se pueda entrenar al sistema con una conjunto determinado para aumentar

el porcentaje de exactitud y disminuir el error.

Page 70: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 44

4.2. Análisis empleando redes neuronales convolucionales

En la sección anterior se describe el uso de uno de tantos algoritmos basados en apren-

dizaje no supervisado, sin embargo después de realizar los experimentos descritos an-

teriormente, se empleó un conjunto mayor para el tratamiento de las imágenes mito-

condriales, con este conjunto el siguiente paso que se propuso es utilizar algoritmos de

aprendizaje máquina de forma supervisada, es decir dado el conjunto clasificado de for-

ma manual por los investigadores, se busca proponer un entrenamiento que utilice dichos

datos y se pueda obtener resultados de forma favorable. Las redes neuronales son muy

similares a una red neuronal traidicional (percepton multicapa) [5]. El objetivo es tener

un conjunto de neuronas conectadas con pesos y bias, cada neurona recibe una entrada y

realiza un producto punto, seguida por el procesamiento de una funcion que actua sobre

el resultado de dicho producto punto. De forma general la red completa representa una

función estadistica con una función de perdida. La principal ventaja de una red convo-

lucional es que la mayoria de estos modelos se emplean para el tratamiento de imágenes

pues se basan en la operación convolución, en la cual se define un kernel y una función

de entrada que puede ser representada como una imagen, el resultado de aplicar una

convolución entre la imagen y el kernel se denomina mapa de características [12]. A con-

tinuación se describe la aplicación de una red neuronal al uso de las imágenes de redes

de mitocondrias.

Page 71: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 45

FIGURA 4.5: Operación convolución empleada sobre la imagen de entrada

4.2.1. Convolución

En esta operación se define como la entrada a nuestra imagen que se usa dentro del

proceso de entrenamiento, esta puede ser una imagen binaria o en escala de grises, la

operación convolución se define por siguiente equación:

S(i, j) = ∑ ∑ h(i−m, j−m)K(m, n) (4.7)

Donde h es la función que se obtiene como resultado del proceso de adelgazamiento des-

crito en la sección anterior, y K es el kernel con el cual se efectua la operación convolución,

en la figura 4.5 se muestra un ejemplo de como se efectua esa operación

Page 72: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 46

4.2.2. Función de activación

Una función de activación es aplicada a cada uno de los pixeles resultados de la ope-

ración de convolución y opera la función de activación empleada en la red convolucional

es conocida como RELU, la cual se define de la siguiente forma para cada valor de la

imagen:

f (x) = max(0, x) (4.8)

Esta función elimina todos lo valores negativos resultados del proceso de convolución y

preserva solo aquellos valores mayores a cero. Esto se puede ver reflejado en establecer

lo valores de pixeles en un rango dentro de la escala que se esté manejando, las imágenes

utilizadas actuan sobre 0-255.

4.2.3. Función Submuestreo

Se aplica después de la función de activación, se emplea para reducir la cantidad de

parámetros que serán procesados durante la etapa de aprendizaje, consiste en aplicar un

filtro de 2× 2 descartando el 75 % de las las activaciones en cada pixel, este proceso se

realiza tomando unicamente el promedio sobre la región que cubre el filtro. También se

puede realizar aplicando un promedio de los pixeles contenidos en la región.

Page 73: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 47

FIGURA 4.6: Función de pooling en donde se descarta el 75 porciento de lospixeles contenidos en una cierta región

FIGURA 4.7: Arquitectura implementada para la clasificación de las imáge-nes, se emplea un modelos con dos capas convolucionales, cada una con susfunciones de activación y pooling, posteriormente se procesan estan capas en

un modelo completamente conectado

4.2.4. Capa completamente conectada

Una vez que se reducen la cantidad de parámetros establecidos por las capas anterio-

res, se establece una conexión entre cada uno de ellos hacia un conjunto de neuronas

establecidas para el algoritmo de entrenamiento, normalmente se emplea una arquitec-

tura multicapa percepton. La figura 4.7 muestra una representación de la arquitectura

utilizada para el entrenamiento supervisado de las imágenes de redes mitocondriales,

empleando el algoritmo backpropagation [12].

Se emplea esta arquitectura [4] para realizar la clasificación de las imágenes disponi-

bles, para el caso de la capa completamente conectada se define a cada una las imágenes

Page 74: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 48

que desde al proceso de convolución hasta la última capa como la siguiente función:

yi = f (∑(xiwi)) (4.9)

Donde xi es la salida de las neuronas en la capa anterior y wi es el parámetro de cone-

xión entre las neuronas de la capa anterior y la neurona de la última capa [2]. El objetivo

es minimizar el error para un valor de referencia o también conocido como etiqueta, este

valor será el resultado de procesar la imagen de entrenamiento en la arquitectura pro-

puesta, de esta forma se pude calcular la función de error como:

MSE =1n

n

∑i=1

(yi − yi) (4.10)

4.2.5. Entrenamiento

Se empleo en algoritmo de entrenamiento backpropagation utilizando las 1380 image-

nes de entrenamiento. En la siguiente tabla se muestran los datos empleados durante el

proceso de entrenamiento.

Parámetros de la red (conexiones entre neuronas) 31250Imágenes usadas para el entrenamiento 1380)

Imágenes usadas para prueba 98Precisión obtenida en el entrenamiento 0.56

CUADRO 4.3: Datos empleados para entrenamiento

Se emplearon 122 imágenes de prueba para 3 clases y 162 para 4, estas imágenes no

Page 75: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 49

Capa DescripciónConvolucion 1 10 kernel 3x3Función relu 2 –

Función maxpooling 1 región de 2x2Convolucion 2 5 kernel 3x3Función relu 2 –

Función maxpooling 2 región de 2x2Capa completamente conectada 1 30Capa completamente conectada 2 4

CUADRO 4.4: Arquitectura de la red

(A) Imagen binaria (B) Escala de grises

FIGURA 4.8: Diferencia entre imagen binaria y escala de grises

fueron consideradas dentro de la etapa de entrenamiento, la tabla muestra los porcenta-

jes de clasificación durante la etapa de prueba: El procesamiento de imágenes empleando

redes neuronales puede ser determinado usando cada imagen en escala de grises, binaria

o en un rango rgb. En este experimento se propone el uso de redes neuronales utilizando

el conjunto de imágenes sin aplicar ningun tipo de procesamiento, es decir en escala de

grises, el conjunto de entrenamiento consta de la misma cantidad de imágenes y el mis-

mo tipo de arquitectura. En la figura 4.8 se muestra un ejemplo de la diferencia de las

imágenes en escala de grises y las imágenes obtenidas en en el experimento anterior.

.

Page 76: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 50

4.2.6. Resultados

Las siguientes tablas de confusión muestra los resultados después de entrenar el mo-

delo de redes neuronales convolucionales usando la misma arquitectura empleando 3 y 4

clases usando las imágenes en escala de grises.

3 clases

CUADRO 4.5: Matriz de confusión método clasificación redes neuronales

Actual \Predicho Tubular Fragmentada contúbulos

Fragmentada Total Sensibilidad

Tubular 35 5 2 42 0.8095Fragmentada contúbuloss

20 17 3 40 0.4250

Fragmentada 13 8 20 40 0.5000Total 68 30 25 . .

Precisión 0.5147 0.5666 0.76.82 . .

Exactitud : 59,01 % (4.11)

4 clases

CUADRO 4.6: Matriz de confusión método clasificación redes neuronales

Actual \Predicho TubularTubular confragmentos

Fragmentadacon túbulos

Fragmentada Total Sensibilidad

Tubular 32 8 2 0 42 0.7619Tubular confragmentos 2 25 5 8 40 0.625

Fragmentada contúbulos

2 12 20 4 40 0.5000

Fragmentada 0 12 4 24 40 0.600’0Total 36 57 31 36 . .

Precisión 0.888 0.4385 0.8064 0.666 . .

Exactitud : 62,34 % (4.12)

Page 77: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 51

4.3. Análisis por segmentación usando algoritmo K-means

En esta sección se presenta otro procedimiento se clasificación, en uno de los experi-

mentos anteriores se implementó el algoritmo de segmentación Otsu, después se realiza

el algoritmo de adelgazamiento y la extracción de características. En este experimento

proponemos una segmentación mediante un algoritmo de clusterización, después se em-

plea el uso de redes neuronales convolucionales para clasificar cada una de las regiones

segmentadas, finalmente se obtienen los porcentajes de clasificación que se emplean co-

mo medidas de clasificación en el algoritmo centroide mas cercano [3]. La figura 4.15

muestra el diagrama de los procesos aplicados en esta clasificación.

Page 78: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 52

1 -Segmentaciónpor algoritmo

k-means

2- Clasi-ficación

de objetosusando redes

neuronales

3-Entrenamientoy clasificación

usandocentroide

mas cercano

FIGURA 4.9: Análisis y clasificación basado en K-means y redes neuronales

4.3.1. Algoritmo de segmentación basado en k-means

En este proceso se propone el uso de las intensidades como una distribución de datos

X sobre un espacio p dimensional, este conjunto será agrupado en n diferentes grupos

usando el algoritmo k-means, el reto en este tipo de algoritmos es encontrar el número n

para el total de grupos, para ello se emplea el método Elbow.

Este método se basa principalmente en medir el error a partir de la aplicación del méto-

do k-means en diferentes números de clusters, (desde 2 a N clusters), este error se puede

definir como la suma del valor absoluto de las distancia de los puntes de cada elemento

de los cluster a su centroide.

Error =N

∑i=0

xi − µ2 (4.13)

Este error se calcula en un rango determinado de clusters y el objetivo es buscar el valor

de n para el cual exista un cambio brusco en la distorción. De esta forma se tomará a ese

valor de n para después aplicar el método k-means y se realizará la segmentación de la

imagen en n grupos de intensidades.

Page 79: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 53

(A) Gráfica métodoElbow

(B) Imagen dividaen tres clusters

FIGURA 4.10: Segmentación basada en método elbow utilizada para localizarregiones de interés

La figura 4.10 muestra un ejemplo de una imagen segmenta en tres grupos de intensi-

dades, aplicando el método elbow podemos observar que un valor para k es 3.

La imagen de la izquierda representa la grafica de los valores de distorción para cada

valor de clusters n, tomando como referencia el algoritmo k-means todos los pixeles ma-

yores a 0 dentro de nuestro rango de intensidades serán considerados como el conjunto

X, en este ejemplo se realiza una prueba con valores de n desde 1 hasta hasta 10, dando

como resultado un valor de 3 para k, en la imagen de la derecha se realiza el proceso de

segmentación de una de las imágenes de morfologías mitocondriales, la región roja re-

presenta el grupo de las intensidades con valores menores , la región azul representa el

grupo de intensidades altas y la región verde las intensidades menores al grupo azul y

mayores al grupo rojo.

Como se mencionó anteriormente, el punto en el que se observa graficamente una geo-

metría similar a la de un codo, determina el número de grupos en el algoritmo. En la 4.11

Page 80: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 54

(A) Completamentetubular

(B) Fragmentada contúbulos

(C) Completamentefragmentada

FIGURA 4.11: Segmentación por k-means aplicada en cada uno de las imáge-nes

figura se muestran algunos resultados obtenidos en los tipos de morfologías analizadas.

Este proceso determina automaticamente el número de cluster empleando el método

elbow, en la mayoría de imágenes el número de clusters determinado es 3, los cuales se

han representado con diferentes colores dentro de las imágenes.

Page 81: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 55

4.3.2. Identificación de objetos usando búsqueda a lo ancho en grafos

Una vez que se ha llevado acabo el proceso de segmentación usando el método k-

means, se emplea un algoritmo basado en búsqueda a lo ancho para identificar cada uno

de los objetos dentro las imágenes y tratarlo como un objeto separado para su recono-

cimiento [11] . Este algoritmo considera a la imagen previamente segmentada como un

grafo G, donde cada pixel representa un nodo u, donde U es el número total de pixeles

dentro de la imagen, y se consideran vertices v a todos aquellos pares de nodos que pue-

dan formarse tomando la vecindad del pixel u . Tomando estas definiciones se emplea un

algortimo de búsqueda a lo ancho, este algoritmo funciona de la siguiente manera:

algoritmo 2 Algoritmo región de segmentación de objetos1: for i = 1 to U do

2: if u !=visitado then

3: u=raíz

4: agregar u a lista L

5: K es la lista con el objeto detectado

6: while Lista != vacia do

7: obtener primer elemento de la lista u y sus vecinos N

8: for j = 1 to N do

9: if j !=visitado then

10: marcar j como visitado y agregar al final de L

11: agregar j a K

12: remover K del grafo

Page 82: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 56

(A) Grafo incial (B) Objeto etiquetado

FIGURA 4.12: Proceso de separación de formas empleando el algoritmo debúsqueda a lo ancho

El algoritmo previo se aplica a cada grupo obtenido a tráves del método de clusteriza-

ción, excepto aquel grupo de intensidades que contengan el menor rango de intensidades.

De esta forma se puden obtener todos los objetos definidos por cada grupo de intensida-

des, con el objetivo de realizar un análisis mas detallado en la imagen y poder reconocer

la forma de cada objeto. La figura 4.12 muestra un ejemplo de un grupo de intesidades,

y el objeto que es extraído empleando el algoritmo basado en árbol de expansión.

4.3.3. Identificación de regiones fragmentadas y tubulares usando re-

des neuronales

El objetivo de separar los clusters de intensidades es identificar formas mas detalla-

damente, las imágenes de redes mitocondriales se definen por túbulos o fragmentos, se

Page 83: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 57

(A)Túbulos

(B) Frag-mentoscontúbulos

(C) Frag-mentos

FIGURA 4.13: Ejemplos de imágenes para entrenamiento

hace uso de redes neuronales convolucionales para extraer características que definan a

los objetos segmentados y permitan realizar una clasificación con base en el porcentaje

de fragmentación en la imagen. El objetivo es clasificar cada uno de los objetos en dos

categorias, esto implica enfocarse en determinar si el objeto corresponde a un túbulo o a

una mitocondria. Para esta clasificación de utilizó un modelo de redes neuronales convo-

lucionales, tomando imágenes de 80x80 como entrada, estas imágenes fueron extraídas

Se obtuvo una imagen de 80x80 por cada objeto separado en el grupo del cluster, des-

pués se realizó el entrenamiento de un modelo de red convolucional similar al empleado

en el experimento de la sección anterior. La tabla 4.7 muestra la descripción de los datos

de entrenamiento y pruebas realizadas con el modelo, podemos observar que se obtiene

una alta precisión en distinción de formas, es decir ya no se realiza un reconocimiento

de formas de la imagen completa, en vez de eso, se realiza el proceso de segmentación,

se extraen los objetos contenidos en las diferentes secciones de segmentación y se realiza

una clasificación basada en el porcentaje de fragmentación obtenido en cada imagen.

Page 84: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 58

CUADRO 4.7: Parámetros de la red de entrenamiento

Parámetros de la red 31250Imágenes usadas para el entrenamiento 4525

Imágenes usadas para prueba 89Filtros de convolución por capa 10

Número total de parámetros 52673Exactitud en entrenamiento 91.883 %

Exactitud en prueba 92.89 %

El proceso de clasificación se puede resumir en los siguientes pasos:

1. Segmentar las intensidades del histograma en 3 grupos usando el método k-means

2. Separar cada uno de los objetos en cada grupo de intensidades, empleando el algo-

ritmo de busqueda a lo ancho

3. Clasificar cada uno de los objetos empleando el modelo de redes convolucionales

4. Obtener el porcentaje de fragmentación y entrenar el algoritmo empleando el cen-

troide mas cercano

4.3.4. Entrenamiento y clasificación usando método de centroide mas

cercano

En este algoritmo [7] se considera un espacio de n dimensiones el cual es dividido en

k cantidad de grupos, estos grupos determinan el número de clases establecidas por el

entrenamiento supervisado, se obtiene el centroide para cada conjunto de entrenamiento

(~x1, y1), . . . , (~xn, yn) donde xi, ..xn son el conjunto de vectores de entrenamiento y yi ∈ Y

las etiquetas de la clase a la cual corresponde cada uno de los vectores de entrenamiento,

Page 85: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 59

FIGURA 4.14: Clasificación basada en porcentaje de fragmentación, las re-giones de color rojo representan los objetos que fueron identificados comofragmentos y las regiones de color azul aquellos que se identificaron como

regiones túbulares

teniendo esta información se calcula el centroide de cada uno de las clases establecidas

empleando la siguiente formúla: ~µl =1|Cl | ∑

i∈Cl

~xi donde Cl son los indices de las muestras

pertenecientes a cada conjunto de datos. Los vectores x corresponden al porcentaje de

fragmentación y porcentaje de tubulación obtenido en cada unas de las imágenes, defi-

niendo x = p f , pt.

Dado un vector de prueba xl este es clasificado tomando la distancia mas cercana a

cualquiera de los centroides calculados ~x ,

y = arg mınl∈Y‖~µl −~x‖. (4.14)

Page 86: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 60

Estos niveles de fragmentación se emplearon para usar el método de centroide mas cer-

cano, sin embargo con base en la clasificación que ellas realizan, estos valores son apro-

ximados a una determinada cantidad en el porcentaje de fragmentación y de túbulos,

sin embargo en este experimento se tomó esta tabla como referencia a la clasificación. En

4.14 , se visualiza un ejemplo del procesamiento de una imagen, las regiones de color rojo

ejemplifican los objetos que se han detectado como regiones fragmentadas, por el otro

lado las regiones de color blanco son regiones que se han marcado como túbulos.

Este algoritmo ha sido aplicado al conjunto de imágenes de prueba, la tabla 4.8 muestra

la matriz de confusión obtenida como resultado del proceso de evaluación, se pueden

observar una mayor imprecisión entre la clases tubulares y tubulares con fragmentos.

CUADRO 4.8: Matriz de confusión método clasificación por k-means y redesneuronales

Actual \Predicho Tubular Fragmentada con tú-bulos

Fragmentada Total Sensibilidad

Tubular 28 13 1 42 0.6666Fragmentada con tú-bulos

13 18 9 40 0.4500

Fragmentada 5 10 25 24 0.6250Totalll 46 41 35 . .

Precisiónl 0.6086 0.4390 0.7142 . .

Exactitud : 58,88 % (4.15)

4 clases

Exactitud : 55,57 % (4.16)

Page 87: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 61

CUADRO 4.9: Matriz de confusión método clasificación por k-means y redesneuronales

Actual \Predicho TubularTubular confragmentos

Fragmentadacon túbulos

Fragmentada Total Sensibilidad

Tubular 30 6 6 0 42 0.7500Tubular confragmentos 2 20 15 3 40 0.5000

Fragmentada contúbulos

5 9 15 11 40 0.375

Fragmentada 2 3 10 25 40 0.625Total 39 38 46 39 . .

Precisión 0.7631 0.4000 0.5714 26 0.6538 .

4.4. Método de clasificación usando detección de bordes y

medidas de grafos complejos

La mayoría de los métodos empleados en las secciones anteriores se basan en algorit-

mos de segmentación que pasan de una escala de grises a una imagen binaria, empleando

algoritmo como método Otsu y k-means, dichos algoritmos segmentan regiones específi-

cas de interés, por lo cual la forma analizada es resultado del algoritmo de segmentación,

para después aplicar cualquier tipo de algoritmo de reconocimiento de formas.

En esta sección se propone realizar un algoritmo de clasificación basada en la detección

de bordes, de esta manera se intenta representar la forma de la red mitocondrial usando el

algoritmo canny para extraer los bordes de la red mitocondrial y aplicar medidas de gra-

fos en redes complejas. Después de extraer las características de propone una algoritmo

basado en árboles de decisión.

Page 88: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 62

1 -Extracciónde bordes

usandoalgoritmo

canny

2- Extracciónde caracterís-ticas(medidas

de grafosy entropia)

3.-Entrenamientoy clasificación

usandoalgoritmocentroide

mas cercano

FIGURA 4.15: Análisis y clasificación basado en K-means y redes neuronales

4.4.1. Extracción de bordes

La extracción de bordes puede se realiza a tráves del algoritmo canny, este algortimo se

basa en los siguientes pasos:

1. Aplicación de un filtro Gauss

Dada la imagen en escala de grises f (x, y) y G(x, y) la función:

G(x, y) = e−x2+y2

2σ2 (4.17)

Se aplica una operación convolución entre las dos funciones para obtener una terce-

ra función:

fs(x, y) = G(x, y) ∗ f (x, y) (4.18)

2. Magnitud del gradiente

Después se calcula la magnitud del gradiente y dirección usando las formúlas M(x, y) =√g2x + g2y y α(x, y) = tan−1 gy

gx , donde gx gy son las derivadas parciales de la fun-

ción fs.

Page 89: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 63

3. Método de supresión

Una vez que se han aplicado estas operaciones se lleva a cabo el método de supre-

sión no máxima en el cual se especifican el número de orientaciones discretas de uno

de los vectores gradientes, por ejemplo en una región de 3x3 se define una orienta-

ción y un ángulo pasando por el centro de la región, de esta forma se determina la

dirección del borde dk mas cercana a α(x, y), si el valor de M(x, y) es menor que al

menos dos de sus vecinos gN(x, y) = 0, de otra forma gN(x, y) = M(x, y).

4. Aplicación de umbral para definicion de bordes

Finalmente se aplica un umbral a gN(x, y) para recudir aquellos bordes que se de-

tecten como falsos bordes, esto significa que los valores menores al umbral se esta-

blecen en 0.

La figura 4.16 muestra los resultados de aplicar el algoritmo canny a los cuatro tipos

de morfologías:

4.4.2. Extracción de características

El resultado del proceso de adelgazamiento se emplea para extraer algunas caracte-

rísticas previamente usadas en el tratamiento de la imagen como un grafo, sin embargo

algunas de ellas se descartan, debido a que no mostraban alguna posible caracterización

en la geometría de la imagen. Por otro lado también se hace uso de otra medida de carac-

terización que solo se obtiene a partir de una matriz de co-ocurrencia, la cual se calcula

usando la imagen en escala de grises.

Page 90: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 64

FIGURA 4.16: Proceso de detección de bordes mediante algoritmo Canny

Las medidas empleadas para la caracterización en este algoritmo son las siguientes:

1. Promedio de la longitud del camino mas corto Esta medida también usada previa-

mente se aplica a cada uno de los subgrafos definidos en el grafo obtenido después

de aplicar el algoritmo de adelgazamiento, se define por la formula:

q = ∑s,t∈V

d(s, t)n(n− 1)

(4.19)

Donde V es el conjunto de nodos del grafo, d(s, t) es la distancia mas corta de s a t,

n es el total de nodos en el grafo. En el caso de las imagenes el peso en un vertice

esta definido como la distancia o costo, en este caso es 1 para todos los vertices en

nuestra imagen. Para obtener un escalar usando esta medida se realiza un promedio

de las medidas obtenidas en cada subgrafo.

Page 91: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 65

En la siguiente tabla 4.10 se muestran algunos resultados obtenidos en al procesar

las imágenes y calcular la medida propuesta:

CUADRO 4.10: Resultado de aplicar longitud del camino mas corto

TubularTubular confragmentos

Fragmentada contúbulos

Fragmentada

9.093333333 9.352112676 9.375 12.434782619.563636364 10.92307692 12.29787234 12.271186449.595959596 15.48837209 10.97674419 10.6486486511.74545455 9.255319149 12.56 8.3195876298.886792453 9.592417062 13.44186047 13.042553199.136363636 9.917808219 12.16949153 10.37511.68965517 12.02222222 9.418803419 10.877551028.480620155 10.21428571 9.243801653 12.59.388888889 8.612244898 10.32876712 13.3170731710.42446043 12.4 12.14285714 11.686274519.433962264 12.63768116 13.05405405 12.3428571410.23287671 11.29508197 12.64705882 9.411764706

9.47 10.20689655 11.83606557 11.4358974410.6875 12.82142857 12.39393939 10.53921569

13.85185185 11.15 11.05128205 9.7159090918.578947368 11.22608696 15.05 13.437510.32352941 13.69811321 11.37096774 12.14285714

9.7 14.39130435 13.81481481 12.210526328.987179487 10.69491525 12.41666667 13.903225819.931818182 10.44705882 9.633333333 9.941176471

2. Número de subgrafos dentro del grafo w

En esta medida se propone determinar el número de subgrafos que se encuentran

dentro de la imagen G, de esta forma podemos definir al numero de subgrafos

g1, g2, ..gn ∈ G, se espera que mientras mas fragmentada se encuentre la imagen

se tengan mayor número de subgrafos 4.11.

3. Radio de cada subgrafo r

Page 92: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 66

CUADRO 4.11: Número de subgrafos

TubularTubular confragmentos

Fragmentada contúbulos

Fragmentada

75 71 24 12355 39 47 5939 43 43 7455 47 50 9759 211 43 4744 73 59 5058 45 117 9929 84 242 13072 98 73 14139 40 14 5153 69 37 5573 61 51 6110 58 61 6932 28 33 10227 80 39 8819 115 20 11612 53 62 7040 46 27 7738 59 36 13144 85 30 134

Se define como la mínima excentricidad, dicha medida esta representada por la má-

xima distancia en un grafo entre dos vértices v y u en G , esta medida también se

determina por cada subgrafo y se promedia para obtener un resultado por cada

imagen o grafo G, la tabla 4.12 muestra algunos resultados de aplicar el promedio

de los radios encontrados en cada imagen.

Se realizaron pruebas con otras medidas aplicadas en grafos, mismas que fueron

descartadas debido a que los datos obtenidos para la mayor parte de imágenes en

las cuatro clases, no reflejan una diferencia notable entre ellas, lo cual tiene poca

funcionalidad en la caracterización de la imagen. La siguiente tabla muestra algunas

de las medidas que también se probaron:

Page 93: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 67

CUADRO 4.12: Resultado de aplicar promedio del radio del grafo

TubularTubular confragmentos

Fragmentada contúbulos

Fragmentada

6.621628021 6.958459186 6.787969364 8.9349279166.975365728 7.814451091 8.687004771 8.8184015257.007866922 11.10597098 8.083663094 7.6456811378.313653697 6.821577014 8.792427505 6.1668330076.472325278 6.881055956 9.595978158 9.163077646.52218443 7.178936595 8.686901163 7.5381674978.27501981 8.486251222 6.892301592 7.827568752

6.261759855 7.384449535 6.733587094 8.8385119216.916473296 6.404097344 7.454775102 9.5828886377.508509155 8.590701758 8.287662035 8.3356192937.04286306 8.823136119 9.271243877 8.672806435

7.408649231 7.998113889 8.892453927 6.7698728166.821690252 7.325627472 8.524276299 8.1849461197.617109624 9.21851687 8.807555796 7.5390441789.743070345 8.086456245 7.796862345 7.0764158916.273366845 8.016129658 10.44807175 9.5558942227.425581589 9.704510792 8.190992388 8.6619419247.215658519 10.20484825 9.77312105 8.7309133586.647797002 7.649678392 8.896632171 9.9113328197.306789369 7.587108247 6.923378876 7.248407499

CUADRO 4.13: Otras medidas probadas

MedidasCentralidad

DensidadCoeficiente de agrupamiento

Dimensión fractalDistribución

En la mayoría de estas medidas el resultado obtenido en las imágenes no permite

caracterizar a la red mitocondrial, debido a que el escalar obtenido es similar en

las cuatro clases, o no se observa una diferencia notable entre clases que permita

caracterizar el grafo obenido en cada imagen.

4. Entropía usando matriz de co-ocurrencia c

Una matriz de ocurrencia muestra la frecuencia de la intensidad del valor i dentro

Page 94: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 68

FIGURA 4.17: Región para obtener la matriz de ocurrencia

de un imagen que ocurre en una especifica relación o región, es decir dentro de cierta

distancia y orientación a un pixel de valor j, de esta forma se define una ventana de

espacio wx w en donde se cuantifican lo niveles de gris en los cuales se establesca

la imagen. De esta forma se determina una distancia, comunmente de 1 a 3 y un

determinado ángulo 0 o 45, 90, 135, usando estos datos se cuenta el número de pares

de pixeles para obtener la frecuencia en la que se repite ese par de pixeles tomando

en cuenta la distancia y dirección. En la figura 4.17 se muestra un ejemplo de la

obtención de una matriz de co-ocurrencia.

Para este experimento se define heuristicamente una distancia de 20 y las direccio-

nes 0 o 45, 90, 135, de esta forma se obtiene una matriz de co-ocurrencia en escala

de los 255 niveles de grises, la figura 4.18 muestra el resultado de obtener la matriz

para una distancia 1 en una dirección de 0 grados.

Page 95: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 69

FIGURA 4.18: Matriz de co-ocurrencia obtenida para los primeros 4 nivélesen la imagen

Una vez que se ha obtenido una matriz por cada dirección establecida, se calcula la

entropía [10], la cual provee información estadística relacionada a la uniformidad

de distribución de los nivéles de gris [1], matemáticamente, la entropía se define:

entropy = −G−1

∑t=0

p(i)log(p(i)) (4.20)

Esta medida 4.14 se obtiene por cada una de las matrices y se realiza una promedio

para obtener un escalar, se realizaron pruebas usando otras medidas como constras-

te, energía y correlación.

En la tabla 4.15 se muestra algunos resultados de las cuatro medidas empleadas para

el entrenamiento del algoritmo, en el caso de las medidas de grafos complejos, se obtuvo

el promedio de las medidas obtenidas por cada subgrafo.

4.4.3. Entrenamiento y clasificación usando centroide mas cercano

Para el proceso de clasificación se emplea también el algoritmo de centroide mas cer-

cano, el conjunto de muestras de entrenamiento definido por el conjunto (x1, y1), ...(xn, yn),

Page 96: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 70

CUADRO 4.14: Resultado de aplicar entropía en matriz de co-ocurrencia

TubularTubular confragmentos

Fragmentada contúbulos

Fragmentada

0.981349607 0.379705147 0.458143225 0.1774129240.860843738 0.457107289 0.567275614 0.4641209811.504870532 0.346946186 0.53122192 0.7125787360.58476397 0.503477656 0.454727782 0.694936742

1.116020196 1.428044552 0.497376262 0.4919872460.594888907 0.539934621 0.473909787 0.3243753770.544136489 0.432312589 0.828205017 0.3731766671.162515496 0.585237265 1.178593444 0.3812549550.791516672 0.683956793 0.838825478 0.2931555290.9342687 0.341321351 0.258648972 0.4693684230.6498696 0.57259131 0.295820193 0.271138045

0.689105966 0.438942006 0.474000324 0.8096184131.167871746 0.381176724 0.30655365 0.4969313420.481080029 0.455496446 0.393883459 1.0077686410.342074497 0.665896972 0.42061157 0.8872439261.158889124 0.813145333 0.138560791 0.1065983821.027000108 0.26584356 0.569004067 0.4873352270.565124289 0.468617098 0.336119236 0.6157805820.440176412 0.37167341 0.264380376 0.3638066030.712587675 0.65472038 0.411833041 0.384173151

donde se define al vector como x = q, w, c, r etiquetado a la clase de fragmentación a la

cual pertenece yi ∈ Y, con este conjunto de datos se calculan los centroides por cada clase

empleando la fórmula:

Ml =1|gl|∑i

glxi (4.21)

Donde gl es el conjunto de indices de las muestra que pertenecen a la clase l ∈ Y

Page 97: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 71

CUADRO 4.15: Medidas obtenidas

Clase Promedio del camino mas corto Radio Entropía subgrafos1 9.093333333333334 6.6216280210987035 0.981349606612 251 9.563636363636364 6.975365727581978 0.86084373781 351 9.595959595959595 7.007866921596743 1.50487053248 291 11.745454545454546 8.313653696670004 0.584763969985 351 8.88679245283019 6.4723252776298565 1.11602019648 591 9.136363636363637 6.522184429878148 0.594888907271 441 11.689655172413794 8.275019809696198 0.5441364892 581 8.48062015503876 6.261759855299191 1.16251549556 292 12.63768115942029 8.823136119111542 0.572591309838 692 11.295081967213115 7.998113888915321 0.438942005627 512 10.206896551724139 7.325627471990911 0.38117672352 582 12.821428571428571 9.218516870115844 0.455496445608 282 11.15 8.086456245369497 0.665896971555 802 11.226086956521739 8.016129657564724 0.813145333013 1152 13.69811320754717 9.704510791594789 0.265843560268 533 8.981818181818182 6.574090760149729 0.948216067366 453 21.25 14.09082873476199 0.166520629575 423 15.619047619047619 10.877808675057134 0.15372672667 813 15.368421052631579 10.142909373249818 0.247562082766 693 9.125 6.560578183876333 0.355714667577 663 15.333333333333334 10.77091955027524 0.228070837511 653 12.882352941176471 8.996614060140104 0.271861756227 574 22.15 15.029082873476199 0.126620629575 124 13.619047619047619 11.877808675057134 0.25372672667 514 13.368421052631579 11.142909373249818 0.347562082766 694 10.125 6.560578183876333 0.255714667577 664 15.2333333333 10.67091955027524 0.2480708375331 754 13.282352941176471 8.796614060140104 0.17187536227 87

4.4.4. Resultados

Las tablas 4.16 y 4.17 muestran los resultados obtenidos realizando una clasificación

supervisada empleando tres y cuatro clases, se puede observar una mayor exactitud en la

clasificación usando la clasificación en tres grupos, sin embargo en la tabla de cuatro cla-

ses se puede observar una menor exactitud, en ambas clasificaciones se obtiene un mayor

porcentaje de error en la clase fragmentada, a pesar de que se ha seguido el mismo proce-

so de clasificación, estos resultados también se ven reflejados en las medidas de precisión

Page 98: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 72

y sensibilidad.

CUADRO 4.16: Matriz de confusión método clasificación extracción de bor-des y medidas de grafos(3 clases)

Actual \Predicho Tubular Fragmentada contúbulos

Fragmentada Total Sensibilidad

Tubular 34 4 4 42 0.8095Fragmentada contúbulos

13 23 7 40 0.4500

Fragmentada 15 3 22 40 0.5500Total 62 30 26 . .

Precisión 0.4927 0.7666 0.5769 . .

Exactitud : 64,75 % (4.22)

CUADRO 4.17: Matriz de confusión método clasificación extracción de bor-des y medidas de grafos (4 clases)

Actual \Predicho TubularTubular confragmentos

Fragmentadacon túbulos

Fragmentada Total Sensibilidad

Tubular 29 8 5 0 42 0.6904Tubular confragmentos 6 22 7 5 40 0.4500

Fragmentada contúbulos

3 13 20 4 40 0.5000

Fragmentada 0 22 3 17 40 0.4250Total 38 55 35 26 . .

Precisión 0.7631 0.4000 0.5714 26 0.6538 .

Exactitud : 54,32 % (4.23)

Page 99: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 73

4.4.5. Clasificación por votación

En esta sección se propone una clasificación por medio de la predicción obtenida en

cada uno de los clasificadores propuestos en este trabajo, en el cual se toma como pre-

dicción final al mayor cantidad de predicciones de la misma clase, es decir si al menos 2

clasificadores realizan la misma predicción, será este valor el resultado final de la clasifi-

cación en la imagen. La siguiente tabla muestra un ejemplo del proceso de clasificación

en 3 diferentes imágenes.

CUADRO 4.18: Ejemplo del proceso de clasificación por votación

Imagen r K-means yredes neuronales

Bordes y medidasde grafos

Redesconvolucionales

Final

1 Tubular Tubular Fragmentada Tubular2 Fragmentada Fragmentada Fragmentada Fragmentada3 Fragmentada con túbulos Fragmentada Tubular Tubular

Se obtuvieron las matrices de confusión del proceso de votación empleando la misma

cantidad de imágenes entrenando los claisificadores con 3 y 4 clases.

CUADRO 4.19: Matriz de confusión método clasificación por votación

Actual \Predicho TubularTubular confragmentos

Fragmentadacon túbulos

Fragmentada Total Sensibilidad

Tubular 30 3 1 0 34 0.8823Tubular confragmentos 1 21 6 2 30 0.7000

Fragmentada contúbulos

0 6 11 12 29 0.3793

Fragmentada 0 11 6 12 29 0.4137Total 31 41 24 26 . .

Precisión 0.9677 0.521 0.4583 0.4615 . .

Exactitud : 60,65 % (4.24)

Page 100: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 74

En la siguiente tabla se muestran los resultados de aplicar el sistema de votaciones

realizando una clasificación en 3 clases:

CUADRO 4.20: Matriz de confusión método clasificación por votación

Actual \Predicho Tubular Fragmentada contúbulos

Fragmentada Total Sensibilidad

Tubular 32 7 0 39 0.8205Fragmentada contúbulos

8 23 3 34 0.6764

Fragmentada 5 1 20 26 0.76.92Total 45 31 23 . .

Precisión 0.711 0.7419 0.8695 . .

Exactitud : 75,75 % (4.25)

La tabla 4.21 muestra los porcentajes de exactitud obtenidos en las clasificaciones uti-

lizadas en este capítulo:

Experimentos usando tres clases de clasificación(tubulares, fragmentadas con túbulos

y fragmentadas):

CUADRO 4.21: Porcentajes de los métodos aplicados en 3 clases

Método ExactitudMedidas de grafos 64.75 %

K-means y RNC 58.88 %RNC 59.01 %

En esta tabla se puede apreciar un mejor rendimiento en el algoritmo empleando medi-

das de grafos y matriz de ocurrencia, y la exactitud mas baja se obtiene cuando se aplica

segmentación de imágenes por k-means y reconocimiento de formas usando redes neuro-

nales convolucionales. La tabla 4.22 muestra los porcentajes obtenidos en la clasificación

Page 101: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 4. Metodología y experimentos 75

de cuatro clases(tubulares, tubulares con fragmentos, fragmentadas con túbulos y frag-

mentadas), el mejor porcentaje de exactitud es obtenido empleando un modelo de redes

neuronales convolucionales tomando la imagen completa como entrada, y un menor por-

centaje para el algoritmo donde se emplean medidas de grafos.

CUADRO 4.22: Porcentajes de los métodos aplicados en 4 clases

Método ExactitudMedidas de grafos 54.32 %

K-means y RNC 55.57 %RNC 62.34 %

Page 102: Análisis de la fragmentación mitocondrial en imágenes de
Page 103: Análisis de la fragmentación mitocondrial en imágenes de

77

Capítulo 5

Conclusiones

5.1. Conclusiones

En este trabajo se realizó un análisis de la morfología mitocondrial en imágenes bioló-

gicas, este tipo de imágenes han sido poco estudiadas dentro del área de procesamiento

de imágenes. Se tomó como punto de partida la validación de las imágenes de morfolo-

gías mitocondriales clasificadas por las biologas expertas en el campo, las caracterización

y clasificación de cada una de las formas fue inicialmente determinada en cuatro clases,

pues una de la conjetura inicial es que el número total de clases existentes dentro de las

morfologías mitocondriales era de cuatro, los estudios realizados muestran que no se en-

contró evidencia de la existencia de cuatro morfologías, de acuerdo a las metodologías

probadas. Las principales conclusiones de este trabajo se describen a continuación:

Page 104: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 5. Conclusiones 78

1. Se realizó la clasificación del conjunto de imágenes utilizando cuatro y tres grupos,

las matrices de confusión muestran una fuerte correlación entre dos clases, permi-

tiendo obtener un mayor porcentaje de clasificación en tres clases

2. Los métodos de procesamiento de imágenes tienen una influencia importante den-

tro del conjunto de trabajo, en este trabajo se emplearon diferentes técnicas de pro-

cesamiento, tanto en escala de grises y escala binaria, para el procesamiento binario

se realiza una caracterización de la imagen a partir de una segmentación obteni-

da mediante un umbral establecido, la decisión de este umbral influye en la región

de interés obtenida después de este proceso, sin embargo, algunas técnicas como

segmentación por K-means ayudan a definir mejor las regiones detectadas en es-

tas imágenes, por otro lado el procesamiento en escala de grises fue determinado

por algoritmos como redes neuronales convolucionales y matriz de correlación, las

redes convolucionales mostraron un bajo rendimiento debido al bajo conjunto de

datos disponible, en cuanto a la matriz de correlación, se presenta una diferencia en

la entropía obtenida a partir de esta matriz, esta medida fue utilizada para carac-

terizar a la imagen y emplear un algoritmo de clasificación, obteniendo un mayor

porcentaje en el método de clasificación que involucra k-means, medidas de grafos

y entropía de la imagen

3. Se espera que el porcentaje de clasificación en los algoritmos presentados pueda ser

aumentado, el conjunto de imágenes empleadas para el reconocimiento de las for-

mas no fue muy amplio, dado que la mayoría de los algoritmos utilizados, emplean

conjuntos mas grandes de datos.

Page 105: Análisis de la fragmentación mitocondrial en imágenes de

Capítulo 5. Conclusiones 79

5.2. Trabajo a futuro

El presente trabajo muestra un análisis en el nivel de fragmentación en imágenes de

mitocondrias, este tipo de imágenes han sido un campo no muy explorado dentro del

procesamiento de imágenes debido a la naturaleza de los experimentos, dentro de es-

te trabajo se emplearon diferentes técnicas de procesamiento de imágenes, involucrando

métodos tradicionales y de aprendizaje máquina, con estas herramientas se emplearon

diferentes tipos de clasificadores,en un trabajo a futuro se podrian emplear algunas otras

técnicas de clasificación empleando las características propiuestas, con el objetivo de au-

mentar el porcentaje de exactitud en la clasficación descrita. El trabajo a futuro podría

ser:

1. Realizar una clasificación no supervisada, en el cual se obtengan el número de clases

dentro del conjunto de imágenes sin emplear una forma supervisada.

2. Aumentar el conjunto de entrenamiento para realizar pruebas con los algoritmos

empleados, en métodos como las redes neuronales convolucionales, se espera que

se efectue un mejor entrenamiento.

3. Explorar otras formas de caracterización para las imágenes, realizando la búsqueda

de otras medidas que sean de utilidad para el nivel de fragmentación, empleando

también técnicas de procesamiento de imágenes.

Page 106: Análisis de la fragmentación mitocondrial en imágenes de
Page 107: Análisis de la fragmentación mitocondrial en imágenes de

81

Bibliografía

[1] Data science by chris. https://chrisalbon.com/. Accessed: 2010-09-30.

[2] Keras CNN by lenet. https://www.kaggle.com/ftence/keras-cnn-inspired-by-

lenet-5. Accessed: 2010-09-30.

[3] Python by python. https://pythonprogramminglanguage.com/kmeans-elbow-

method/. Accessed: 2010-09-30.

[4] Goodfellow Ian Bengio Yoshua Courville Aaron. Deep Learning(Adaptive Computation

and Machine Learning). MIT press, 1st edition edition, 2016.

[5] Jeff Heatonr. Artificial Intelligence for Humans deep learning and neural networks. DRM,

3st edition edition, 2015.

[6] Rheman Jalees. Inhibition of mitochondrial fission prevents cell cycle progression in

lung cancer. The FASEB Journal article, pages 1–12, 2012.

[7] k. Pratt William. Introduction to Digital Image Processing. CRC Press, 2nd edition

edition, 2008.

[8] k. Pratt William. Machine Learinng for Predictive Data Analitics. CRC Press, 1st edition

edition, 2012.

Page 108: Análisis de la fragmentación mitocondrial en imágenes de

BIBLIOGRAFÍA 82

[9] G. A. Aguirre M. G. Paola. Estudio de parámetros asociados a la dinámica mitocon-

drial en cáncer de mama. CONACYT 45 años, page 1, 2016.

[10] Ministry for Primary Industries. Co-matriz by scikit. http://scikit-image.org/

docs/dev/auto_examples/features_detection/plot_glcm.html, 2013. Online; Ac-

cessed: 2010-09-30.

[11] Aguado Alberto Nixon Mark. Geature Extraction and Image Processing. Elsevier, 2nd

edition edition, 2008.

[12] C. Gonzales Rafael. Digital Image Processing. Pearson, 3nd edition edition, 2008.

[13] J. Giedt Randy. Computational imaging reveals mitochondial morphology as a bio-

marker of cancer phenotype and drug response. Scientific Reports, pages 1–10, 2016.