clasificacion de especies de frailej´ on del p´ aramo del

1
Clasificaci ´ on de especies de Frailej ´ on del p ´ aramo del Sumapaz mediante la mor- folog´ ıa foliar. Juan David Leal Campuzano Andr´ es Juli´ an Berm ´ udez Garc´ ıa Universidad Nacional de Colombia, Machine Learning 2021-1, Colombia. [email protected][email protected] Resumen Determining the species of Frailej´ on to which a leaf of this species belongs is a fairly complex work that requires the advice of many times personnel specialized in botany and genetics. In this context, this work attempts to construct an algorithm ca- pable of performing such a classification based on the morphology of the leaves of the different species of Frailej´ on (E.Grandiflora, E. Argentea, E. summapacis) present in a set of tagged photographic data based on previous classification work morphology of different types of plant species. Using the recommended features in the mentioned works we create a set of data from which we extract the most relevant characteristics and which will be used in different classification algorithms in order to find the one with the greatest accuracy. Introducci´ on La necesidad de distinguir el ecosistema en donde se trabaja genera la ne- cesidad de identificar las diferentes especies que componen el mismo, para el estudio de caso, dado el predominio de la Espeletia en los p´ aramos, es de gran importancia identificar esas diferentes especies y sus caracter´ ısticas mor- fol´ ogicas. Construcci´ on del Conjunto de Datos y extracci´ on de caracter´ ısticas Figura 1: Las fotograf´ ıas en su mayor´ ıa presentaba discrepancias en la toma de muestras tales como: Distancia del objetivo a la c´ amara, tama˜ no de la imagen en pixeles, iluminaci´ on, sa- turaci´ on, contaminaci´ on de los objetivos, fondos no adecuados para la separaci´ on de objetos, entre otros. Este conjunto de datos fue proporcionado por Iv´ an Jim´ enez en su trabajo [11] . Esquema de trabajo Figura 2: Metodolog´ ıa adoptada para el desarrollo de este trabajo . Caracter´ ısticas geom´ etricas. Figura 3: Primer espacio de caracter´ ısticas y sus correlaciones Pearson. . Figura 4: Datos interpretados a partir de pareja de caracter´ ısticas . Caracter´ ısticas de contorno Contornos de Fourier Figura 5: DFT aplicada a los puntos que conforman el contorno de la hoja. . Figura 6: Donde efectivamente se observa que muchos de ellos poseen un grado alto de co- rrelaci´ on(visto desde el valor absoluto de estos coeficientes). Figura 7: PCA y TSNE separados por grupos de especie usando el espacio de los arm ´ onicos An´ alisis de los datos obtenidos Modelos Creaci´ on de los espacios de an ´ alisis Espacio 1 = Componentes Geom´ etricos. Espacio 2 = Componentes de contorno. Espacio 3 = Uni ´ on de estos espacios. Figura 8: PCA y TSNE, Reducci ´ on de dimensi ´ on aplicado a la uni ´ on de los dos espacios E1 y E2 Aplicaci´ on de los modelos de clasificaci ´ on Resultados. Espacio 1: Figura 9: Matriz de confusi ´ on para cada modelo entrenado con el espacio 1 completo. Subespacios: Figura 10: An´ alisis por subgrupos, arriba por parejas, en el medio por tripletas y abajo por cuartetos Espacio 2: Figura 11: Matriz de confusi ´ on para cada modelo entrenado con el espacio 1 completo. Figura 12: An´ alisis por subgrupos, arriba por parejas, abajo por tripletas Subespacios: Espacio 3: Figura 13: Matriz de confusi ´ on para cada modelo entrenado con el espacio 3 completo. Conclusiones Se puede concluir que a pesar de no tener un precisi´ on de m´ as del 90 por ciento, se obtuvo una buena precisi´ on, esto dado que los datos o las im´ age- nes no ten´ ıan la calidad que esperaba y adem´ as la identificaci ´ on de las espe- cies estaba hecha por un libro bastante antiguo y est´ as im´ agenes fueron to- madas hace pocos a ˜ nos, como menciona [11] el paso del tiempo y el cambio del entorno para estas plantas ha hecho que se creen syngameones, t´ ermino que se usa cuando un conjunto de especies del mismo g´ enero o familia ha combinado sus caracter´ ısticas fenot´ ıpicas a tal punto de no ser f´ acilmente distinguibles como es el caso de la Espeletia Grandinflora y la Espeletia Summapacis, incluso pudiendo haber otras especies que a´ un no se hayan reconocido en la misma muestra. Estos tipos de estudios vienen de gran importancia en las ´ areas como la Bot´ anica y la Ecolog´ ıa porque la identificaci´ on de estos tipos de especies que habitan estas zona permiten caracterizar el ecosistema, teniendo im´ age- nes de buena calidad y quiz´ as un poco m´ as de im´ agenes se podr´ ıa llegas a un buen resultado lo cual acortar´ ıa tiempo y gatos a las personas que se encargan de este tipo de investigaciones. Link del video Referencias [1] Leen B. Develder C. Dhaene T. Deschrijver D. Automated classification of appliances using elliptical fourier descriptors. [2] Bobadilla J. Machine Learning y Deep Learning: Usando Python, Scikit y Keras. Ra-ma, 2020. [3] Cuatrecasas J. A systematic study of the subtribe Espeletiinae. The New York Botanical Garden Press, 2013. [4] Olivares L, Victorino J., and G´ omez F. Automatic leaf shape category discovery. 2016 23rd International Conference on Pattern Recognition (ICPR), 2016. [5] Olivares L, Victorino J., and G´ omez F. Contour analysis for interpretable leaf shape category discover. 2016. [6] Zhang S. Cheng D. Zong M. Gao L. Self-representation nearest neighbor search for classification. [7] Cardenas M. Ecohydrology of paramos in Colombia: vulnerability to cli- mate change and land use. PhD thesis, Universidad Nacional de Colom- bia Sede Medell´ ın Facultad de Minas Escuela de Geociencias y Medio Ambiente. [8] Van den Poel D. Prinzie A. Random forests for multiclass classification: Random multinomial logit. 2008. [9] Zhang S., Cheng D., Zong M., and Gao L. Self-representation nearest neighbor search for classification. 2016. [10] Burger W. and Burge MJ. Principios del procesamiento de im´ agenes di- gitales. Temas de Pregrado en Inform´ atica. [11] Pineda Y., Cort´ es A., Madri n´ an S., and Jim´ enez I. The nature of espeletia species. 2020.

Upload: others

Post on 29-Jul-2022

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Clasificacion de especies de Frailej´ on del p´ aramo del

Clasificacion de especies de Frailejon del paramo del Sumapaz mediante la mor-fologıa foliar.Juan David Leal CampuzanoAndres Julian Bermudez GarcıaUniversidad Nacional de Colombia, Machine Learning 2021-1, [email protected][email protected]

ResumenDetermining the species of Frailejon to which a leaf of this species belongs is a

fairly complex work that requires the advice of many times personnel specialized inbotany and genetics. In this context, this work attempts to construct an algorithm ca-pable of performing such a classification based on the morphology of the leaves of thedifferent species of Frailejon (E.Grandiflora, E. Argentea, E. summapacis) present ina set of tagged photographic data based on previous classification work morphologyof different types of plant species. Using the recommended features in the mentionedworks we create a set of data from which we extract the most relevant characteristicsand which will be used in different classification algorithms in order to find the one withthe greatest accuracy.

IntroduccionLa necesidad de distinguir el ecosistema en donde se trabaja genera la ne-

cesidad de identificar las diferentes especies que componen el mismo, parael estudio de caso, dado el predominio de la Espeletia en los paramos, es degran importancia identificar esas diferentes especies y sus caracterısticas mor-fologicas.

Construccion del Conjunto de Datos y extraccionde caracterısticas

Figura 1: Las fotografıas en su mayorıa presentaba discrepancias en la toma de muestras talescomo: Distancia del objetivo a la camara, tamano de la imagen en pixeles, iluminacion, sa-turacion, contaminacion de los objetivos, fondos no adecuados para la separacion de objetos,entre otros. Este conjunto de datos fue proporcionado por Ivan Jimenez en su trabajo [11]

.

Esquema de trabajo

Figura 2: Metodologıa adoptada para el desarrollo de este trabajo.

Caracterısticas geometricas.

Figura 3: Primer espacio de caracterısticas y sus correlaciones Pearson..

Figura 4: Datos interpretados a partir de pareja de caracterısticas.

Caracterısticas de contorno

Contornos de Fourier

Figura 5: DFT aplicada a los puntos que conforman el contorno de la hoja..

Figura 6: Donde efectivamente se observa que muchos de ellos poseen un grado alto de co-rrelacion(visto desde el valor absoluto de estos coeficientes).

Figura 7: PCA y TSNE separados por grupos de especie usando el espacio de los armonicos

Analisis de los datos obtenidos

Modelos

Creacion de los espacios de analisis

Espacio 1 = Componentes Geometricos.

Espacio 2 = Componentes de contorno.

Espacio 3 = Union de estos espacios.

Figura 8: PCA y TSNE, Reduccion de dimension aplicado a la union de los dos espacios E1y E2

Aplicacion de los modelos de clasificacion

Resultados.

Espacio 1:

Figura 9: Matriz de confusion para cada modelo entrenado con el espacio 1 completo.

Subespacios:

Figura 10: Analisis por subgrupos, arriba por parejas, en el medio por tripletas y abajo porcuartetos

Espacio 2:

Figura 11: Matriz de confusion para cada modelo entrenado con el espacio 1 completo.

Figura 12: Analisis por subgrupos, arriba por parejas, abajo por tripletas

Subespacios:Espacio 3:

Figura 13: Matriz de confusion para cada modelo entrenado con el espacio 3 completo.

ConclusionesSe puede concluir que a pesar de no tener un precision de mas del 90 porciento, se obtuvo una buena precision, esto dado que los datos o las image-nes no tenıan la calidad que esperaba y ademas la identificacion de las espe-cies estaba hecha por un libro bastante antiguo y estas imagenes fueron to-madas hace pocos anos, como menciona [11] el paso del tiempo y el cambiodel entorno para estas plantas ha hecho que se creen syngameones, terminoque se usa cuando un conjunto de especies del mismo genero o familia hacombinado sus caracterısticas fenotıpicas a tal punto de no ser facilmentedistinguibles como es el caso de la Espeletia Grandinflora y la EspeletiaSummapacis, incluso pudiendo haber otras especies que aun no se hayanreconocido en la misma muestra.

Estos tipos de estudios vienen de gran importancia en las areas como laBotanica y la Ecologıa porque la identificacion de estos tipos de especiesque habitan estas zona permiten caracterizar el ecosistema, teniendo image-nes de buena calidad y quizas un poco mas de imagenes se podrıa llegasa un buen resultado lo cual acortarıa tiempo y gatos a las personas que seencargan de este tipo de investigaciones.

Link del video

Referencias[1] Leen B. Develder C. Dhaene T. Deschrijver D. Automated classification

of appliances using elliptical fourier descriptors.

[2] Bobadilla J. Machine Learning y Deep Learning: Usando Python, Scikity Keras. Ra-ma, 2020.

[3] Cuatrecasas J. A systematic study of the subtribe Espeletiinae. The NewYork Botanical Garden Press, 2013.

[4] Olivares L, Victorino J., and Gomez F. Automatic leaf shape categorydiscovery. 2016 23rd International Conference on Pattern Recognition(ICPR), 2016.

[5] Olivares L, Victorino J., and Gomez F. Contour analysis for interpretableleaf shape category discover. 2016.

[6] Zhang S. Cheng D. Zong M. Gao L. Self-representation nearest neighborsearch for classification.

[7] Cardenas M. Ecohydrology of paramos in Colombia: vulnerability to cli-mate change and land use. PhD thesis, Universidad Nacional de Colom-bia Sede Medellın Facultad de Minas Escuela de Geociencias y MedioAmbiente.

[8] Van den Poel D. Prinzie A. Random forests for multiclass classification:Random multinomial logit. 2008.

[9] Zhang S., Cheng D., Zong M., and Gao L. Self-representation nearestneighbor search for classification. 2016.

[10] Burger W. and Burge MJ. Principios del procesamiento de imagenes di-gitales. Temas de Pregrado en Informatica.

[11] Pineda Y., Cortes A., Madri nan S., and Jimenez I. The nature of espeletiaspecies. 2020.