1 introducción al análisis cluster. 2 Índice introducción conceptos básicos –elementos...
TRANSCRIPT
![Page 1: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/1.jpg)
1
Introducción al Análisis Cluster
![Page 2: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/2.jpg)
2
Índice
• Introducción
• Conceptos básicos– Elementos– Características de los elementos– Distancias– Particiones– Jerarquías
• Modelos de análisis cluster
• Modelo de análisis cluster jerárquico– Métodos aglomerativos– Dendograma– El problema del número de clusters– Ejemplo– Cuestiones complementarias
![Page 3: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/3.jpg)
3
Introducción• El problema de la clasificación
– Identificar grupos de individuos/objetos de características similares– Tipologías
• Economía: segmentación del mercado de consumidores• Biología: creación de una sistemática sobre el mundo vegetal y animal• Medicina: clasificación de las enfermedades en función de su sintomatología
• Definición de análisis clusterConjunto de técnicas multivariantes cuyo principal propósito es la agrupación de
individuos en conglomerados (cluster) basándose en las características de los mismos
• Cuestiones a tratar– Características – Similaridad– Modelos a utilizar– El problema del número de cluster o conglomerados– Interpretación de las características de los cluster
![Page 4: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/4.jpg)
4
Conceptos básicos
• Objetos: son los elementos a clasificar
• Características de los objetos– Escala – Nominal
niai 1,
jia ,kj
ni
1
1
![Page 5: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/5.jpg)
5
Conceptos básicos
• Matriz de datos
Peso Altura
86 1,76
53 1,58
60 1,653231
2221
1211
aa
aa
aa
![Page 6: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/6.jpg)
6
Conceptos básicos
Representación gráfica de la matriz de datos
![Page 7: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/7.jpg)
7
Conceptos básicos
• Distancia– La distancia es un índice de disimilaridad que verifica las
siguientes propiedades:
0),( baD),(),( abDbaD
0),( aaD
),(),(),( cbDbaDcaD
![Page 8: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/8.jpg)
8
Conceptos básicos
• Existe una gran variedad de distancias; enumeramos unicamente las más habituales– Distancia euclídea– Distancia euclídea al cuadrado– Distancia de Manhattan– Distancia de correlación de Pearson
![Page 9: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/9.jpg)
9
Conceptos básicos
• Distancia euclídea
22212
2211121 )()(),( aaaaaaD
j
jj aaaaD 2,2,121 )(),(
![Page 10: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/10.jpg)
10
Conceptos básicos
22 cba
![Page 11: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/11.jpg)
11
Matriz de distancias
,000 33,000 26,000
33,000 ,000 7,000
26,000 7,000 ,000
Caso1:Jose
2:Angeles
3:Conchita
1:Jose 2:Angeles 3:Conchita
distancia euclídea
Esta es una matriz de disimilaridades
Conceptos básicos
![Page 12: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/12.jpg)
12
Conceptos básicos
• Distancia de Manhattan
j
jj aaaaD ,2,121 ),(
![Page 13: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/13.jpg)
13
Conceptos básicos
![Page 14: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/14.jpg)
14
Conceptos básicos
• Distancia de correlación de Pearson
Esta distancia esta basada en el coeficiente de correlación de Pearson y por lo tanto hereda todas sus propiedades.
El coeficiente de correlación de Pearson mide el grado de asociación lineal entre dos objetos, es decir, hasta que punto dos objetos son proporcionales.
A diferencia de otras medidas, este coeficiente no se ve afectado por las escalas de medidas utilizadas.
El recorrido de este coeficiente varía entre -1 y 1
(1 indica una relación proporcional perfecta).
![Page 15: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/15.jpg)
15
Conceptos básicos
• La estandarización de variables.• Debido a la propia definición de distancia se
deduce que ésta va a ser sensible a los cambios de escala, es decir, va a ser afectada por las unidades de medida que hemos utilizado para medir las características de los elementos.
• Si los rangos de las distintas características son dispares el cálculo de las distancias se vería seriamente afectado.
![Page 16: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/16.jpg)
16
Conceptos básicos
(86-60)^2=676
(1,76-1,65)^2=0,01
001.2601.0676
![Page 17: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/17.jpg)
17
Conceptos básicos
![Page 18: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/18.jpg)
18
Conceptos básicos
• El problema de utilizar variables con distinto recorrido.
-Homogeneizar las escalas en el intervalo 0-1.
)min()max(
)min(
*,*,
*,,',
jj
jjiji aa
aaa
![Page 19: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/19.jpg)
19
Conceptos básicos
86 1,76
53 1,58
60 1,65
1,00 1,00
0,00 0,00
0,21 0,39
Descriptive Statistics
3 33,00 53,00 86,00 66,3333
3 ,18 1,58 1,76 1,6633
3 1,00 ,00 1,00 ,4033
3 1,00 ,00 1,00 ,4633
3
peso
Altura
npeso
naltura
Valid N (listwise)
N Range Minimum Maximum Mean
![Page 20: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/20.jpg)
20
Conceptos básicos
• Estandarizar variables
Realizar una transformación de forma que las variables transformadas tengan media 0 y varianza 1.
)(
)(
*,
*,,´,
j
jjiji a
amediaaa
![Page 21: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/21.jpg)
21
Conceptos básicos
86 1,76
53 1,58
60 1,65
1,13 1,07
-0,77 -0,92
-0,36 -0,15
Descriptive Statistics
3 33,00 53,00 86,00 66,3333 17,38774
3 ,18 1,58 1,76 1,6633 ,09074
3 1,89789 -,76682 1,13107 ,0000000 1,00000000
3 1,98374 -,91840 1,06534 ,0000000 1,00000000
3
peso
Altura
Zpeso Zscore(peso)
ZAltura Zscore(Altura)
Valid N (listwise)
N Range Minimum Maximum Mean Std. Deviation
![Page 22: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/22.jpg)
22
• Partición• Sea A un conjunto finito, consideramos una clase
de subconjuntos de A, denominada H:
• H es una partición de A si se verifica:
LiH i 1,
ii
ji
AH
HH
Conceptos básicos
![Page 23: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/23.jpg)
23
CroaciaGeorgia
India
Italia
Japón
Líbano
Libia
Marruecos
Paraguay
Tanzania
4050
6070
80es
per
anz
a d
e vi
da
mas
culin
a
0 5000 10000 15000 20000producto interior bruto per-capita
![Page 24: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/24.jpg)
24
![Page 25: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/25.jpg)
25
Conceptos básicos
• Jerarquía
Dado un conjunto finito A, consideramos una clase H de subconjuntos de A.
Se dice que H es una jerarquía de A si:
,,,, ' hhhhHhh
,,:, hhhHhhHh
![Page 26: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/26.jpg)
26
Conceptos básicosJerarquía
AustriaAlemaniaNoruegaSuecia
AustriaAlemania
SueciaNoruega
Austria Alemania Suecia Noruega
![Page 27: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/27.jpg)
27
Conceptos básicos
![Page 28: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/28.jpg)
28
Modelos de análisis cluster
• Métodos de agrupación jerárquica.
1. Se establecen n agrupamientos. Cada agrupamiento contiene exactamente un elemento.
2. Se agrupan los dos cluster más cercanos formando un único cluster.
3. Se recalcula la matriz de distancias.4. Pasamos al punto 1.
Este algoritmo realiza exactamente n-1iteraciones.
![Page 29: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/29.jpg)
29
Métodos de agrupación jerárquica
![Page 30: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/30.jpg)
30
Métodos de agrupación jerárquica
![Page 31: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/31.jpg)
31
Métodos de agrupación jerárquica
![Page 32: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/32.jpg)
32
Métodos de agrupación jerárquica
![Page 33: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/33.jpg)
33
Métodos de agrupación jerárquica
• Ventajas del modelo de agrupación jerárquica.
1. No requiere hacer inferencias sobre el número de cluster.
2. Permite representar las sucesivas agrupaciones en forma de árbol (dendograma).
• Inconvenientes1. Alto coste computacional.2. Sensible respecto de las primeras agrupaciones.3. Complicado de interpretar cuando el número de
elementos a clasificar es grande.
![Page 34: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/34.jpg)
34
Métodos de agrupación no jerárquica
1. Se determina a priori el número de clusters que se desea construir (k).
2. Se establece una configuración aleatoria de los centros de estos clusters, estos centros se denominan centroides.
3. Los elementos se asignan al cluster cuyo centroide esté más cerca.
4. Se recalculan (actualizan) nuevamente los centroides en función de los elementos que les han sido asignados
5. Se repite el algoritmo desde el paso 3, hasta que los centroides dejan de cambiar.
![Page 35: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/35.jpg)
35
Métodos de agrupación no jerárquica
![Page 36: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/36.jpg)
36
Métodos de agrupación no jerárquica
![Page 37: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/37.jpg)
37
Métodos de agrupación no jerárquica
• Ventajas del análisis cluster no jerárquico.1. Rapidez.
2. Permite el procesamiento de gran número de datos.
• Inconvenientes1. Hay que determinar el número óptimo de cluster a
priori.
2. Muy sensible ante la presencia de datos extremos.
3. Sólo se pueden utilizar medidas euclídeas.
4. Sensible respecto de la ordenación de los datos.
![Page 38: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/38.jpg)
38
Análisis cluster jerárquico
• Fases de un análisis cluster jerárquico.1. Determinar qué características vamos a utilizar para
comparar los elementos a clasificar.2. Considerar la conveniencia de estandarizar o no
dichas características.3. Determinar qué distancia debemos utilizar para
medir la similaridad entre elementos.4. Fijar el método de conglomeración.5. Examinar el dendograma para determinar el número
óptimo de agrupaciones.6. Estudio e interpretación de la partición obtenida.7. Verificar la estabilidad de la solución.
![Page 39: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/39.jpg)
39
Análisis cluster jerárquico
• Métodos de conglomeración– Vecino más cercano.– Vecino más lejano.– Centroide– Vinculación intergrupos
![Page 40: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/40.jpg)
40
Análisis cluster jerárquico
• Vecino más cercano.– La distancia entre dos conglomerados se
define como la distancia (en la métrica considerada) de los dos elementos más cercanos.
– Este método tiende a maximizar lo conexo.
![Page 41: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/41.jpg)
41
Análisis cluster jerárquico
![Page 42: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/42.jpg)
42
Análisis cluster jerárquico
• Vecino más lejano.– La distancia entre dos conglomerados se
define como aquélla entre los elementos más alejados.
– Este método tiende a minimizar las distancias dentro de los conglomerados.
![Page 43: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/43.jpg)
43
Análisis cluster jerárquico
• Método del centroide.
• La distancia entre dos cluster se define como la distancia entre las medias (centroides) de los mismos.
![Page 44: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/44.jpg)
44
Análisis cluster jerárquico
![Page 45: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/45.jpg)
45
Análisis cluster jerárquico
• Vinculación entre grupos
• Se define la distancia entre dos clusters como el promedio de las distancias entre todos los pares de elementos de los dos conglomerados.
![Page 46: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/46.jpg)
46
Análisis cluster jerárquico
![Page 47: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/47.jpg)
47
Análisis cluster jerárquico
• Dendograma• El dendograma es un diagrama con estructura
de árbol binario que muestra las fusiones de los elementos en cada paso del procedimiento jerárquico.
• El dendograma se representa por medio de dos ejes perpendiculares. En uno de ellos se representan los elementos a clasificar, en el otro eje se representan las distancias a la que se van juntando los elementos.
![Page 48: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/48.jpg)
48
Análisis cluster jerárquico
![Page 49: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/49.jpg)
49
Análisis cluster jerárquico
• El problema del número de clusters.• No existe ningún criterio general que nos
permita determinar el número óptimo de clusters, pues influyen factores como el número de elementos con valores extremos, las distribuciones que siguen las variables … etc.
• Una forma de determinar el número óptimo de cluster es examinar atentamente el historial del algoritmo de aglomeración y el dendograma del mismo.
• Un factor a tener muy en cuenta es el tamaño de los clusters resultantes.
![Page 50: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/50.jpg)
50
Análisis cluster jerárquico
![Page 51: 1 Introducción al Análisis Cluster. 2 Índice Introducción Conceptos básicos –Elementos –Características de los elementos –Distancias –Particiones –Jerarquías](https://reader033.vdocuments.site/reader033/viewer/2022061605/5665b4241a28abb57c8f79c6/html5/thumbnails/51.jpg)
51
Análisis cluster jerárquico