Marrayclass13 - Clustering(Clasificacion No supervisada II Edgar Acuna Departamento de Matematicas UPR-Mayaguez Algoritmo jerrquicos Estos

Info iconThis preview shows pages 1–8. Sign up to view the full content.

View Full Document Right Arrow Icon
Clustering (Clasificacion No supervisada) II Edgar Acuna Departamento de Matematicas UPR-Mayaguez
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Algoritmo jerárquicos En la figura se muestra el dendrograma de las 38 muestras del conjunto Golub obtenido usando la función hclust para algoritmo jerarquico > a=hclust(dist(t(golub))) > plot(a) Estos algoritmos generan sucesiones anidadas de clusters que se pueden visualizar con una estructura de arbol llamado Dendrograma, 38 33 37 29 30 36 21 17 26 16 19 20 13 24 5 15 3 6 23 10 9 11 2 14 27 1 4 7 8 22 18 28 12 25 34 35 31 32 40 45 50 55 60 Cluster Dendrogram hclust (*, "complete") dist(t(golub)) Height
Background image of page 2
Dendrogramas Los dendrogramas son fáciles de interpretar pero pueden conducir a falsas conclusiones por las siguientes razones: 1) El dendrograma correspondiente a un conglomerado jerárquico no es único, puesto que por cada junte de clusters (merge) uno necesita especificar que sub-árbol va a la derecha y cuál a la izquierda. Por default la función hclust ordena los arboles de tal manera que los conglomerados más concentrados van a la izquierda. 2) La estructura jerárquica del Dendrograma no representa fielmente las verdaderas distancias entre los objetos distintos del conjunto de datos.
Background image of page 3

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
El coeficiente de correlación cofenético puede ser usado para medir cuan bien la estructura jerárquica del dendrograma representa a las v erdaderas distancias. Se define como la correlación entre las n ( n - 1) / 2 pares de dissimilaridades y sus distancias cofenéticas del dendrogramas (es la distancia de similiraidad a la cual dos observaciones que aparecen en un mismo cluster fueron consideradas juntas por primera vez). La función cophenetic calcula la distancia cofenéticas . d1=dist(t(golub)) golubh=hclust(d1, method=”ave”) d2=cophenetic(golubh) cor(d1,d2) La correlacion cofenética da 0.7606. El dendrogram no es tan confiable
Background image of page 4
Ejemplo de un dendrograma y sus cortes treegolub=as.dendrogram(hgolub) golubh= cut (treegolub,h=50) > golubh $upper 'dendrogram' with 2 branches and 2 members total, at height 54.29456 $lower $lower[[1]] 'dendrogram' leaf '21', at height 0 $lower[[2]] 'dendrogram' with 2 branches and 37 members total, at height 47.57777
Background image of page 5

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
21 29 38 33 37 30 36 12 25 34 35 28 31 32 17 3 6 23 10 9 11 2 14 18 20 26 16 19 13 24 5 15 27 1 4 7 8 22 45 55 Cluster Dendrogram hclust (*, "average") dist(t(golub)) Height 0 40 50 Branch 1 Branch 2 0.00 0.02 0.04 0.06
Background image of page 6
Son gráficas que muestran simultaneamente las agrupaciones en conglomerados de columna y filas. La función heatmap permite hacer heatmaps usando un gran número de tonalidades de colores. iris1=read.table("http://math.uprm.edu/~edgar/iris.dat")
Background image of page 7

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 8
This is the end of the preview. Sign up to access the rest of the document.

This note was uploaded on 05/12/2010 for the course APPLIED ST 2010 taught by Professor Various during the Spring '10 term at Universidad Nacional Agraria La Molina.

Page1 / 47

Marrayclass13 - Clustering(Clasificacion No supervisada II Edgar Acuna Departamento de Matematicas UPR-Mayaguez Algoritmo jerrquicos Estos

This preview shows document pages 1 - 8. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online