{[ promptMessage ]}

Bookmark it

{[ promptMessage ]}

marrayclass13 - Clustering(Clasificacion No supervisada II...

Info icon This preview shows pages 1–10. Sign up to view the full content.

View Full Document Right Arrow Icon
Clustering (Clasificacion No supervisada) II Edgar Acuna Departamento de Matematicas UPR-Mayaguez
Image of page 1

Info icon This preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
Algoritmo jerárquicos En la figura se muestra el dendrograma de las 38 muestras del conjunto Golub obtenido usando la función hclust para algoritmo jerarquico > a=hclust(dist(t(golub))) > plot(a) Estos algoritmos generan sucesiones anidadas de clusters que se pueden visualizar con una estructura de arbol llamado Dendrograma, 38 33 37 29 30 36 21 17 26 16 19 20 13 24 5 15 3 6 23 10 9 11 2 14 27 1 4 7 8 22 18 28 12 25 34 35 31 32 25 30 35 40 45 50 55 60 Cluster Dendrogram hclust (*, "complete") dist(t(golub)) Height
Image of page 2
Dendrogramas Los dendrogramas son fáciles de interpretar pero pueden conducir a falsas conclusiones por las siguientes razones: 1) El dendrograma correspondiente a un conglomerado jerárquico no es único, puesto que por cada junte de clusters (merge) uno necesita especificar que sub-árbol va a la derecha y cuál a la izquierda. Por default la función hclust ordena los arboles de tal manera que los conglomerados más concentrados van a la izquierda. 2) La estructura jerárquica del Dendrograma no representa fielmente las verdaderas distancias entre los objetos distintos del conjunto de datos.
Image of page 3

Info icon This preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
El coeficiente de correlación cofenético puede ser usado para medir cuan bien la estructura jerárquica del dendrograma representa a las v erdaderas distancias. Se define como la correlación entre las n ( n - 1) / 2 pares de dissimilaridades y sus distancias cofenéticas del dendrogramas (es la distancia de similiraidad a la cual dos observaciones que aparecen en un mismo cluster fueron consideradas juntas por primera vez). La función cophenetic calcula la distancia cofenéticas . d1=dist(t(golub)) golubh=hclust(d1, method=”ave”) d2=cophenetic(golubh) cor(d1,d2) La correlacion cofenética da 0.7606. El dendrogram no es tan confiable
Image of page 4
Ejemplo de un dendrograma y sus cortes treegolub=as.dendrogram(hgolub) golubh= cut (treegolub,h=50) > golubh $upper 'dendrogram' with 2 branches and 2 members total, at height 54.29456 $lower $lower[[1]] 'dendrogram' leaf '21', at height 0 $lower[[2]] 'dendrogram' with 2 branches and 37 members total, at height 47.57777
Image of page 5

Info icon This preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
21 29 38 33 37 30 36 12 25 34 35 28 31 32 17 3 6 23 10 9 11 2 14 18 20 26 16 19 13 24 5 15 27 1 4 7 8 22 25 35 45 55 Cluster Dendrogram hclust (*, "average") dist(t(golub)) Height 0 10 20 30 40 50 Branch 1 Branch 2 0.00 0.02 0.04 0.06 21 0 10 20 30 40 29 38 33 37 30 36 12 25 34 35 28 31 32 17 3 6 23 10 9 11 2 14 18 20 26 16 19 13 24 5 15 27 1 4 7 8 22
Image of page 6
Heatmaps. Son gráficas que muestran simultaneamente las agrupaciones en conglomerados de columna y filas. La función heatmap permite hacer heatmaps usando un gran número de tonalidades de colores. iris1=read.table("http://math.uprm.edu/~edgar/iris.dat") iris1=as.matrix(iris[,1:4]) heatmap(iris1,col=heat.colors(16)) heatmap(iris1,col=topo.colors(256)
Image of page 7

Info icon This preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
Ejemplo de heatmaps para Iris Notar que solo las variables 2 y 3 determinan claramente las 3 clases de iris.
Image of page 8
Algoritmo jerárquico aglomerativo Suponiendo que tenemos una matriz de datos m x n.
Image of page 9

Info icon This preview has intentionally blurred sections. Sign up to view the full version.

View Full Document Right Arrow Icon
Image of page 10
This is the end of the preview. Sign up to access the rest of the document.

{[ snackBarMessage ]}

What students are saying

  • Left Quote Icon

    As a current student on this bumpy collegiate pathway, I stumbled upon Course Hero, where I can find study resources for nearly all my courses, get online help from tutors 24/7, and even share my old projects, papers, and lecture notes with other students.

    Student Picture

    Kiran Temple University Fox School of Business ‘17, Course Hero Intern

  • Left Quote Icon

    I cannot even describe how much Course Hero helped me this summer. It’s truly become something I can always rely on and help me. In the end, I was not only able to survive summer classes, but I was able to thrive thanks to Course Hero.

    Student Picture

    Dana University of Pennsylvania ‘17, Course Hero Intern

  • Left Quote Icon

    The ability to access any university’s resources through Course Hero proved invaluable in my case. I was behind on Tulane coursework and actually used UCLA’s materials to help me move forward and get everything together on time.

    Student Picture

    Jill Tulane University ‘16, Course Hero Intern