Los parmetros utilizados para l a ejecucin de los

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: BSEJ y Pazzani-EDA son significativos en 15 conjuntos de datos. A demás, otra ventaja de utilizar la búsqueda heurística con EDAs es que las estructuras de Pazzani encontradas suelen ser más sencillas, tanto en número de atributos utilizados 5.6. Pazzani-EDA 95 Pazzani-EDA Pazzani-EDA breast chess eleve corral crx fiare german glass glassS hepatitis iris lymphography mofn-3-7-10 pima Num. Eval. 97,82 zt 0,06 t 97,93 ± 0,24 t 86,98 ± 1,18 t 100,00 ± 0,00 t 89,23 ± 0,07 t 84,04 ± 0,00 t 20600 44900 49600 7400 80200 9700 78,41 ± 0,06 t 90900 77,93 87,04 93,64 95,97 t t t t 40200 7700 55800 3600 93,88 ± 0,00 t 48900 100,00 79,82 86,94 96,15 ± ± ± ± 7 15 5 3 7 4 11 5 5 7 1 7 2 4 7 7 39600 7300 105300 24300 shutÜe-small 99,90 ± 0,00 t 30200 7 5 soybean-large vehicle vote waveform-21 9 5,67 76,50 96,77 79,72 50500 61300 30200 89200 32 12 7 17 20 7 4 9 segment ± ± ± ± 0,00 0,28 0,12 0,06 Grupos t t t t satimage ± ± ± ± 0,00 0,00 0,29 0,00 Atributos 10 26 9 5 12 5 17 7 6 11 1 15 8 7 12 14 0,17 0,32 0,13 0,07 t t t t Tabla 5 .7: Resultados experimentales del algoritmo Pazzani-EDA (hay que recordar en este punto que los algoritmos de Pazzani realizan, de forma implícita, u na selección de variables), como en el número total de uniones empleadas. A la vista de los resultados se puede apreciar que el algoritmo BSEJ utiliza una media de 15 atributos y 12 uniones, mientras que el algoritmo Pazzani-EDA utiliza una media de 12 atributos y 7 u niones. C onclusiones E n esta sección se ha presentado una extensión a los algoritmos heurísticos FSSJ y B SEJ de Pazzani, que permite realizar la búsqueda de la mejor estructura de Pazzani con los algoritmos heurísticos de optimización EDA. L os resultados obtenidos por Pazzani-EDA son muy buenos. Por un lado se ha conseguido mejorar los resultados de los algoritmos FSSJ y BSEJ de Pazzani. Por otra parte, l as estructuras encontradas por Pazzani-EDA son más sencillas que las encontradas por los algoritmos voraces FSSJ y BSEJ. L íneas de trabajo futuro D entro de los 6 algoritmos semi naíve-Bayes presentados hasta el momento, el que m ejores resultados ha obtenido es Pazzani-EDA con una mejora media de 5,51 %, seguido 96 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional breast chess eleve corral crx fiare german glass glass2 hepatitis iris lymphography mofn-S-7-10 pima satimage segment shuttle-small soyhean-large vehicle vote waveform-21 Mejora media Comparación resultados experimentales Pazzani-FSSJ Pazzani-BSEJ 0,42 0,28 6,41 9,14 1,28 1,61 - 9,57 9,33 0,56 1,87 3,18 3,18 1,78 2,28 1,76 1,76 4 ,83 4 ,83 6,40 3,80 1,30 1,30 - 0,79 5,34 - 9,01 1,94 2,06 2,06 3,71 4 ,38 4 ,37 3,94 0,54 0,38 0,57 1,74 9,30^ 11,19 6,66 4 ,36 - 9,20 0,85 1,25 3,61 Pazzani-EDA 0,68 10,01 3,16 15,63 3,00 3,18 3,01 3,16 4,83 8,48 1,30 8,74 13,67 2,09 4,48 4,20 0,54 2,84 15,03 6,66 0,87 5,51 Tabla 5.8: Comparación respecto a naíve Bayes de los resultados experimentales de los algoritmos q ue utilizan el concepto de producto cartesiano entre variables por lENB con una mejora media de 4 ,93%. Sin embargo, estos algoritmos son totalmente compatibles, siendo posible realizar en una primera instancia la búsqueda de la mejor estructura de Pazzani con el algoritmo Pazzani-EDA, para a continuación aplicar la estimación por intervalo propuesta en el l ENB. 5.7. 5 .7.1. Búsqueda de clasificadores BAN P ropuesta Frente a los métodos de búsqueda que se encuentran actualmente en la literatura [FGG97, Sah96], que están basadas en la cantidad de información mutua entre las variables predictoras, en esta sección se presentan dos algoritmos para la búsqueda de la mejor e structura de tipo Augmented naive-Bayes (BAN). El primer algoritmo está basado en una búsqueda voraz, mientras que el segundo está basado en una búsqueda heurística con EDAs. Ambos algoritmos están guiados por el tanto por ciento de bien clasificados. En las siguientes secciones se describe el formato de los individuos para este tipo de búsquedas y se analizan los dos algoritmos, el voraz y el heurístico. Se concluye con la 5 .7. Búsqueda de clasificadores BAN 97 p resentación de los resultados conseguidos. 5 .7.2. Formato de los individuos C omo se vio en el capítulo 3, el único requisito que debe cumplir una red Bayesiana p ara ser de tipo BAN, es que no se formen ciclos entre las variables predictoras. E n la figura 5.13 está representada una red de tipo BAN y el individuo que la representa. Ya que siempre existen arcos entre la variable a clasificar y las variables predictoras, n o hace falta incluir esta información en la representación del individuo. X, 0 Xs 0 X3 X4 0 0 X3 1 0 0 1 0 0 0 0 X4 0 1 1 0 X, Xa F igura 5.13: Representación de los individuos BAN D e esta forma, para un conjunto de datos con n v ariables predictoras, el individuo s erá una matriz cuadrada de rango n, d onde cada posición puede tomar el valor O ó 1. Un v alor de 1 en la posición {i, j) d e la matriz, representa que existe un arco de la var...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online