10200313

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: g ran medida los resultados de APNBC. 5 .6. Pazzani-EDA 5.6.1. Propuesta Siguiendo con lafilosofíade la sección anterior (aplicar los algoritmos heurísticos EDA p ara la búsqueda de estructuras semi na'íve-Bayes), en esta sección se propone la búsqueda h eurística de estructuras basadas en el producto cartesiano de variables [RLP'*"03d]. P or tanto, esta sección describe cómo se puede realizar la búsqueda de la estructura d e Pazzani que maximice el tanto por ciento de bien clasificados a través de algoritmos heurísticos de optimización EDAs. Para poder realizar la mejor comparación posible se h an implementado los algoritmos voraces BSEJ y FSSJ descritos por Pazzani. A c ontinuación se describe el formato de los individuos utilizados en la optimización heurística y se presentan los resultados experimentales obtenidos con los conjuntos de d atos del repositorio UCI descritos en la sección 5.1. 5.6. Pazzani-EDA 5.6.2. 93 Formato de los individuos E n la figura 5.12 se pueden ver dos ejemplos de estructura de Pazzani y los individuos q ue representan dichas estructuras. Clase X.i & X2 & X3 & X ( 1,1,1,1) F igura 5.12: E structuras de Pazzani e individuos que las representan D e esta forma, para un conjunto de datos con n a tributos, los individuos tendrán n g enes, c ada uno de ellos con un valor entero de O a n . El valor O r epresenta que el atributo c orrespondiente no se tiene en cuenta en la estructura de Pazzani, mientras que un valor entre 1 y n significa que el correspondiente atributo pertenece a dicho grupo dentro de la e structura de Pazzani. 5.6.3. Resultados Resultados experimentales L as pruebas realizadas con los algoritmos voraces BSEJ y FSSJ y el algoritmo PazzaniEDA se ejecutaron sobre un Athlon 2000+ con 1GByte de memoria RAM. Los parámetros u tilizados para la ejecución de los EDAs fueron: tamaño de población 500 individuos, individuos seleccionados para aprendizaje 500, número de nuevos individuos cada generación {offspnng) 1000, tipo de aprendizaje UMDA ( Univariate Marginal Distrihution Algorithm) [Müh98] y elitismo. Cada prueba ha sido ejecutada 10 veces. Los resultados experimentales obtenidos para los algoritmos voraces FSSJ y BSEJ se pueden ver en la tabla 5.6. Las cuatro primeras columnas presentan los resultados d el algoritmo FSSJ y las cuatro últimas los resultados del algoritmo BSEJ. De la misma f orma, en la tabla 5.6.3 se encuentran los resultados del algoritmo Pazzani-EDA. Para cada a lgoritmo se recogen los siguientes valores: tanto por ciento de bien clasificados obtenidos, n úmero de evaluaciones necesarias para obtener el resultado, número de atributos usados e n la estructura final y número de uniones (joins) e n la estructura final. En la tabla 5.6.3 se encuentra la comparación de los resultados obtenidos con los tres a lgoritmos que utilizan el concepto de producto cartesiano de variables: FSSJ, BSEJ y E DA. En la primera columna de la tabla se muestran los resultados del algoritmo FSSJ, e n la segunda columna los del BSEJ y en la tercera y última columna los de Pazzani-EDA. 94 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional Algoritmos voraces FSSJ y BSEJ de Pazzani FSSJ BSEJ Result. Eval. Atrib. Result. Eval. Atrib. Grupos 2 97,42 97,56 3 200 10 80 1 97,06 14256 94,33 396 5 35 3 12 169 4 85,43 676 85,10 1 93,70 1 108 6 74,80 18 2 14 86,79 195 5 88,10 1125 2 84,04 84,04 500 6 90 3 breast chess eleve corral crx fiare german Grupos 9 26 10 4 11 6 7 3 77,68 2400 19 15 153 99 4 56 12 5 4 7 1 3 2 3 1 7 6,53 87,04 88,96 95,97 162 162 1083 32 9 9 18 3 8 8 17 3 84,35 252 4 3 90,48 972 18 16 77,32 79,79 86,17 96,32 30 72 828 589 72 3010 . 162 128 189 1 4 7 7 1 1 3 4 88,27 79,79 8 6,84 95,89 200 192 12914 3971 9 6 36 18 9 6 22 10 3 2 99,90 324 9 6 13 8 1 2 1 94,57 72,66 94,47 79,70 7350 3240 1792 89 34 17 15 21 30 ,9 10 19 77,18 glass glass2 hepatitis iris lymphography mofn-3-7-10 pima satimage segment 7 6,53 87,04 91,56 95,97 shuttle-small 99,74 soybean-large vehicle vote waveform-21 93,40 70,77 96,77 69,65 500 4 3 4 T abla 5.6: Resultados experimentales de los algoritmos voraces FSSJ y BSEJ de Pazzani T eniendo en cuenta todos los conjuntos de datos, el algoritmo FSSJ muestra una m ejora media respecto a nai've-Bayes de 1,25 %, el algoritmo BSEJ de 3,61 % y el algoritmo P azzani-EDA de 5,51 %. T ambién se ha utilizado el test no paramétrico de Mann-Whitney para validar la hipótesis nula de la misma distribución de densidad para cada uno de los conjuntos de prueba. E sta tarea se realizó con el paquete estadístico S.P.S.S. versión 11.50. Los resultados de e stas pruebas se muestran a continuación. • P ruebas del clasificador Pazzani-EDA: • N aíve-Bayes vs. Pazzani-EDA. Valor de ajuste en todos los conjuntos de datos: J X 0 ,001. • P azzani-BSEJ vs. Pazzani-EDA. Valor de ajuste en 15 conjuntos de datos: p < 0 ,001. E n todos los conjuntos de datos menos: fiare, glass2, iris, pima, satimage y shuttle-small E stos resultados demuestran que la diferencia entre Pazzani-...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online