E n caso negativo xj es hija de c y s iguiendo las c

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: numUnos > 1 => E legir aleatoriamente uno y eliminar el resto F igura 5.16: Pseudocódigo de la corrección de un individuo TAN 5 .8.5. Resultados Resultados experimentales L as pruebas realizadas con el algoritnao TAN-voraz y el algoritmo TAN-EDA se ejecutaron sobre un Athlon 2000+ con 1GByte de memoria RAM. Los parámetros utilizados p ara la ejecución de los EDAs fueron: tamaño de población 500 individuos, individuos seleccionados para aprendizaje 500, número de nuevos individuos cada generación {offspring) 1000, t ipo de aprendizaje UMDA ( Univariate Marginal Distribution Algorithm) [Müh98] y e litismo. Cada prueba ha sido ejecutada 10 veces. L os resultados experimentales obtenidos para el algoritmos voraz TAN-voraz, el algoritmo heurístico TAN-EDA y el algoritmo de búsqueda de Priedman [FGG97] se pueden ver en la tabla 5.8.5. Las cuatro primeras columnas presentan los resultados del algoritmo TAN-voraz, las cuatro siguientes los resultados del algoritmo TAN-EDA y la última los resultados de Priedman. Para los algoritmos TAN-voraz y TAN-EDA se recogen los s iguientes valores: tanto por ciento de bien clasificados obtenidos, número de evaluaciones n ecesarias para llegar al resultado, número de arcos usados en la estructura final y mejora conseguida respecto a nai've-Bayes. breast eleve corral crx fiare glass glass2 iris mojn-3-7-10 pima vote voraz 97,99 86,47 100,00 8 9,71 8 4,71 84,58 88,34 96,67 96,09 8 0,47 96,32 TAN-voraz Eval Ar 300 3 2 429 72 2 1155 5 390 5 234 10 2 189 24 3 4 40 7 176 3 1040 4 Mej 0,85 2,65 15,63 3,48 3,85 9,81 6,13 2,00 9,76 2 ,74 6,21 TAN-EDA TAN-EDA Eval 98,26 ± 0,04 t 8100 87,46 ± 0,00 t 10900 100,00 ± 0,00 t 1400 90,22 ± 0,09 t 6249 8 4,71 ± 0,00 t 2 300 85,05 ± 0,00 t 4600 88,34 ± 0,00 t 2900 96,67 ± 0,00 t 200 7400 96,09 ± 0,00 t 8 0,47 ± 0,00 t 3 800 9 7,93 ± 0,00 t 9600 Ar 7 6 3 9 6 7 2 3 8 3 11 Mej 1,12 3,64 15,63 3,99 3,85 10,28 6,13 2,00 9,76 2,74 7,82 F ried. Mej Fr -0,42 -1,00 10,18 - 0,46 2,81 - 1,88 - 1,25 0,67 4,68 0,01 3,22 T abla 5.10: Resultados experimentales de los algoritmos TAN-voraz, TAN-EDA y algoritmo de Priedman A mbos algoritmos, TAN-voraz y TAN-EDA, son muy superiores a la búsqueda de 5.9. Búsqueda de clasificadores MB 103 Friedman basada en la cantidad de información mutua entre las variables predictoras. TAN-voraz consigue una mejora media, respecto a naíve-Bayes, de 5,74 % con una media de 4 arcos en las estructuras obtenidas. Por su parte, TAN-EDA consigue una mejora media de 6,09%, con un número medio de 6 arcos en las estructuras obtenidas. También se ha utilizado el test no paramétrico de Mann-Whitney para validar la hipótesis nula de la misma distribución de densidad para cada uno de los conjuntos de prueba. E sta tarea se realizó con el paquete estadístico S.P.S.S. versión 11.50. Los resultados de estas pruebas se muestran a continuación. . Pruebas del clasificador TAN-EDA: • Naíve-Bayes vs. TAN-EDA. Valor de ajuste en todos los conjuntos de datos: p < 0,001. • TAN-voraz vs. TAN-EDA. Valor de ajuste en 5 conjuntos de datos: p < 0,001. Los conjuntos de datos son: breast, eleve, crx, glass y vote. Por tanto, TAN-EDA muestra una mejora significativa respecto a TAN-voraz en sólo 5 conjuntos de los 11 evaluados. C onclusiones En esta sección se han presentado dos algoritmos para la búsqueda de estructuras tipo TAN. El primer algoritmo, denominado TAN-voraz, está basado en una búsqueda voraz, mientras que el segundo, denominado TAN-EDA, está basado en una búsqueda heurística con EDAs. Ambos algoritmos han sido comparados con las búsquedas realizadas por Friedman, que están basadas en la cantidad de información mutua entre las variables predictoras. Los resultados obtenidos muestran que ambos algoritmos desarrollados son muy superiores al enfoque de Friedman. Lineéis de trabajo futuro Las estructuras TAN han demostrado ser muy superiores al clasificador naiVe-Bayes. Sin embargo, es muy posible que los resultados de TAN puedan ser mejorados introduciendo la idea expuesta en el algoritmo lENB, es decir, realizando una estimación por intervalo de los parámetros necesarios. 5.9. 5 .9.1. Búsqueda de clasificadores MB P ropuesta El Markov hlanket (MB) de una variable, en una red Bayesiana, es el conjunto de padres, hijos, y padres de hijos de esa variable. De este modo, el objetivo es buscar individuos en los que se cumpla que el MB de la variable clase sea el conjunto de todas las variables predictoras del problema. 104 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional E l enfoque MB presenta dos problemas principales. El primero de ellos es que el espacio d e búsqueda no se reduce de forma considerable, lo que lleva a un proceso de aprendizaje e structural lento y muy costoso. El segundo problema consiste en que MB tiene la tendencia d e sobreajustarse a los datos de entrenamiento, dando por ello peores resultados de los e sperados. C on el objetivo de paliar ambos problemas, se ha realizado un nuevo enfoque que relaja las condiciones que deben cumplirse para que la estructura sea considerada MB. Para e...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online