4 comparacin de los resultados obtenidos con lenb e

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ienen, por orden, el siguiente c ontenido: el tanto por ciento de bien clasificados obtenido con el clasificador nai've-Bayes, l a media y la desviación típica del tanto por ciento de bien clasificados obtenido con l ENB (el símbolo f indica que la diferencia entre naiVe-Bayes e lENB es estadísticamente s ignificativa), número medio de evaluaciones necesarias para obtener el resultado y mejora o btenida respecto al clasificador naive-Bayes. Los resultados obtenidos son muy satisfactorios, ya que, como se puede observar, el a lgoritmo lENB es claramente superior a naíve-Bayes. Para el percentil 95 se ha obtenido u na mejora media de 4,65 % r especto al porcentaje de bien clasificados, mientras que con el percentil 98 esta mejora aumenta a 4 ,93%. A demás, se ha utilizado el test no paramétrico de Mann-Whitney para comprobar l a hipótesis nula de la misma distribución de densidad para cada uno de los conjuntos 5.3. Interval Estimation naive-Bayes - lENB 79 Interval Estimation naive-Bayes (Percentil 95) Naive-Bayes 97,14 87,92 83,82 breast chess eleve corral crx fiare german 84,37 lENB 95 9 7,71 ± 0,00 t 93,31 ± 0,10 t 86,29 ± 0,17 t 93,70 ± 89,64 ± 82,69 ± 81,57 ± 0,00 0,10 0,13 0,10 Num. eval. 8600 109000 28200 Mejora 0,57 5,39 2,47 43300 9,33 63100 16000 3,41 1,83 6,17 8,23 t i t t 188900 83,00 ± 0,20 t 33000 glass 8 6,23 80,86 75,40 74,77 glass2 82,21 88,27 ± 0,00 t 5500 6,06 hepatitis iris 92,60 ± 0,34 t mofn-3-7-10 85,16 94,67 85,14 8 6,33 23400 5500 49700 129100 pima 77,73 satimage segment 82,46 91,95 99,36 9 2,83 61,47 9 0,11 78,85 79,84 ± 83,88 ± 96,38 ± 99,90 ± 7,44 1,30 9,42 8,98 2,11 1,42 4 ,44 0,54 2,84 lymphography shuttle-small soyhean-large vehicle vote waveform-21 95,97 ± 0,00 t 94,56 ± 0,00 t 9 5,31 dz 0,00 t 0,09 0,32 0,08 0,00 t t t t 95,67 db 0,10 t 71,16 ± 0,25 t 95,07 ± 0,19 t 79,81 ± 0,10 t 19300 93500 145100 16600 61000 129100 28100 28700 9,69 4 ,96 0,96 T abla 5.2: Resultados experimentales de Interval Estimation naive-Bayes (Percentil 95) d e prueba. Esta tarea se realizó con el paquete estadístico S.P.S.S. versión 11.50. Los r esultados de estas pruebas se muestran a continuación. • P ruebas del clasificador lENB: • N aive-Bayes vs. lENB 95. Valor de ajuste en todos los conjuntos de datos: p < 0,001. • N aive-Bayes vs. lENB 98. Valor de ajuste en todos los conjuntos de datos: p < 0,001. • lENB 95 vs. lENB 98. Valor de ajuste p < 0,001 sólo en siete conjuntos de d atos: chess, eleve, crx, fiare, satimage, segment y vehicle. E stos resultados demuestran que la diferencia entre naive-Bayes e lENB es significativa e n todos los conjuntos de datos, independientemente del valor del percentil utilizado en el clasificador lENB. Sin embargo, sólo en siete de los 21 conjuntos de datos hay diferencia significativa entre lENB con percentil 95 e lENB con percentil 98. R especto a Iterative Bayes [GamOO], el enfoque semi naive-Bayes más similar a lENB, la comparación también muestra una superioridad de lENB. En la tabla 5.4 se puede ver esta comparación. El símbolo f indica que la diferencia respecto a naive-Bayes es estadísticamente significativa. Excepto en los conjuntos de datos iris y satimage, lENB se m uestra claramente superior. 80 Clasificación Supervisada Basada en RRBB. Apficación en Biología Computacional breast chess eleve corral crx fiare german glass glassB hepatitis iris lymphography mofn-3-7-10 pima satimage segment shutüe-small soybean-large vehicle vote waveform-21 Interval Estimation Nawe-Bayes 97,14 87,92 83,82 8 4,37 8 6,23 80,86 7 5,40 74,77 8 2,21 85,16 94,67 85,14 8 6,33 7 7,73 82,46 91,95 99,36 9 2,83 6 1,47. 9 0,11 78,85 naive-Bayes (Percentü 98) lENB 98 Num. eval. 9 7,71 dz 0,00 t 7600 93,87 ± 0,04 t 119300 86,92 ± 0,23 t 45200 9 3,70 ± 0,00 t 56000 9 0,11 ± 0,11 t 101100 8 3,47 ± 0,00 t 51400 81,82 ± 0,12 t 188100 83,00 db 0,23 t 36400 88,27 ± 0,00 t 6700 92,99 ± 0,27 t 23100 95,97 ± 0,00 t 4500 9 4,83 ± 0,22 t 46100 95,31 ± 0,00 t 20500 80,09 ± 0,06 t 28300 8 4,38 ± 0,35 t 123500 96,75 ± 0,12 t 181500 99,90 ± 0,00 t 19300 95,67 ± 0,10 t 73500 72,41 ± 0,35 t 146400 95,16 ± 0,17 t 20500 80,09 ± 0,11 t 35800 Mejora 0,57 5,95 3,10 9 ,33 3,88 2,61 6,42 8,19 6,06 7,83 1,30 9,69 8,98 2,36 1,92 4 ,80 0,54 2,84 10,94 5,05 1,24 T abla 5.3: Resultados experimentales de Interval Estimation naive-Bayes (Percentil 98) L a calidad de los clasificadores también ha sido comparada a través de las curvas ROC. Así, por ejemplo, para el conjunto de datos corral, se obtienen las curvas de la figura 5.5. E stas curvas ROC se han obtenido y analizado con el programa Analized-it. L as áreas o btenidas bajo las curvas ROC son: 0,921 para el clasificador naive-Bayes, 0,944 p ara el clasificador obtenido con lENB con percentil 95 y 0,960 p ara el clasificador obtenido con l ENB con percentil 98. Estos datos indican que el mejor de los clasificadores es el obtenido con lENB con percentil 98. Conclusiones E n esta sección se ha propuesto un nuevo algoritmo semi nai've-Bayes denominado Interval Estimation naive-Bayes ( lENB). Este algoritmo se puede...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online