Cada prueba ha sido ejecutada 10 veces los resultados

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ntos d e datos, el enfoque APNBC empeora los resultados obtenidos por el clasificador naiVeBayes. E n el caso de utihzar EDAs continuos, para la búsqueda de los factores de ajuste, es necesario definir el formato de los individuos. Para cada gen del individuo, se deben definir un valor máximo y un valor mínimo dentro de los cuales se realizará la búsqueda. D e esta forma, para un problema con n c lases se utilizará un individuo con n — 1 g enes - y a q ue la última clase se ajustará siempre con 1 - y cada gen del individuo tendrá un valor m ínimo de O y u n valor máximo de 5. Se ha demostrado experimentalmente que nunca se llegan a seleccionar estos valores extremos, por lo que se considera que el intervalo definido es idóneo para la búsqueda. Además, cada individuo será validado a través del método leave-one-out. 5 .5.3. R esultados Resultados experimentales Las pruebas realizadas con APNBC-EDA se ejecutaron sobre un Athlon 2000+ con I GByte de memoria RAM. Los parámetros utilizados para la ejecución de los EDAs fueron: tamaño de población 500 individuos, individuos seleccionados para aprendizaje 500, 5 .5. A PNBC-EDA 91 n úmero de nuevos individuos cada generación (offspring) 1000, tipo de aprendizaje UMDA ( Univariate Marginal Distribution Algorithm) [Müh98] y elitismo. Cada prueba ha s ido ejecutada 10 veces. breast chess eleve corral crx fiare german glass glass2 hepatitis iris lymphography mofn-3-7-10 pima satimage segment shuttle-small soybean-large vehicle vote waveform-21 NB 97,14 87,92 83,82 84,37 8 6,23 80,86 75,40 74,77 82,21 85,16 94,67 85,14 8 6,33 77,73 82,46 91,95 99,36 9 2,83 61,47 9 0,11 78,85 APNBC-EDA APNBC-EDA Num. 97,57 ± 0,00 t 88,14 ± 0,00 t 84,16 ± 0,00 t 9 0,63 ± 0,00 t 86,96 ± 0,00 t 83,77 ± 0,00 t 75,90 ± 0,00 t 79,44 ± 0,00 t 88,34 ± 0,00 t 88,39 ± 0,00 t 96,00 ± 0,00 t 86,49 ± 0,00 t 98,24 ± 0,04 t 7 9,43 ± 0,00 t 85,19 ± 0,00 t 92,68 ± 0,00 t 9 9,47 ± 0,00 t 9 3,70 ± 0,00 t 6 5,25 ± 0,17 t 9 0,57 ± 0,00 t 8 0,21 ± 0,05 t Eval. 2600 11300 7500 1500 10400 4000 30600 7500 2200 3300 3200 3500 5500 5500 25500 11400 6500 13700 6600 5400 3100 Mejora 0,43 0,22 0,34 6,26 0,73 2,91 0,50 4 ,67 6,13 3,23 1,33 1,35 11,91 1,70 2,73 0,73 0,11 0,87 3,78 0,46 1,36 Mejora APNBC -0,20 -1,00 - 0,20 0,60 1,40 - 0,50 - 1,50 5,00 T abla 5.5: Resultados experimentales de APNBC-EDA L os resultados experimentales de APNBC -extraídos del artículo original [WP98]y de APNBC-EDA se pueden ver en la tabla 5.5. Las columnas de dicha tabla tienen, p or orden, el siguiente contenido: el tanto por ciento de bien clasificados obtenido con el clasificador naive-Bayes, la inedia y la desviación típica del tanto por ciento de bien clasificados obtenidos con APNBC-EDA, el número medio de evaluaciones necesarias para o btener el resultado, la mejora obtenida respecto al clasificador naive-Bayes, y la mejora o btenida por APNBC según el artículo original. Sólo se tiene el resultado de APNBC en ocho de los 21 conjuntos de datos utilizados. D e estos ocho conjuntos, en seis APNBC-EDA se muestra muy superior a APNBC, en uno lymphography se consigue prácticamente el mismo resultado y extrañamente, en el conjunto waveform-21, m ientras que APNBC mejora un 5,00 %, APNBC-EDA sólo consigue mejorar 1,36%. Sin embargo, es interesante reseñar otros aspectos. En los ocho conjuntos de datos c itados, APNBC-EDA consigue una mejora media de 1,01%, mientras que APNBC sólo c onsigue un 0,45 % de mejora. Si se tienen en cuenta los 21 conjuntos de datos, APNBCEDA consigue una mejora media de 2,46%. Por último, cabe destacar que APNBC sólo c onsigue mejorar los resultados de naive-Bayes en tres de los ocho conjuntos, mientras que 92 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional A PNBC-EDA mejora en absolutamente todos los conjuntos de datos. Estos datos indican l a gran superioridad de APNBC-EDA respecto al enfoque APNBC. T ambién se ha utilizado el test no paramétrico de Mann-Whitney para validar la hipótesis nula de la misma distribución de densidad para cada uno de los conjuntos de prueba. Esta tarea se realizó con el paquete estadístico S.P.S.S. versión 11.50. Los resultados de e stas pruebas se muestran a continuación. - P ruebas del clasificador APNBC-EDA: • NaiVe-Bayes vs. APNBC-EDA. Valor de ajuste en todos los conjuntos de datos: p < 0 ,001. E stos resultados demuestran que la diferencia entre na'íve-Bayes y APNBC-EDA es significativa en todos los conjuntos de datos. Conclusiones E l enfoque APNBC realiza, sobre los valores obtenidos por el clasificador naive-Bayes, u n ajuste lineal del peso de la probabilidad de cada clase. De esta forma, se asigna un f actor de ajuste a cada clase y su probabilidad estimada se multiplica por este factor. E n APNBC la búsqueda de estos valores de ajuste se realiza a través de un algoritmo de " ascenso por la colina". E n esta sección se ha descrito una extensión del. algoritmo APNBC, denominada A PNBC-EDA, que realiza la búsqueda de los valores de ajuste por medio de los algoritmos heurísticos EDAs. Los resultados obtenidos son muy satisfactorios, ya que se ha conseguido mejorar en...
View Full Document

Ask a homework question - tutors are online