Ambos algoritmos estn guiados por el tanto por ciento

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: iable p redictora Xi a l a variable predictora Xj. E n la fase de búsqueda de clasificadores tipo BAN, dependiendo del algoritmo empleado, v oraz o heurístico, la acción a realizar sobre los individuos será diferente. En el caso d el algoritmo voraz, se debe verificar que cada individuo generado en la búsqueda cumple l a restricción de no tener ciclos. En caso de que el individuo tenga ciclos, éste no se tiene el cuenta, y se continúa la búsqueda sin evaluarlo. P or otra parte, en el algoritmo heurístico, se tratará de que todos los individuos de la p oblación sean correctos. Cada individuo generado por el algoritmo será corregido en caso n ecesario, para su posterior evaluación e inserción en la población. 5 .7.3. A lgoritmo B A N - v o r a z E l pseudocódigo del algoritmo BAN-voraz es el siguiente: • Paso 1: I nicializar con el modelo naive-Bayes con todas las variables predictoras. • Paso 2: P artiendo del mejor individuo del paso anterior: • T entativamente añadir un arco entre dos variables predictoras. • E valuar cada posible opción válida por medio de la estimación del porcentaje d e bien clasificados. 98 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional H asta que ninguna opción produzca mejoras. 5 .7.4. Algoritmo BAN-EDA D entro del algoritmo heurístico, como ya se comentó, es importante que todos los i ndividuos de la población sean correctos. En la figura 5.14 se muestra el pseudocódigo u tilizado para corregir los individuos. Con este algoritmo se asegura que, en un número finito de pasos, el grafo obtenido es acíclico. rango = numeroV ariahles listaD escariadas listaCandidatas =0 =0 w hile rango 7^ O y 3fila t .q. numUnos =O p ara cada fila Si fila ^ listaD escariadas => c alcular numUnos Si numUnos = O =^ fila -^ listaD escariadas • dec{rango) fila = 1 listaCandidatas =0 else =^ fila -^ listaCandidatas Si no 3fila t .q. numUnos = O y rango ^ O elegir aleatoriamente filai € listaCandidatas p oner O e n columnas cuya fila ^ fila —í- listaDescartadas listaDescartadas d.ec(rango) F igura 5.14: Pseudocódigo de la corrección de un individuo HAN 5 .7. Búsqueda de clasificadores BAN 5.7.5. 99 Resultados Resultados experimentales L as pruebas realizadas con el algoritmo voraz y el algoritmo BAN-EDA se ejecutaron s obre un Athlon 2000+ con 1GByte de memoria RAM. Los parámetros utilizados para l a ejecución de los EDAs fueron: tamaño de población 500 individuos, individuos seleccionados para aprendizaje 500, número de nuevos individuos cada generación (offspring) 1000, t ipo de aprendizaje UMDA {Univariate Marginal Distribution Algorithm) [Müh98] y e litismo. Cada prueba ha sido ejecutada 10 veces. L os resultados experimentales obtenidos para el algoritmo BAN-voraz, el algoritmo h eurístico BAN-EDA y el algoritmo de búsqueda de Friedman [FGG97] se pueden ver e n la tabla 5.7.5. Las cuatro primeras columnas presentan los resultados del algoritmo BAN-voraz, las cuatro siguientes los resultados del algoritmo BAN-EDA y la última los r esultados de Friedman. Para los algoritmos BAN-voraz y BAN-EDA se recogen los siguientes valores: tanto por ciento de bien clasificados obtenidos, número de evaluaciones n ecesarias para llegar al resultado, número de arcos usados en la estructura final y mejora c onseguida respecto a naíve-Bayes. breast eleve corral crx fiare glass glass2 iris mofn-3-7-10 pima vote voraz 97,99 86,14 100,00 88,98 84,52 84,58 88,34 96,67 98,43 BAN-voraz Eval Ar 400 4 2 468 2 90 975 4 490 6 270 3 216 2 40 3 340 3 80,08 208 3 96,32 1296 5 Mej 0,85 2,32 1 5,63 2,75 3,66 9,81 6,13 2,00 12,10 2,35 6,21 BAl V-EDA Eval BAN-EDA 99,42 ± 0,52 t 8500 97,32 ± 0,47 t 100,00 92,80 86,02 85,05 2 000 8600 3 200 5500 88,34 ± 0,00 t 4300 ± ± ± ± 0,00 1,03 0,13 0,00 11000 t t t t 96,67 98,57 81,90 99,54 ± ± ± ± 0,00 2,45 0,00 1,05 t f t t 400 15200 4 500 15300 Ar 29 Mej 2,28 54 13,50 10 22 22 19 16 3 16 10 32 F ried. Mej Fr - 0,44 -1,37 15,63 6,57 5,16 10,28 11,72 -0,62 3,28 - 14,09 6,13 -3,68 2,00 12,24 4 ,17 9,43 0,67 - 0,49 - 0,51 4,6 T abla 5.9: Resultados experimentales de los algoritmos BAN-voraz, BAN-EDA y algoritmo de Friedman E n esta ocasión los resultados necesitan una lectura diferente. Si bien es cierto que el algoritmo que mejores resultados presenta es BAN-EDA, no menos cierto es que las e structuras encontradas por dicho algoritmo son demasiado complejas. Esto hace suponer q ue BAN-EDA se está sobreajustando a los datos de aprendizaje. B AN-voraz consigue una mejora media de 5,80% con una media de 3 arcos en las e structuras obtenidas. Por su parte, BAN-EDA consigue una mejora media de 7,94%, p ero el número medio de arcos en las estructuras obtenidas es de 21. Estos datos, unidos al número medio de evaluaciones necesario para obtener los resultados, hacen que la r ecomendación en este caso se decante por el algoritmo BAN-voraz. P or último, cabe destacar que ambos algoritmos, BAN-voraz y BAN-EDA, son muy s uperiores al enfoque de Friedman basado en la cantidad de info...
View Full Document

Ask a homework question - tutors are online