A plicando esta idea a los algoritmos genticos es

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: encuadrar dentro de las v ariantes semi nai've-Bayes que corrigen las probabilidades producidas por dicho clasificador. En lENB, en lugar de estimar probabilidades puntuales de los datos, como se hace en nai've-Bayes, se realizan estimaciones por intervalo. A continuación, a través de algoritmos d e optimización heurísticos, se consigue la combinación de valores dentro de los intervalos q ue maximiza el tanto por ciento de bien clasificados. L os resultados obtenidos son excelentes, tanto si se comparan con na'íve-Bayes, comio si se comparan con enfoques semi naive-Bayes similares como Iterative Bayes. 5.4. Parallel Interval Estimation Conjunto de datos breast chess eleve corral crx fiare naive-Bayes - P IENB 81 Comparación: lENB vs Iterative Bayes Mejora lENB 95 Mejora lENB 98 Mejora Iterative 0,57 t 0,57 t 5,39 t 9,33 1 3,41 t 5,95 3,10 9,33 3,88 1,83 t 2,61 t 6,17 8,23 6,06 7,44 6,42 8,19 6,06 7,83 2,47 t german glass glass2 hepatitis iris lymphography mofn-S-V'lO pima satimage segment shuttle-small soybean-large vehicle vote waveform-21 t t t t t t t t Bayes -0,16 t t t t 1,30 t 1,30 t 9,42 t 8,98 t 2,11 t 1,42 t 9,69 t 8,98 t 2,36 1 1,92 t 4,80 t 0,54 t 2,84 t 10,94 t 5,05 t 1,24 t 4 ,43 t 0,54 2,84 9,69 4,96 0,96 t t t t t 0,10 - 0,05 - 1,19 1,41 1,40 t 3,59 t 1,50 t 4,39 1 1,45 1 T abla 5.4: Comparación de los resultados obtenidos con lENB e Iterative Bayes L íneas d e trabajo futuro l ENB es un algoritmo de nueva creación, por lo que quedan muchos campos abiertos p ara futuros desarrollos: • A daptación del clasificador lENB para su uso con variables continuas. • R ealización de implementaciones de lENB que cambien la función objetivo del tanto p or ciento de bien clasificados. Por ejemplo, se podría maximizar el área bajo la c urva ROC del clasificador. • O tra posible idea, sería realizar una selección de variables previa a la ejecución de lENB. 5 .4. 5.4.1. Parallel Interval Estimation naive-Bayes - P IENB Propuesta E l nuevo algoritmo de clasificación propuesto, Interval Estimation naive-Bayes ( lENB), p uede llegar a ser muy costoso desde el punto de vista computacional, cuando existen g ran cantidad de variables predictoras o cuando el conjunto de instancias utilizado para el aprendizaje es muy alto. Por ejemplo, con el conjunto de datos segment la ejecución 82 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional 11 d 0 ,9 0,8 8 0,7 No discriminante 0,6 IENB-95 •a « 0,5 Nawe Bayes ¿ 0,4 •o n •a 0,3 • > IENB-98 0,2 -i <a 0 , 1 •; 0,2 0,4 0,6 0,8 1 - Especificidad (falsos positivos) F igura 5.5: Curvas ROC de na'íve-Bayes e lENB con percentiles 95 y 98 para el conjunto de datos corral d ura unos 692 minutos. En gran medida, este coste computacional es debido a que la parte c entral del, algoritmo es una búsqueda heurística realiza con EDAs. C omo solución al coste computacional de los EDAs, se propone una posible paralelización de los mismos, basada en islas [RPP'^'OS]. Ya existen algunas propuestas de p aralelización de los EDAs como la presentada en [LSL02], que trata de mejorar el proceso de aprendizaje de las estructuras de red Bayesiana con técnicas de paralelismo, o la p resentada en [Ben02], que paraleliza la creación de los individuos y el aprendizaje de la e structura. Sin embargo, no hay ningún enfoque basado en la paralelización por islas. C ada isla contendrá una población diferente y, cada cierto tiempo y con un esquema d e migración predeterminado, las islas se intercambiarán los mejores individuos entre sí. E ste modelo de paralelización ya ha sido utilizado con éxito en los algoritmos genéticos p aralelos [CPOl, Ste93]. L a versión paralela de lENB se denominará Parallel Interval Estimation ( PIENB). naive-Bayes A demás de mejorar el rendimiento, con PIENB también se persigue mejorar los resultados obtenidos por lENB. La paralelización por islas suele impücar que se recorran d iferentes áreas del espacio de búsqueda, siendo muchas veces posible mejorar las soluciones encontradas por el algoritmo secuencial. A c ontinuación se analiza el estado del arte de la paralelización de algoritmos genéticos ( ya que es el paradigma más cercano a los EDAs y es posible utilizar las mismas ideas de paralelización), se describe el algoritmo PIENB propuesto, y se presentan los resultados e xperimentales obtenidos con varios conjuntos de datos del repositorio UCI. 5.4. Parallel Interval Estimation 5 .4.2. nawe-Bayes - P IENB 83 Estado del arte de la paralelización de algoritmos genéticos L a idea básica, subyacente en la mayor parte de los programas paralelos, es dividir u na tarea grande en tareas más pequeñas, y resolver estas tareas simultáneamente utilizando múltiples procesadores. Este enfoque divide y vencerás, puede ser aplicado a los a lgoritmos genéticos (AGs) de formas muy diferentes. En la literatura se encuentran numerosos ejemplos de implementaciones paralelas exitosas. Algunos métodos d...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online