2600 11300 7500 1500 10400 4000 30600 7500 2200 3300

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: cierto empeoramiento en las ejecuciones de 8 y 16 nodos. Esto puede ser d ebido a que el tamaño de las poblaciones locales, 62 y 31 individuos para las ejecuciones con 8 y 16 nodos respectivamente, es demasiado pequeño y convergen prematuramente. P or otra parte, en la figura 5.10 están representadas las medias del número total de e valuaciones necesarias para llegar al resultado. Los valores obtenidos son sorprendentes. P or ejemplo, para el conjunto de datos vehide, m ientras que en la versión secuencial son n ecesarias 129100 evaluaciones en total, en la ejecución paralela con 2 nodos fueron necesarias sólo 58600 evaluaciones, es decir, 29300 evaluaciones por nodo. Esto significa un speedup d e 4,40 (ya que 129100/29300=4,40). Hay que tener en cuenta, que en el cálculo d e este valor del speedup n o se está teniendo en cuenta el tiempo necesario para la migración de los individuos entre poblaciones. En conclusión, además de conseguir mejorar los r esultados obtenidos por lENB, se ha conseguido un speedup s uperlineal. 200000 180000 160000 140000 chess crx german vehicle 120000 100000 80000 mi ' \\l " ^>-^ 60000 ^s^™..^ 40000 ~~' 20000 1 •*— 2 16 N úmero nodos F igura 5.10: Número total de individuos evaluados por el algoritmo PIENB con una población global de 500 individuos P or último, en la figura 5.11 están representadas las curvas de aprendizaje para el c onjunto de datos chess. Se puede observar, incluso desde las primeras ejecuciones, la s uperioridad del enfoque paralelo. C onclusiones E l algoritmo lENB puede llegar a ser muy costoso desde el punto de vista computacional debido a la búsqueda heurística que realiza. E n esta sección se ha presentado una paralelización basada en islas, en donde cada isla c ontiene una población diferente y, cada cierto tiempo y con un esquema de migración p redeterminado, las islas se intercambian los mejores individuos entre sí. 5 .5. A PNBC-EDA 89 0,96 0,95 0,94 — 1 nodo 2 nodos — 4 rodos — 8 nodos 16 nodos m 0 ,93 " - 0,92 0,91 0,9 i 1 11 21 31 41 51 61 71 81 91 101 111 121 131 Número de generación F igura 5.11: Curvas de aprendizaje del algoritmo PIENB para el conjunto de datos chess Los resultados obtenidos son excelentes, ya que comparativamente se obtienen mejores r esultados que con la versión secuencial y además se obtiene un speedup s uperlineal. L íneas de trabajo futuro L a paralelización de lENB realmente ha supuesto paralelizar los algoritmos heurísticos E DAs. Dentro de este campo queda mucho trabajo por desarrollar. Algunas ideas son: • R ealizar un estudio detallado sobre los ratios de migración entre islas. • E studio del speedup y d el número de procesadores óptimo dado un tamao de población global. • P robar diferentes topologías de migración entre islas. • E studio de algoritmos heurísticos paralelos híbridos AGs-EDAs. En este sentido sería p osible tener unas islas que ejecuten una optimización con AGs y otras que lo hagan c on EDAs. • P robar otro tipo de paralelizaciones de EDAs, similares a las de grano fino que se r ealizan con los AGs. 5 .5. 5.5.1. APNBC-EDA Propuesta C omo se comentó en el anterior capítulo, las variantes semi na'íve-Bayes están normalmente basadas en la realización de búsquedas de determinadas estructuras o de deter- 90 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional m inados valores. Estas búsquedas se suelen realizar a través de algoritmos de búsqueda v oraz (greedy). U n ejemplo de esta situación es el enfoque APNBC (Adjusted Probabilüy nawe-Bayes Classification) [ WP98]. E n esta sección se describe cómo se puede realizar el enfoque APNBC a través de a lgoritmos heurísticos de optimización EDAs [RLP'^'OSd]. Para ello se define el formato d e los individuos utilizados para la optimización heurística y se presentan los resultados e xperimentales conseguidos con los conjuntos de datos del repositorio UCI descritos en la sección 5.1. 5 .5.2. Formato de los individuos E l enfoque APNBC realiza un ajuste lineal del peso de la probabilidad de cada clase. D e esta forma, se asigna un factor de ajuste a cada clase y su probabilidad estimada se m ultiplica por este factor. El ajuste lineal propuesto por los autores se puede expresar de l a siguiente manera: P{C = Ci\Xi =Xu...,Xr, = Xn)<X WiP{C = Ci)J[ P (Xfc = Xk\C = Ci) k=l ( 5.24) E n los conjuntos de datos con dos clases sólo es necesario calcular uno de los factores d e ajuste. Esto es debido a que el efecto conseguido por cualquier combinación de ajustes a i y 02 para las clases ci y C2 se puede obtener ajustando ci con a i / a 2 y C2 con 1. En el c aso de múltiples clases la búsqueda se debe realizar de una forma similar, fijando uno de los factores de ajuste a 1 y realizando la búsqueda del resto de los factores. En el enfoque A PNBC la búsqueda de estos valores de ajuste se realiza a través de un algoritmo de " ascenso por la colina", en donde cada posible conjunto de factores de ajuste es validado a t ravés del método de resustitución. Hay que destacar el hecho de que, en diversos conju...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online