5 5 a pnbc eda 89 096 095 094 1 nodo 2 nodos 4 rodos

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: o de ellos por separado. 5 .4.3. PIENB Se ha desarrollado una versión paralela del algoritmo lENB, denominada PIENB, con el o bjetivo de mejorar su rendimiento y s u exactitud. De todos los modelos de paralelización d e AGs expuestos en l a a nterior sección se ha elegido elmodelo de islas, con una topología d e anillo unidireccional, como el más apropiado para las pruebas iniciales de paralelización d ebido a s u simplicidad. L a figura 5.8 muestra el flujo d e c ontrol d e P IENB, e n d onde se p uede observar que el pseudocódigo está ejecutando e n t odos los n odos. Las ñechas muestran l a t opología d e migración d e c ada nodo. Por supuesto, sería posible utilizar diferentes topologías d e m igración. E l algoritmo desarrollado tiene e n c uenta los siguientes aspectos: • C ada nodo genera y m ejora s u p ropia subpoblación, pero cada G g eneraciones, los m ejores Me i ndividuos se m igran e n f orma circular (topología circular). D e e sta f orma, cada nodo i e nvía sus mejores individuos al n odo i -I-1 y r ecibe los mejores 86 Clasificación Supervisada Basada en R R B B . Aplicación en Biología Computacional i ndividuos del nodo i — 1. A ntes de enviar un individuo, el algoritmo chequea si el individuo ya ha sido enviado al nodo destino, enviando sólo aquellos individuos q ue no hayan sido enviados. Los parámetros G y Me s on configurables, y dependen del tamaño de la población y del número de nodos. Los individuos migrados r eemplazarán a los peores individuos de la población de destino. C uando un nodo converge, no finaliza, ya que tiene enlaces con otros nodos. En este c aso, el nodo toma el papel de "puente", recibiendo y enviando mensajes a los nodos c orrespondientes en la topología. Se considera que la aplicación finaliza cuando todos l os nodos han convergido, siendo la solución la mejor de las soluciones parciales de c ada nodo. P IENB aprovecha la mayor potencia de cálculo de un cluster d e varios nodos, consiguiendo mejores resultados en un tiempo más corto. while (! convergencia) { m ejorarSolución if (! (generaciones%G)) { m igrarlndividuos; recibirlndividuos;} } F igura 5.8: Esquema de Parallel Interval Estimation nawe-Bayes P ara la implementación de PIENB se ha utilizado MPI {Message Passing [ MPI94]. L as principales razones de esta decisión son las siguientes: Interface) • E s una interfaz estándar de paso de mensajes, que permite a los diferentes procesos c omunicarse a través del uso de mensajes. • E s ampliamente utilizado en clusters d e estaciones de trabajo. M PI ha sido utilizado como interfaz de paso de m.ensajes para los procesos de migración y d e "puente". 5 .4. Parallel Interval Estimation ^.4,.4,. naive-Bayes - P IENB 87 Resultados Resultados experimentales P ara realizar la experimentación con PIENB se han seleccionado los conjuntos de d atos chess^ crx, german y vehicle. L as pruebas se han realizado en un cluster con 8 nodos b iprocesadores Intel Xeon a 2GHz con 1 GB de memoria ram y conectados a través de u na red GigaEthernet. E n las primeras pruebas realizadas se ha fijado el tamaño de la población global a 500 i ndividuos (el mismo número de individuos que el usado en las pruebas secuenciales) y se h a ido variando el número de islas. Se han realizado pruebas para 2, 4, 8 y 16 islas. El t amaño de la población de cada isla se puede obtener dividiendo el tamaño de la población g lobal entre el número de islas. Los parámetros de migración de los individuos se han fijado de la siguiente manera: c ada cinco generaciones se migran el 10 % de los mejores individuos de cada población. E l resto de parámetros específicos de EDA fueron: tipo de aprendizaje UMDA, número d e individuos creados en cada generación (offspring) el doble del tamaño de la población d e la isla y elitismo. P or último, cabe destacar, que cada una de las pruebas ha sido ejecutada 10 veces, s iendo los valores que aparecen en las siguientes gráficas la media de estas ejecuciones. E n la figura 5.9 se encuentran representadas las medias de los valores del tanto por ciento de bien clasificados obtenidos en las ejecuciones con 1 -ejecución secuencia!-, 2, 4, 8 y 16 nodos. 1 ,000095,93 m 0,9500 - 95,94 —é— «3,31 90,16 90,22 9 5,77 9 9 5,52 ® 9 0,25 90,13 0,9000 89,64 —®— chess • crx 81,62 81,56 0,8000 0,7500 - 81,76 72,88 72,90 72^85 72A3 ———g 3^1,16 2 —ér- german - í i - vehicle " 8 1,57 1 8 1,58 4 8 16 Número nodos F igura 5.9: Resultados obtenidos por el algoritmo lENB con una población global de 500 individuos C omo se puede apreciar, los resultados de las pruebas paralelas mejoran bastante a los resultados secuenciales. En las ejecuciones con 2 nodos, la mínima mejora obtenida es d e 0,05 % p ara el conjunto german, m ientras que la máxima mejora es de 2,62 % p ara el Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional c onjunto chess. L as ejecuciones con 4 nodos también dan excelentes resultados. Sin embargo, se nota un...
View Full Document

Ask a homework question - tutors are online