L os algoritmos genticos inspirados en la gentica

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: s supervisados basados en redes Bayesianas. D entro de este enfoque se realizan varias propuestas concretas que a continuación se d escriben. 4 .1.1. D iseño y paralelización de u n nuevo algoritmo de clasificación semi naive-Bayes P roponemos un nuevo algoritmo semi naíve-Bayes denominado Interval Estimaüon naive-Bayes ( lENB) [RLP+03b, RLP+03a, RLM+03]. En este enfoque, en lugar de calcular l a estimación puntual de las probabilidades necesarias para el clasificador naíve-Bayes, se c alcula una estimación por intervalo. Después, a través de la búsqueda heurística de la 56 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional mejor combinación de valores dentro de estos intervalos, se trata de superar la asunción d e independencia condicional entre variables predictoras dada la clase, premisa sobre la q ue se construye el naíve-Bayes. La búsqueda se realiza con algoritmos heurísticos de o ptimización (EDAs) y está guiada por la exactitud de los clasificadores. E ste algoritmo se puede situar dentro de las variantes semi nai've-Bayes que corrigen l as probabilidades producidas por dicho clasificador. l ENB puede llegar a ser muy costoso desde el punto de vista computacional debido a l a búsqueda heurística que debe realizar. Como solución a este coste computacional de los E DAs, proponemos una paralelización de los mismos basada en islas [RPP+03]. Cada isla c ontendrá una población diferente y, cada cierto tiempo y con un esquema de migración p redeterminado, las islas se intercambiarán los mejores individuos entre sí. Esta forma de p aralelización ya ha sido utilizada con éxito en los algoritmos genéticos [CPOl, Ste93]. 4 .1.2. A prendizaje de clasificadores en el espacio de estructuras L as variantes semi na'íve-Bayes están normalmente basadas en la realización de búsquedas de determinadas estructuras o determinados valores. Estas búsquedas se suelen r ealizar a través de algoritmos de búsqueda voraz {greedy). E n esta tesis proponemos el uso de los algoritmos de optimización EDA, como herramienta para la realización de las búsquedas de estructuras semi náive-Bayes [RLP"'"03d]. D e esta forma, proponemos extensiones a los algoritmos BSEJ (Backward Sequential Elimination and Joining) y FSSJ (Forward Sequential Selection and Joining) [Paz97] y al enfoque APNBC (Adjusted Probabüity Naive-Bayes Classification) [ WP98]. Estas extensiones están basadas en la realización de la búsqueda del mejor clasificador con algoritmos h eurísticos de optimización, frente a las búsquedas voraces realizadas actualmente. A demás, como se vio en el capítulo 3, existen varias estructuras de red Bayesiana q ue pueden ser utilizadas para realizar clasificación supervisada: TAN (Tree Augmentad Network), BAN {Bayesian Augmented Network) y MB {Markov Blanquet). En todas estas e structuras se ha tenido en cuenta el hecho de que existe una variable especial, la variable a clasificar. F rente a los métodos de búsqueda que se encuentran actualmente en la literatura [ FGG97, Sah96], que se basan en la cantidad de información mutua entre las variables p redictoras, en esta tesis proponemos el desarrollo de algoritmos voraces guiados por el t anto por ciento de bien clasificados para la búsqueda de estructuras TAN y BAN. También p roponemos el uso de algoritmos heurísticos de optimización EDA para la búsqueda de e structuras TAN, BAN y MB. 4 .2. A lgoritmos de Estimación de Distribuciones (EDAs) E n las propuestas anteriormente realizadas, se usan los algoritmos de estimación de distribuciones ( EDAs) como los algoritmos heurísticos de optimización que permiten reafizar las búsquedas. Los EDAs son algoritmos de optimización que pertenecen a la familia d e algoritmos evolutivos. Los algoritmos evolutivos son técnicas implementadas para la resolución de problemas d e optimización combinatoria, y están basados en la evolución de poblaciones de indivi- 4 .2. A lgoritmos de Estimación de Distribuciones (EDAs) 57 d úos, q ue representan posibles soluciones candidatas. A partir de una población inicial, h abitualmente generada de forma aleatoria, se selecciona un conjunto de soluciones prometedoras. La información contenida en el conjunto de individuos seleccionados se utiliza p ara crear una nueva población hija. Los nuevos individuos reemplazan total o parcialmente a los de la antigua población. El procesamiento de la información contenida en el c onjunto seleccionado y la incorporación de nuevos individuos en la población previa, se r epite hasta que la población resultante satisface algún criterio de parada. L os algoritmos genéticos, inspirados en la genética Mendeliana, procesan la información c ontenida en el conjunto, generando los nuevos individuos mediante operadores de cruce d e pares de individuos y operadores de mutación. Recientemente han aparecido otro tipo d e algoritmos evolutivos, que procesan la información contenida en el conjunto, calculando l a estimación de la distribución de probabilida...
View Full Document

Ask a homework question - tutors are online