L a representacin de e ste modelo viene dada por dos

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: d conjunta de esos individuos y generando n uevos individuos mediante el muestreo de esa distribución. Son los llamados algoritmos E DA [MP96, LL02]. Su objetivo es generar nuevas soluciones usando información extraída del conjunto completo de soluciones prometedoras, construyendo un modelo explícito de l as buenas soluciones encontradas hasta el momento para guiar la subsiguiente búsqueda. D e este modo, se intenta tener en cuenta las interacciones o dependencias entre soluciones p arciales que contribuyen a la calidad de la solución global, frente al proceso más ciego de r ecombinación de individuos utilizado por los algoritmos genéticos. La cuestión clave en los algoritmos EDA es cómo estimar fiable y eficientemente la distribución de probabilidad del conjunto de individuos prometedores seleccionado. E n este sentido, los métodos de factorización de la distribución basados en redes Bayesianas aparecen como una herramienta muy apropiada. Pero debido a su reciente desarrollo, s u aplicación a los problemas de optimización clásicos y reales está aún comenzando. 4 .2.1. I ntroducción L os algoritmos EDA [MP96, LL02] son estrategias estocásticas de búsqueda heurística que forman parte del enfoque computacional evolutivo. En cada generación crean un n úmero de soluciones o individuos, evolucionando una y otra vez hasta que se alcanza una s olución satisfactoria. En resumen, la característica que más diferencia a los EDA de otras e strategias de búsqueda evolutiva, tales como los algoritmos genéticos (GAs), es que la e volución de una generación a la siguiente se hace estimando la distribución de probabihdad de los individuos mejor dotados y simulando el modelo inducido. Esto evita el uso de o peradores de cruce o mutación, reduciendo considerablemente el número de parámetros q ue requieren los EDA. Los EDAs están empezando a ser utilizados en múltiples dominios [LL02]: búsqueda de l a mejor permutación [LBL+01], el problema del viajante [RdML02], selección de variables, p lanificación de trabajos, etc. E n los algoritmos EDA no se dice que los individuos contienen genes, sino variables c uyas dependencias tienen que ser analizadas. Además, mientras que en otras heurísticas d e computación evolutiva las interrelaciones entre las diferentes variables que representan a los individuos se mantienen implícitas, en los EDA las interrelaciones se expresan e xplícitamente a través de la distribución de probabilidad conjunta asociada con los individuos seleccionados en cada iteración. La tarea de estimar la distribución de probabilidad c onjunta de los individuos seleccionados de las generaciones previas constituye el trabajo 58 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional m ás duro a realizar, debido a que requiere la adaptación de métodos de aprendizaje de m odelos de datos, desarrollados en el dominio de modelos gráficos probabilísticos. E DA Do < Generar M i ndividuos (la población inicial) aleatoriamente — R e p e t i r p ara 1 — 1,2,... h asta que se cumpla un criterio de parada í?¿^j < Seleccionar N < M individuos de JD;_I de acuerdo a — u n criterio de selección Pi{x) — P (CC|D/IJ) < E stimar la distribución de probabilidad — d e que un individuo se encuentre entre los seleccionados Di •— Simular M i ndividuos (la nueva población) desde pi {x) ! F igura 4.1: Pseudocódigo de EDA La figura 4.1 muestra el pseudocódigo de EDA, en el cual se distinguen 4 pasos principales: 1. A l comenzar, se genera la primera población DQ d e M i ndividuos, asumiendo una d istribución uniforme en cada variable (tanto en el caso discreto como en el caso c ontinuo) y evaluando cada uno de los individuos. 2. E n segundo lugar, se selecciona un número N {N < M) d e individuos, normalmente los mejores candidatos. 3. E n tercer lugar, se induce el modelo probabilístico n-dimensional expresando las i nterdependencias entre las n v ariables. 4. P or último, se obtiene la nueva población de M n uevos individuos, mediante la s imulación de la distribución de probabilidad obtenida en el paso anterior. Los pasos 2, 3 y 4 se repiten hasta que se verifique una condición de parada. El p aso más importante de este nuevo paradigma es encontrar las interdependencias entre las variables (paso 3). Esta tarea se realizará usando técnicas del campo de los modelos gráficos probabilísticos. A c ontinuación se introduce la notación necesaria para profundizar en dichos modelos gráficos. Sea X = [Xi,.. .,Xn) u n conjunto de variables aleatorias, y sea Xi u n valor d e Xi, el í-ésimo componente de X. S ea y = (XÍ)-^,^Y "^^ valor de Y C. X. D e esta forma, un modelo gráfico probabilístico de X es una factorización gráfica de la función de d ensidad de probabilidad conjunta, p{X = x) (o simplemente p{x)). L a representación de e ste modelo viene dada por dos componentes: una estructura y un conjunto de densidade...
View Full Document

Ask a homework question - tutors are online