4 2 a lgoritmos de estimacin de distribuciones edas

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: s d e probabilidad locales. R especto a la estructura del modelo, la estructura S p ara X es un grafo acíclico dirigido ( DAG) que describe un conjunto de interdependencias condicionales entre las variables s obre X. Paf r epresenta el conjunto de padres -variables desde las cuales sale una flecha 4 .2. A lgoritmos de Estimación de Distribuciones (EDAs) 59 en S- de la variable Xi en el modelo gráfico probabilístico, cuya estructura viene dada p or S. L a estructura S p ara X asume que Xi y s us no descendientes son condicionalmente i ndependientes dado Pa^ , i = 2,... ,n. P or lo tanto, la factorización puede ser escrita c omo sigue: n p{x) = p ( x i , . . . , Xn) = J J p{xi I paf). ( 4.1) í=l A demás, las densidades locales de probabilidad asociadas con el modelo gráfico probabilístico son precisamente aquellas que aparecen en la ecuación 4.1. U na representación de los modelos con las características descritas anteriormente asume que las densidades locales de probabilidad dependen de un conjunto finito de parámetros 6$ G © 5, y c omo resultado de tal asunción la ecuación anterior se puede escribir c omo sigue: n p{x\es)^llpixi\paf,di) ( 4.2) i=l d onde Os = {6i,...,0n)- Después de haber definido ambos componentes del modelo gráfico probabilístico, el m odelo en sí se representará por MO = {S, Os)4.2.2. E D A s en dominios discretos E n el caso particular donde todas las variables Xi G X s on discretas, el modelo gráfico p robabilístico utilizado es una red Bayesiana. Si la variable Xi t iene rj posibles valores, x | , . . . , x^*, la distribución local, p{xi \ paf , 6i) e s: p{xi'' I paf, 9i) - e^k^p^j = dijk donde pa]" , ... ,paf' ( 4.3) denota los valores de Paf, que es el conjunto de padres de la v ariable Xi e n la estructura S; qi es el número de las diferentes posibles instanciaciones d e las variables padre de Xi. D e este modo, QÍ = JJx ePa '^9- ^ ° ^ parámetros locales v ienen dados por di = {{^ijkTk=i)f=i)- ^ ^ otras palabras, el parámetro 6ijk r epresenta la p robabilidad condicional de que la variable Xi t ome su valor A;-ésimo, conociendo que el c onjunto de sus variables padre toman su valor j -ésimo. Se asume que cada 9ijk es mayor q ue cero. T odos los EDAs se clasifican de acuerdo al número máximo de dependencias que se a ceptan entre las variables (máximo número de padres que cada variable puede tener en el modelo gráfico probabilístico). S in i n t e r d e p e n d e n c i a s E l algoritmo UMDA {Univariate Marginal Distribution Algorithm (UMDA)) [ Müh98], es un ejemplo representativo de esta categoría, que puede ser escrito como: 60 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional pi{x;e') = l[pi{xi;e\) (4.4) donde 6{ = \ 0\jk f 6S recalculado en cada generación usando la estimación de máxima verosimilitud, es decir d[-¡^ = -TTBI. N¡^^ es el número de casos en los cuales la variable ij Xi toma el valor x^ cuando sus padres están en su j-ésima combinación de valores para l a {I - l )-ésima generación, y N¡:f-^ = Y^f. N\~^ . Dependencias a pares Un ejemplo de esta segunda categoría es el algoritmo denominado MIMIC (Mutual Information Maximization for Input Clustering) [DIV97]. La idea principal de MIMIC es d escribir la distribución de probabilidad conjunta verdadera tan bien como sea posible, u sando únicamente una probabilidad marginal univariada y n — 1 p ares de funciones de p robabilidad condicional. I nterdependencias m ú l t i p l e s Se usará EBNA (Algoritmo de Estimación de red Bayesiana - Estimation of Bayesian Network Algorithm) c omo ejemplo de esta categoría. El enfoque EBNA se introdujo por primera vez en [EL99], donde los autores usan el criterio de información bayesiana (Bayesian Information Criterion - BIC), c omo la métrica para evaluar la bondad de cada e structura encontrada durante la búsqueda. E l modelo inicial MOQ e n EBNA se forma mediante su estructura 5o, que es un grafo acidice dirigido sin arcos, y las distribuciones de probabilidad locales vienen dadas por las n probabilidades marginales unidimensionales p{Xi = Xi) = j : , i = 1 , ...,n. Es d ecir, MOQ a signa la misma probabilidad a todos los individuos. El modelo de la primera g eneración MOi se aprende usando el algoritmo B [Bun91], mientras que el resto de m odelos son aprendidos siguiendo una estrategia de búsqueda local que recibe el modelo d e la generación anterior como estructura inicial. S imulación e n redes B a y e s i a n a s L a simulación de redes Bayesianas se usa solamente en los EDAs como una herramienta para generar nuevos individuos para la siguiente población, basándose en la estructura aprendida previamente. El método usado para la simulación es el muestreo lógico probabilístico {Probabilistic Logic Sampling - PLS) [Hen88]. Siguiendo este método, las instanciaciones se hacen variable a variable siguiendo un orden ancestral. Es decir, una variable n o es muestreada hasta que todos sus padres no lo hayan sido. 4 .2. A lgoritmos de Estimación de Distribuciones (EDAs) 4.2.3. 61 E D A s en dominios continuos E n esta...
View Full Document

Ask a homework question - tutors are online