Se dispone de un total de 21 conjuntos de datos todos

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: sección se introduce un ejemplo de modelo gráfico probabilístico que asume q ue la función de densidad conjunta es una función de densidad Gaussiana multivariada. L a función de densidad local para la i-ésima variable es computada como el modelo de r egresión lineal siguiente: f{xi I paf, di) = f\í{xi; mi+ Y^ bji{xj - mj),Vi) (4.5) d onde Áí{x; ¡J,, a^) es una distribución norm.al univariada con media ^ y v arianza a^. Los parámetros locales vienen dados por di = (m¿, hi, Vi), donde bi = {bu,..., h-uY es u n vector columna. Los parámetros locales son los siguientes: m¿ es la media incondicional d e Xi, Vi es la varianza condicional de Xi d ado pa^, y bji es un coeficiente lineal que m ide la fortaleza de la relación entre Xj y X^. T odo modelo gráfico probabilístico que se c onstruye con estas funciones de densidad locales se conoce como red Gaussiana. Las redes G aussianas son de interés en los EDAs continuos debido a que el número de parámetros n ecesarios para especificar una densidad Gaussiana multivariada es menor que si dicha especificación se hiciese a partir de una normal multidimensional. A continuación se realiza una clasificación análoga a la hecha en el dominio discreto, en la cual los EDAs continuos también se organizan de acuerdo al número de dependencias a tener en cuenta. S in d e p e n d e n c i a s E n este caso se asume que la función de densidad conjunta sigue una distribución n ormal n-dimensional y que, por tanto, se factoriza como un producto de n d ensidades normales unidimensionales e independientes. Usando la notación matemática X = J^[x; /j,, X I), puede expresarse como: i=l n i -—^e W^7:-Mix2 2^ -i '. (4.6) Un ejemplo de EDAs continuos en esta categoría es UMDAc [LELPOO]. D e p e n d e n c i a s a pares U n ejemplo de esta categoría es MIMIC^ [LELPOO], que es básicamente una adaptación del algoritmo MIMIC [DIV97] al dominio continuo. 62 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional D e p e n d e n c i a s múltiples L os algoritmos de esta sección son variantes de EDAs para dominios continuos, en los q ue no hay restricción en el aprendizaje de la función de densidad en cada generación. Un e jemplo de esta categoría es E G N A g / c (Algoritmo de Estimación de una Red Gaussiana - Estimation of Gaussian Network Algorithrn) [LELPOO]. El método usado para encontrar la estructura de red Gaussiana en cada generación es un algoritmo de métrica+búsqueda. E n EGNAs/(7 se usa una búsqueda local para buscar buenas estructuras, en combinación c on el criterio de información Bayesiana, BIC. S imulación de redes Gaussianas E l "método condicionado" es una variante general para muestrear distribuciones normales multivariadas que genera instancias de X m ediante el muestreo de Xi, X2 c ondicionado a X i , y así sucesivamente. La simulación de una distribución normal univariada se puede realizar —en base al teorema central del límite— con un método simple basado en la suma de doce variables uniformes. C apítulo 5 P ropuestas E n este capítulo se describen y evalúan las propuestas que hemos realizado en el campo d e la clasificación supervisada con modelos gráficos probabilísticos. E l índice del capítulo es el siguiente: • E n la sección 5.1 se presentan los conjuntos de datos que serán utilizados para validar los algoritmos que proponemos a lo largo de todo el capítulo. • E n la sección 5.2 se define la metodología de trabajo que se sigue a la hora de validar los diferentes algoritmos propuestos. • L a sección 5.3.2 presenta un nuevo algoritmo semi naive-Bayes denominado Interval Estimation naive-Bayes ( lENB). • D ebido al gran coste computacional que puede presentar el algoritmo lENB, se realiza una paralelización de dicho algoritmo, denominada Parallel Interval Estimation nai've-Bayes ( PIENB) en la sección 5.4. • L a sección 5.5 presenta el algoritmo APNBC-EDA, una versión heurística del algoritmo voraz APNBC. • E n la sección 5.6 se propone el algoritmo Pazzani-EDA, una versión heurística de los algoritmos voraces FSSJ y BSEJ propuestos en el artículo original. • E n la sección 5.7 se proponen dos algoritmos diferentes para la búsqueda de estructuras de tipo BAN. El primero de ellos está basado en una búsqueda voraz y el s egundo de ellos en una búsqueda heurística. Ambos algoritmos están guiados por el tanto por ciento de bien clasificados. • D e forma similar, en la sección 5.8 se presentan dos algoritmos para la búsquedas de e structuras de tipo TAN. El primero de ellos está basado en una búsqueda voraz y el segundo en una búsqueda heurística con EDAs. Ambos algoritmos están guiados p or el tanto por ciento de bien clasificados. • P or último, en la sección 5.9 se presenta un algoritmo heurístico para la búsqueda d e clasificadores MB. Este algoritmo está guiado por el tanto por ciento de bien c lasificados. 64 Clasificación Supervisada Basada e...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online