E l ndice del captulo es el siguiente e n la seccin

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ra simple se p uede decir q ue la función anterior mide l a i nformación q ue la v ariable Y p roporciona sobre l a v ariable X c uando el v alor d e C es c onocido. E l algoritmo propuesto [FGG97], q ue g arantiza q ue la e structura T AN o btenida tiene a sociada l a m áxima verosimilitud entre todas l as p osibles estructuras T AN, es c omo sigue: 1. C alcular Ip{Xi, Xj\C) p ara cada p ar de v ariables predictoras c on i ^ j . 2. C onstruir u n grafo n o d irigido completo e n el c ual los v értices s on las v ariables p redictoras Xi,... , X „ . A signar a c ada arista conectando l as v ariables Xi y Xj el p eso dado p or Ip{Xi,Xj\C). 3. C onstruir u n á rbol expandido d e m áximo peso. 4. T ransformar el á rbol resultante n o d irigido e n uno d irigido, escogiendo u na v ariable r aíz y d ireccionando todas l as a ristas partiendo d el n odo raíz. 5. C onstruir u n m odelo T AN a ñadiendo u n n odo etiquetado como C y, p osteriormente, un arco desde C a cada variable predictora Xj. P or último, se e ncuentra el a lgoritmo ACÓ (Archs in Corred Order) [RSL02], u n algoritmo heurístico para inducir estructuras d e á rbol aumentado. E l a lgoritmo propuesto p arte d e una e structura d e á rbol aumentado, l a c ual se r evisa e n c aso d e que los n uevos d atos invaliden l a e structura vigente. Dicha revisión se e fectúa e n el c aso e n que las r amas d erivadas d e los n uevos datos n o e stén e n el m ismo orden decreciente q ue el que ha p ropiciado l a e structura actual. L a r econstrucción d el á rbol se lleva a c abo desde l a p rimera r ama incorrecta encontrada. 3 .7. E n f o q u e m a n t o de Markov E l método naive-Bayes tiene e n c onsideración el h echo d e que e xiste u na v ariable e special e n el p roblema a t ratar, l a v ariable clase. Sin e mbargo, debido a s u s implicidad e structural, n o a lcanza a c onsiderar d e f orma adecuada l a s emántica intrínseca d e las r edes B ayesianas [Pea88, JenOl, CGH97, CowOl]. T eniendo e n c uenta q ue en una red B ayesiana cualquier variable t a n sólo s e e ncuentra i nfluenciada p or el d enominado MB (Markov Blanket) r elativo a l a m isma —es decir, p or el conjunto d e sus v ariables padre, s us v ariables hijas y l as v ariables q ue son p adre d e las h ijas-, p arece intuitivo tener e n c uenta modelos clasificatorios q ue s ean M B de la v ariable a clasificar. E n d efinitiva, se d eben buscar estructuras e n las que t odas l as v ariables formen p arte d el MB de la v ariable a clasificar. Véase figura 3.12. E xisten varios procedimientos para buscar dentro d el e spacio d e p osibles M B de la v ariable a clasificar. P or e jemplo, es p osible utilizar algoritmos genéticos [SL98] para llevar a efecto t al b úsqueda. D ebido a los p roblemas d e s obreajuste -constatados e n a lgunos experimentos-, q ue sufre el m étodo anterior, se p ueden reducir l as c ondiciones impuestas p or el m odelo, con el 3.7. Enfoque manto de Markov 51 F igura 3.12: Ejemplo de clasificador MB o bjeto de obtener redes Bayesianas más simples pero a la vez con mayor poder generaliza- dor. Para ello se pueden, por ejemplo, efectuar las siguientes dos relajaciones del modelo a nterior: 1. N o es necesario que todas las variables del modelo formen parte del MB de la variable a clasificar. De este modo se reduce el espacio de búsqueda, a la vez que se realiza d e forma implícita una selección de variables. 2. U na variable que sea padre de la variable a clasificar no puede ser padre de un hijo d e la variable a clasificar. Además, una variable tan sólo puede ser padre de un hijo d e la variable a clasificar. 52 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional P arte III ALGORITMOS DE BÚSQUEDA C apítulo 4 E nfoque general E n este capítulo se realiza un análisis general de nuestras propuestas dentro del campo d e la clasificación supervisada con modelos gráficos probabilísticos. L a idea fundamental dentro de estas propuestas, tal y como se verá en la primera sección, es hacer una apuesta por el uso de algoritmos heurísticos de optimización para r ealizar las búsquedas que muchas de las técnicas actuales realizan a través de algoritmos v oraces [greedy). Com.o algoritmo heurístico de optimiación se ha optado por el uso de los algoritmios d e estimación de distribuciones (EDAs). Estos algoritmos ya han demostrado su potencia d entro de muchos otros campos. E l índice del capítulo es el siguiente: • E n la sección 4.1 se realiza una descripción general de las propuestas que se realizan d entro del campo de clasificación supervisada con modelos gráficos probabilísticos. • E n la sección 4.2 se introducen los algoritmos de estimación de distribuciones (EDAs), los algoritmos heurísticos que serán utilizados para la búsqueda de los clasificadores. 4 .1. D escripción general de las propuestas E n esta tesis se realiza una fuerte apuesta por el uso de los algoritmos heurísticos de o ptimización EDA, como herramienta válida para la realización de búsquedas de clasificadore...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online