Mediante el criterio de separacin conocido como d

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: cter no monótono. E s decir, a medida que obtenemos nueva información (hechos) sobre el problema, los valores de incertidumbre de los enunciados varían. • A p artir de la fórmula de Bayes, se deduce que la implicación probabilística es bidireccional. 3 .1.5. Estructura de la red. Teoría de grafos L a estructura de las RRBB viene representada por un grafo. Se presentan algunas n ociones básicas sobre teoría de grafos que pueden ser de utilidad para comprenderlas m ejor: • U n grafo G v iene definido por un par {N, A), e n donde N r epresenta los nodos que lo forman y ^4 es el conjunto de aristas que hay entre los mismos. • Si las aristas son dirigidas, se denominan arcos dirigidos, o simplemente arcos. • U n grafo dirigido es un par (JV, A) e n donde todas las aristas son arcos dirigidos. • U n nodo X es padre de un nodo Y si existe un arco que va de X a F , X — Y". Se > d ice también que Y e s hijo de X. • Se denomina familia del nodo X a l conjunto formado por X y los padres pa{X) é ste. • U n camino es una sucesión de nodos {Xi,..., XL}, p ertenecientes a un grafo (A'', A), de modo que Xi ^ Xj p ara 1 <i < j < L y {Xi,Xi+i).e de A ó {Xi+i,Xi) € A Vi = 1 ,... ,L - 1 34 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional F igura 3.2: Grafo con un ciclo de longitud 4 • U n ciclo es una sucesión de nodos { X i , . . . , X ¿ } , pertenecientes al grafo (A'', A), t al q ue Xi ^ Xj p ara l < 2 < j < L , y V ¿ < L — 1,3{XÍ,XÍ + 1) G ^ y e xiste el arco {XL,XI) 6 A q ue cierra el ciclo. L a figura 3.1 muestra un ejemplo de un grafo dirigido. En la figura 3.2 se muestra un e jemplo de un ciclo de longitud 4. A c ontinuación, se muestran los conceptos básicos del tipo de grafos más importante p ara la teoría de las RRBB: los grafos acíclicos dirigidos. • S ea G = {N, A) u n grafo (dirigido o no dirigido). Se dice que G es acíclico si G no c ontiene ciclos . • U n grafo G = [N, A) e s un grafo acíclico dirigido (DAG) si G es acíclico y dirigido. • S ea G = {N, A) u n grafo dirigido. Sean U y V v értices en N. Se dice que U es un p adre de V, o b ien que V es un hijo de U, si y sólo si (U, V) G A. Se dice que U es u n ancestro de y , o bien que V es un descendiente de í/, si existe un camino de U a V. U n vértice sin padres se denomina vértice raíz. L a figura 3.3 ilustra los conceptos anteriores. F igura 3.3: DAG. B y C son padres de D. A es un vértice raíz 3 .1. R edes Bayesianas 35 • U n DAG, G = (N, A), e stá simplemente conectado si dados dos vértices cualesquiera, U,V ^ N^ e xiste como máximo un camino entre ?7 y V". En caso contrario se dice q ue el DAG está múltiplemente conectado. En el contexto de las RRBB, a los grafos acíclicos simplemente conectados se les denomina habitualmente poliárboles. • U n DAG, G = {N,A), m áximo un padre. se denomina un bosque, si cada vértice V e N t iene como • U n bosque se denomina árbol si exactamente un vértice no tiene padres. Dicho vértice es la raíz del árbol. E n la figura 3.4 se muestran diferentes tipos de estructuras DAG. (a) ( C) (d) F igura 3.4: El DAG en (a) está simplemente conectado, el de (b) es un bosque, el de (c) es un árbol y el de (d) está múltiplemente conectado Se define en este punto un aspecto fundamental de las RRBB: el concepto de separación e ntre los nodos de la red. Mediante el criterio de separación conocido como D-separation ( Pearl, 1988) se puede indicar si un grafo verifica o no una relación de independencia dada. P resentamos formalmente el concepto, junto con las definiciones previas necesarias para ello. D ados un grafo dirigido y un camino no dirigido {• • • — U — A — V — ...), el n odo A se denomina nodo de aristas convergentes en un camino si las dos aristas del camino c onvergen a este nodo en el grafo dirigido, es decir, si el grafo dirigido contiene las a ristas U ^ AyV -* A. 36 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional • S ean X,Y y Z t res subconjuntos disjuntos de nodos en un grafo acíclico dirigido D. Se dice que Z í ?-separa X e Y si y sólo si a lo largo del camino no dirigido entre c ualquier nodo de X y cualquier nodo de Y e xiste un nodo intermedio A t al que, 1. ^ es un nodo de aristas convergentes en el camino y ni A ni sus descendientes e stán en Z, o bien 2. A n o es un nodo de aristas convergentes en el camino y A e stá en Z. Cuando Z jD-separa JY' e F en G, se escribe I(Z, Y \ Z)G, para indicar que la relación d e independencia viene dada por el grafo G; en caso contrario, se escribe D{X,Y | Z)Q^ p ara indicar que X QY s on condicionalmente dependientes dado Z e n el grafo G. 3 .1.6. Estimación de los parámetros de una red Bayesiana L as RRBB tienen dos partes fundamentales: la estructura y los valores de probabilidad a sociados a los nodos. A menudo se estiman los valores de probabilidad de una base de d atos utilizando la frecuencia rel...
View Full Document

Ask a homework question - tutors are online