10200313

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: llo, se añaden las siguientes restricciones: • U n nodo variable predictor, padre de la clase, no puede ser a su vez padre de ninguna o tra variable. • U n nodo variable predictor, que no sea padre ni hijo de la clase, sólo puede ser padre d e un hijo de la clase como máximo. • U n nodo variable predictor, hijo de la clase, no puede ser padre de ninguna otra v ariable. C on estas restricciones el espacio de búsqueda de clasificadores se reduce considerablemiente, y, además, al igual que pasaba con BAN y TAN, al reducir el número posible de p adres de una variable, se facilita el cálculo de las tablas de probabilidad condicional. E n esta sección se propone, teniendo en cuenta las anteriores restricciones, un algoritmo b asado en EDAs que realiza la búsqueda de estructuras de tipo MB. Este algoritmo ha sido denominado MB-EDA. 5.9.2. F o r m a t o d e los i n d i v i d u o s Los individuos MB muestran una pequeña diferencia respecto a los anteriores BAN y T AN. La diferencia radica en que ahora, la variable clase, no es forzosamente padre del r esto de variables, sino que puede ser padre, hija o no tener relación alguna. P or tanto, la matriz de representación tiene un rango igual al número de variables t otales, incluida la variable a clasificar. La matriz sigue siendo cuadrada y no se permiten ciclos. E n la figura 5.17 se muestra un ejemplo de una estructura MB junto al individuo q ue la representa. Algoritmo M B - E D A E n la figura 5.18 se encuentra el pseudocódigo del algoritmo de corrección. Aunque a p rimera vista este algoritmo pueda parecer compHcado de entender, a poco que se profundiza en su estudio se ve que es muy sencillo y fácil de aplicar. Lo importante es considerar t res grandes pasos: • P aso 1. Estudio de los hijos de la variable clase. • P aso 2. Estudio de los padres de la variable clase. • P aso 3. Estudio del resto de variables. 5.9. Búsqueda de clasificadores MB 105 Clase X, X2 Xs C lase 0 1 0 0 1 X, 0 0 0 0 0 X2 0 1 0 0 0 Xo 1 0 0 0 0 X, 0 0 0 0 0 X4 F igura 5.17: Representación de los individuos MB T al y como se puede observar, estos tres pasos están bien diferenciados en el pseudocódigo. A continuación se explica uno a uno cada paso. E n el primer paso se estudian los hijos de la variable clase C. E sto significa estudiar l a primera fila de la matriz. Cuando se encuentra un 1 en una columna, por ejemplo, en l a correspondiente a la variable Xj, se comprueba en el grafo del individuo si esa variable a parece también como padre de C. E n caso negativo, Xj es hija de C, y s iguiendo las c ondiciones de MB, ya no puede ser padre de nadie, y por tanto, se pone su fila a ceros. E n caso afirmativo, se debe elegir aleatoriamente entre dejar a la variable como hija de C o c omo padre. Si se elige dejarla como hija, se hace lo mismo que en el caso anterior, y si se deja como padre, simplemente se pone un O donde estaba el 1, y ya se analizará la n ueva situación cuando corresponda en el siguiente paso. Es importante destacar que las filas cuyas variables han resultado hijas de C, y q ue han sido puestas a O, se bloquean con el fin de llevar la cuenta de los hijos de C y con el fin de que no puedan ser modificadas b ajo ningún otro criterio. E n el segundo paso se estudian los padres de C. Y a no es necesario estudiar las variables q ue son hijas de C, por lo que dichas filas se pasan por alto directamente. En este caso, q ue una variable Xj s ea padre de C, significa que hay un 1 en la primera columna de la fila correspondiente a Xj. E n esta situación, se sabe de antemano que esa variable no es h ija de C p or el paso anterior, y ya que las condiciones de MB imponen que un padre de C y a no puede ser padre ni hijo de nadie más, se pone a O el resto de su fila y toda su c olumna. Además, se bloquea la columna con el mismo fin que en el caso de las filas. P or último, quedan las variables predictoras que no tienen ninguna relación con la v ariable a clasificar C, es decir, las variables cuyas filas y columnas no han sido bloqueadas. E stas variables forzosamente tienen que quedar en alguna de estas situaciones: Xi es padre de un hijo de C: p ara que esto ocurra, debe haber al menos un 1 en a lguna columna de la fila Xi, e n posiciones que correspondan a variables hijas de C ( ya que esto viene impuesto por las condiciones de MB). Aquellos unos que no c orrespondan a este tipo de variables se ponen a 0. Si hay más de un 1 de este t ipo, se elige uno aleatoriamente. Ahora, puesto que Xi y a no puede relacionarse con n adie más, el resto de su fila y toda su columna deben ser O, y además, se bloquea l a columna. 106 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional • P adre o hija de C: en caso de que no haya unos en las columnas cuyas variables s on hijas de C, se hace que sea padre o hija de C a leatoriamente. Si se elige como h ija de C, se pone un 1 en la columna de la primera ñla que corresponda, se pone a O t oda la ñla, y se bloquea la fila; si resulta ser padre,...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online