Eval 8600 109000 28200 mejora 057 539 247 43300 933

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: mputacional Conjunto de datos X, X , . x„ C lase 1 2 . .. 1 A 2 . .. 1 A 2 1 ... 2 B 2 V V NaTve Bayes I nterval Estimation NaTve Bayes Aprendizaje Aprendizaje pi = 0 .72 p , = [ 0.705,0.735] h = 0.: P2 = [0.265,0.295] KA = 0-78 p ]^ = [0.11,0.19] pj^j = [0.75,0.81] = 0-22 p;,B = O.OÓ P].B= [0.83,0.87] PIJ,= p ; j = [0.40,0.60] j ; ^ ^ = [0.035,0.065] p ; , , = 0.95 Pi.B= [0.47,0.53] p ; „ = [0.94,0.96] P!,J3 [0.19,0.25] Generación de combinaciones de probabilidad válidas (individuos Individuo = (PÍ, PI, de la búsqueda PI*^, PI*B, ••; heurística) PI*B) con EiP* = iAVfeVíE,pr¡ = i Abreviaturas pl. = P{Xk = xl\C=cd pi = P{C=Ci) p* = Valor dentro Espacio de búsqueda intervalo ( 0.712,0.288,0.13,0.87,..,, 0.95) (0.734,0.266,0.17,0.83,..., 0.942) V Mejor Optimización Heurística individuo F igura 5 .3: Comparación de naiVe-Bayes e Interval Estimation nawe-Bayes D efinición d e l e spacio d e b ú s q u e d a U na vez e stimados los i ntervalos d e c onfianza desde el c onjunto d e e ntrenamiento, es posible generar tantos clasificadores naiVe-Bayes como se d esee. Simplemente s e d ebe escoger u n d eterminado valor dentro d e c ada uno d e los i ntervalos d e c onfianza antes 5 .3. Interval Estimation naive-Bayes - l ENB 77 e stimados. D e esta forma, cada posible clasificador naive-Bayes se va a representar con la siguiente t upia, ( p^...,p;,PÍ^l,...,K:°,...,Pí;°^,...,<oJ (5.22) d onde cada componente de la tupia p* es el valor seleccionado dentro de su correspondiente intervalo de confianza, al que se le ha efectuado la correspondiente normalización. E l espacio de búsqueda para el algoritmo de optimización heurístico, que a continuación d ebe ser ejecutado, estará formado por todas las tupias válidas (que serán los individuos p ara la búsqueda). Para que una tupia sea válida debe representar a un clasiñcador naiveBayes correcto, para lo que se debe cumplir el siguiente requisito: ffc ro ^K = l;VfcVz^p^^, = l i=l (5.23) r=l P or último, hay que destacar que cada individuo debe ser evaluado con una función fitness ( evaluación). La función de evaluación que se usará a lo largo de toda la tesis es el tanto por ciento de bien clasificados que se obtiene con dicho clasificador (individuo). E sto implica que se está llevando a cabo un enfoque de tipo wrapper. P ara obtener este valor se realiza una validación leave-one-out d e cada individuo. B ú s q u e d a heurística del mejor individuo U na vez definidos los individuos y el espacio de búsqueda sólo queda ejecutar el algoritmo heurístico de optimización para realizar la búsqueda del mejor individuo posible. C omo se ha comentado previamente se utilizarán los EDAs como algoritmos heurísticos d e optimización. 5.3.5. Ejemplo E n la figura 5.4 se puede observar el resultado de la ejecución del algoritmo lENB s obre el conjunto de datos pima, u tilizando un valor de Za d e 1,96. En dicha figura se p ueden observar todos los intervalos de confianza necesarios para este conjunto de datos. Los dos primeros intervalos son los pertenecientes a las dos posibles clases, mientras que el r esto de los intervalos pertenecen a las diferentes probabilidades condicionadas necesarias. L o que siempre se cumple en estos intervalos es que el valor central de los mismos es la p robabilidad que utilizaría el clasiñcador nai've-Bayes estándar. E n relación a los intervalos, y debido a su forma de cálculo, cuanto más cerca se está de l a incertidumbre (0,5), más grande se hará el intervalo, y viceversa. Además, el tamaño d e los intervalos es inversamente proporcional al número de instancias involucradas en su c álculo. En este ejemplo hay un total de 766 instancias, 266 de una clase y 500 de la otra. E n la gráfica de la figura, además de los intervalos, se encuentra señalado el valor s eleccionado después de la ejecución del algoritmo heurístico de optimización. En esta e jecución el algoritmo lENB ha obtenido un resultado de 79,79% de bien clasificados. 78 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional m ientras que el resultado de naive-Bayes sobre este mismo conjunto de datos es de 77,73 % de bien clasificados. 1 0,9 0.8 0,7 h I °'® 1 0,5 I h • S eleccionado 0,4 0,3 0,2 0,1 I O t IIIIIIIM IIIIIIIIIIIM 16 21 IIM IIIIII 26 36 Gen del individuo F igura 5 .4: Intervalos de confianza y valores finales seleccionados por lENB para el conjunto de datos pima 5.3.6. Resultados Resultados experimentales L as pruebas realizadas con lENB se ejecutaron sobre un Athlon 2000+ con 1GByte de m emoria RAM. Los parámetros utilizados para la ejecución de los EDAs fueron: tamaño d e población 500 individuos, individuos seleccionados para aprendizaje 500, número de nuevos individuos cada generación {offspring) 1000, tipo de aprendizaje UMDA {Univariate Marginal Distribution Algoñthm) [Müh98] y efitismo. Cada prueba ha sido ejecutada 10 veces con dos valores de percentil diferentes: 95 {za = 1,96) y 98 (ZQ = 2 ,33). Los resultados obtenidos se muestran en la tabla 5.3.6 para el percentil 95 y en la t abla 5.3 para el percentil 98. En ambas tablas las columnas t...
View Full Document

Ask a homework question - tutors are online