Las enzimas sintetizan protenas traduciendo

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: se pone un 1 en la primera c olumna de la fila correspondiente, y se pone a O el resto de la ñla y toda la columna, b loqueando ésta como último paso. D e esta forma se aseguran todas las condiciones que debe cumplir un individuo para ser un clasificador MB según nuestros criterios. 5.9.3. Resultados Resultados experimentales E l algoritmo propuesto, MB-EDA, presenta una mejora media de 5,80% en los 11 c onjuntos de datos en los que ha sido ejecutado. Además, las estructuras M B encontradas s on, por lo general, muy sencillas, con un número medio de 10 arcos (hay que tener en c uenta que en este valor están incluidos los arcos entre la variable clase y las variables p redictoras). MB-EDA 97,85 ± 0,12 t 90,76 ± 0,00 t breast eleve corral 95,31 ± 0,00 t crx 90,72 ± 0,09 t fiare 85,08 ± 0,00 t glass glass2 iris mofn-3-7-10 pima vote 85,05 ± 0,00 t 88,34 ± 0,00 t 96,67 ± 0,00 t 9 5,31 ± 0,00 t 80,21 ± 0,00 t 96,78 ± 0,07 t Evaluaciones 6300 12900 2300 7200 3400 5600 2500 500 7300 5800 9200 Arcos 10 13 6 15 9 9 9 4 10 8 16 Mejora 0,71 6,94 10,94 4,49 4,22 10,28 6,13 2,00 8,98 2,48 6,67 T abla 5.11: Resultados experimentales del algoritmo MB-EDA T ambién se ha utilizado el test no paramétrico de Mann-Whitney para validar la hipótesis nula de la misma distribución de densidad para cada uno de los conjuntos de prueba. E sta tarea se realizó con el paquete estadístico S.P.S.S. versión 11.50. Los resultados de e stas pruebas se muestran a continuación. • P ruebas del clasificador MB-EDA: • N aive-Bayes vs. MB-EDA. Valor de ajuste en todos los conjuntos de datos: p < 0 ,001. C onclusiones E n esta sección se ha presentado el algoritmo MB-EDA, un algoritmo heurístico basado e n EDAs para la búsqueda de clasificadores supervisados de tipo MB. 5.9. Búsqueda de clasificadores MB listaFilasBloq 107 = 0 y listaColumnasBloq =0 P oner a O la diagonal principal P ara cada A¿ (Estudio de los hijos de C) Si 'matriz{C, Ai) = 1 y matriz{Ai, C ) = 1 =^ E legir aleatoriamente si Ai se queda como padre o hijo de C Si Ai se queda como hijo =^ P oner a O fila Ai y Ai -^ listaFilasBloq Si Ai se queda como padre => matriz(C, Si matriz{C, Ai) = O Ai) = 1 y matriz{Ai, P oner a O fila Ai y Ai ^ P ara cada Ai ^ listaFilasBloq C ) = O => listaFilasBloq ( Estudio de los padres de C) Si •matriz{Ai, C) — 1 => P oner resto de fila a O P oner a O c olumna Ai y Ai ^ P ara cada fila Ai ^ listaFilasBloq listaC andidatas listaColumnasBloq y Ai ^ listaC =0 P ara cada columna Aj ^ listaC Si matriz{Ai, olumnasBloq Aj) — í y Aj G listaFilasBloq Aj — listaC > matriz[Ai, olumnasBloq => andidatas Aj) = O C alcular numUnos fila Ai Si numUnos >O ^ E legir aleat. Aj € listaC andidatas y p oner matriz{Ai,Aj) P oner a O c olumna Aj e legida y Aj -^ listaC S i numUnos =1 olumnasBloq = O => E legir aleatoriamente si Ai se queda como padre o hijo de C Si Ai se queda como hijo => matriz{C, Ai) — 1 y Ai ^ listaFilasBloq Si Ai se queda como padre => matriz{Ai,C) = 1 y A , ^ listaC olumnasBloq F i g u r a 5.18: P seudocódigo de la corrección de un individuo MB 108 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional Los resultados obtenidos son muy buenos, ya que se consigue mejorar sustancialmente los resultados del clasificador naíve-Bayes, a la vez que se mantiene una buena simplicidad en las estructuras encontradas. P arte I V A PLICACIÓN E N B IOLOGÍA C OMPUTACIONAL Capítulo 6 E stado del arte de la predicción de l a estructura secundaria de las p roteínas L a g e n ó m i c a y l a p r o t e ó m i c a s on actualmente dos de los campos más importantes d e la biología computacional, en los que la minería de datos está siendo más utilizada. E n este capítulo se analiza el estado del arte de uno de los problemas más conocidos d e la proteómica: la predicción de la estructura secundaria de las proteínas (PSSP). Las primeras secciones del capítulo contienen una introducción a las proteínas para una mejor c ompresión de este problema. E l índice del capítulo es el siguiente: • E n la sección 6.1 se explica por qué es importante el estudio de las proteínas. • E n la sección 6.2 se realiza una introducción a las proteínas y se explican los cuatro niveles de estructura de las proteínas. • E n la sección 6.3 se analiza en profundidad la estructura secundaria de las proteínas, m ostrando los posibles tipos de estructuras existentes. • L a sección 6.4 contiene el estado del arte en predicción de la estructura secundaria d e las proteínas. • P or último, en la sección 6.5, se analizan las matrices de sustitución y los métodos d e alineamiento de secuencias, a través de los cuales se puede obtener la información e volutiva necesaria para solucionar el problema de la predicción de la estructura s ecundaria. 6 .1. 6 .1.1. La importancia del estudio de las proteínas L as proteínas y la vida E l término proteína, del griego...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online