M ulticlasificador b a s a d o e n redes b a y e s i

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: edicción de la estructura secundaria a los científicos de 10 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional l a comunidad del aprendizaje automático. D esarrollo de u n clasificador para la P S S P c o n redes Bayesianas D esde que se comenzó a estudiar el problema PSSP [CF74] han sido varios los algoritmos de predicción utilizados. Es posible destacar los algoritmos basados en información e stadística [GOR78], propiedades físico-químicas [CK89], redes de neuronas multicapa [QS88, R os98, Jon99, PPRBOl], teoría de grafos [MS97], reglas expertas [FA95, ZB96] y a lgoritmos del vecino más cercano [SS95]. De entre ellos, los algoritmos que más éxito han t enido en la predicción son los basados en redes neuronales. C omo se puede observar, por el momento, no hay ningún estudio realizado sobre la p redicción con redes Bayesianas. E n consecuencia, proponemos el uso de las redes Bayesianas para realizar la predicción de la estructura secundaria de las proteínas. Este uso puede suponer dos ventajas p rincipales: • M ejoras en el proceso de aprendizaje, ya que uno de los principales problemas que p resentan las redes neuronales es el tiempo que se debe emplear en el mismo, que p uede llegar a ser de semanas. • M ejoras en la transparencia del aprendizaje, ya que los clasificadores basados en redes B ayesianas generan estructuras comprensibles. en contraposición con ios modelos obtenidos con las redes neuronales. M ulticlasificador b a s a d o e n redes B a y e s i a n a s para la P S S P C omo se ha podido ver en el apartado anterior, son varios los algoritmos de predicción existentes para el problema PSSP. Lo que proponemos en este punto es la realización de u n multiclasificador basado en el conocido paradigma stacked generalization 1.5. [Wol92]. Organización de la tesis L a tesis se divide en cinco bloques temáticos, cada uno de los cuales se divide a su vez en capítulos: • E l primer bloque presenta una introducción general a la tesis. • E n el capítulo 1 se realiza una introducción general a la tesis y se presentan los p rincipales objetivos. • E l segundo bloque recoge el estado actual de las áreas de investigación relacionadas c on la presente tesis. • E l capítulo 2 presenta una introducción general al aprendizaje con clasificación s upervisada. • E l capítulo 3 realiza una introducción a las redes Bayesianas y analiza el estado d el arte de la clasificación supervisada con modelos gráficos probabilísticos. 1.5. Organización de la tesis 11 El tercer bloque, que es una de las partes centrales de esta tesis, presenta las diferentes propuestas que se realizan dentro del campo de la clasificación supervisada con modelos gráficos probabilísticos. • El capítulo 4 realiza un análisis general de las propuestas de la tesis e introduce los algoritmos de estimación de distribuciones. • En el capítulo 5 se presentan y evalúan diversas propuestas en el campo de la clasificación supervisada con modelos gráficos probabilísticos. El cuarto bloque está dedicado a la aplicación de los resultados obtenidos en clasificación supervisada a la biología computacional. • El capítulo 6 presenta el estado del arte de la predicción de la estructura secundaria de las proteínas. • En el capítulo 7 se presentan diversas propuestas en el campo de la predicción de la estructura secundaria de las proteínas. El quinto y último bloque enumera las conclusiones y define las futuras líneas de trabajo. • El capítulo 8 analiza las aportaciones realizadas por la presente tesis y describe las posibles líneas de investigación y desarrollo que se derivan de la misma. 12 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional P arte II E STADO DEL ARTE C apítulo 2 A prendizaje con clasificación s upervisada E ste capítulo presenta una introducción general al aprendizaje con clasificación supervisada. La organización del capítulo es la siguiente: • E n la sección 2.1 se define formalmente el aprendizaje con clasificación supervisada. • E n la sección 2.2 se describen los principales algoritmos de clasificación supervisada, d entro de los cuales se encuentran los basados en redes Bayesianas. • P or último, en la sección 2.3 se analizan las diferentes técnicas de validación (estimación de la exactitud) de estos algoritmos. 2 .1. D efiniciones I nformalmente, la tarea de un algoritmo de clasificación supervisada es generar un b uen clasificador a partir de un conjunto de ejemplos etiquetados. A continuación, este clasificador puede ser utilizado para identificar casos no etiquetados, con el objetivo de p redecir la clase correcta. Un clasificador puede ser evaluado por su exactitud, comprensibilidad u o tras propiedades deseables que determinen cómo de apropiado es para la tarea a r ealizar. U na i nstancia, t ambién llamada c aso o e jemplo, es una lista fija de valores de a trib u t o s . U na instancia describe las entidades básicas con las que se trabajará,...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online