10200313

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: UNIVERSIDAD POLITÉCNICA DE MADRID F ACULTAD D E I N F O R M Á T I C A C lasificación Supervisada basada e n R edes Bayesianas. Aplicación e n B iología C omputacional Tesis Doctoral V íctor Robles Porcada L icenciado e n I nformática Madrid, 2003 D E P A R T A M E N T O DE A R Q U I T E C T U R A Y TECNOLOGÍA D E SISTEMAS I N F O R M Á T I C O S F ACULTAD DE INFORMÁTICA C lasificación Supervisada basada en R edes Bayesianas. Aplicación en Biología C omputacional Tesis Doctoral A utor: D irectores: Víctor Robles Porcada Licenciado en Informática Pedro Larrañaga Múgica Doctor en Informática Pedro de Miguel Anasagasti Doctor en Informática M adrid, 2003 T ítulo: Clasificación Supervisada basada en Redes Bayesianas. Aplicación en Biología Computacional Autor: V íctor Robles Porcada T RIBUNAL Presidente ; Antonio Pérez Ambite Vocales : Juan Miguel Marín Diazaraque Iñaki Inza Cano José María Carazo García S ecretario : José María Peña Sánchez S uplentes : Alfonso Rodríguez-Patón Aradas Xavier Messeger Peypoch A cuerdan otorgar la calificación de: Madrid, de de 2003 A mi familia Agradecimientos Aquí finaliza un largo camino que realmente ha merecido la pena. Se acaba de cumplir uno de mis sueños en esta vida. Lo mejor de todo es que ha habido mucha gente que me ha ayudado, y a todos ellos van dirigidas estas líneas. Esta tesis se ha podido realizar gracias al esfuerzo de mucha gente. En primer lugar, quiero agradecer a mis directores, Pedro de Miguel y Pedro Larrañaga, su esfuerzo en la dirección y su apoyo personal. Siempre han estado ahí cuando lo he necesitado. Quería también agradecer a Pedro Larrañaga el haberme abierto las puertas de su grupo de investigación y el haber confiado en mi desde el primer momento. Siempre he sido muy bien recibido en el País Vasco, y trabajar con gente tan excepcional como vosotros es un lujo. Detrás de esta memoria está el trabajo de mucha gente. Quiero agradecer a Chema el haber estado siempre ahí ayudándome, respondiendo a mis dudas y aguantando mis charlas. Muchas gracias a Vane, Femando y Wifre por su esfuerzo y por haber realizado sus proyectos conmigo. Y por supuesto a María y Fran, esos geniales compañeros de despacho que siempre han tenido tiempo para mi. Por último agradecer a los revisores su arduo trabajo. Gracias a Guille, Chema, Pedro, Pedro y Antonio por su esfuerzo en este sentido. En el plano personal hay mucha más gente todavía. Para empezar mi familia, a quien dedico esta tesis - sobre todo a las nuevas adquisiciones, Blanca y el gamusino-. También está toda la gente del trabajo. Gracias a todos los profesores del departamento de arquitectura y sobre todo a mis compis, los sosos, ya que gracias a su apoyo estoy pudiendo escribir estas líneas. Por último, quiero agradecer el apoyo que me han dado todos mis amigos — los que prometo dedicar a más tiempo a partir de ahora-, y animar a Hugo y a José Carlos con sus tesis y a Guille con su residencia en el Hospital de León. Víctor Resumen Los trabajos realizados en esta tesis se encuadran dentro de dos grandes campos: la clasificación supervisada con modelos gráficos probabilísticos y su aplicación a la biología computacional. La idea fundamental de las propuestas que se han realizado dentro del campo de la clasificación supervisada con modelos gráficos probabilístico, es el uso de los algoritmos heurísticos de optimización EDA en la búsqueda de estructuras de redes Bayesianas para clasificación. Gracias a la aplicación de los algoritmos EDA, se ha desarrollado un nuevo algoritmo de clasificación supervisada denominado Interval Estimation naíve-Bayes y se han mejorado varios de los algoritmos de clasificación propuestos en la literatura. Los resultados experimentales obtenidos han sido muy satisfactorios, ya que demuestran la superioridad de nuestra idea. Además, con el objetivo de mejorar su rendimiento, se ha desarrollado una versión paralela de nuestro algoritmo, el Parallel Interval Estimation naíve-Bayes. Las pruebas experimentales han superado nuestras expectativas iniciales, ya que no sólo se ha logrado un speedup superlineal, si no que se han obtenido mejores resultados que en la versión secuencial. En el campo de la biología computacional la predicción de la estructura secundaria de las proteínas es de vital importancia, ya que proporciona un punto de partida para la predicción de su estructura tridimensional, lo cual ayuda a la determinación de sus funciones. Dentro de este campo, se ha estudiado la aplicación de los métodos de clasificación supervisada en dos niveles diferentes. Por un lado, se ha desarrollado un nuevo método basado en redes Bayesianas, para la predicción de la estructura secundaria de las proteínas. Aunque en primera instancia los resultados obtenidos no han sido brillantes, en esta tesis se sugieren refinamientos de la idea original que, confiamos, los mejorarán. Por otra parte, se ha creado un multiclasificador con los métodos de predicción existentes, basado en el paradigma stacked...
View Full Document

{[ snackBarMessage ]}

Ask a homework question - tutors are online