La desventaja que p resenta es el tiempo de respuesta

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: n redes Bayesianas para P S S P Objetivos C omo se ha podido ver en el capítulo anterior, son muchos los algoritmos de predicción ya existentes para el problema PSSP. Lo que proponemos en este apartado es la r ealización de un multiclasificador basado en redes Bayesianas, es decir, un clasificador de clasificadores basado en el paradigma stacked generalization [RLP'*'03c]. D urante los últimos años, los investigadores de la comunidad del aprendizaje automático, h an intentado averiguar cómo combinar un conjunto de clasificadores en una gran c antidad de dominios de aplicación. Se ha demostrado que con la combinación de las p redicciones se pueden obtener mejores exactitudes [HS94, SSL''"99]. E n esta sección presentamos un multiclasificador para la predicción de la estructura secundaria de las proteínas basado en el conocido paradigma stacked generalization [Wol92]. E n este paradigma el multiclasificador se diseña como un conjunto de capas de clasificadores, en donde las capas superiores reciben las predicciones de la capa inmediatamente 152 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional inferior. Para el problema de la predicción de la estructura secundaria hemos diseñado un s istema de clasificación basado en dos niveles. En el nivel — O h emos situado todos los s ervidores de predicción encontrados en Internet, mientras que en el nivel — 1 h emos s ituado una red Bayesiana que actúa como sistema de consenso. Una vez construido el m ulticlasificador, y dada una nueva instancia a clasificar, se ejecutan los clasificadores del nivel - O con dicha instancia y se pasan sus predicciones a la red Bayesiana del nivel — 1. C omo se verá, los resultados experimentales demuestran que el multiclasificador mejora los r esultados de todos los clasificadores utilizados. En la figura 7.4 se puede ver el esquema u tilizado. Clase predicha /?ec/ff3J/6S/S/?3 N¡vel-1 Predicciones de los clasificadores / 'FS/Frec/, ''GO/?/ /yP/V£>£x/pe/r/\ /SO/'M/ /Freoí^/a/ Nivel-0 Conjunto de datos F igura 7.4: Esquema del multiclasificador C on el objetivo de realizar el multiclasificador se ha desarrollado una aplicación Web q ue contacta con los servidores Web de predicción de la estructura secundaria. A través d e esta aplicación se han logrado dos objetivos: • C omparar los algoritmos de predicción actuales, extrayendo estadísticas sobre la e xactitud de sus predicciones. • C onseguir el conjunto de datos necesario para la realizcición del multiclasificador. L a aplicación Web ha sido desarrollada de forma flexible, por lo que resulta muy sencilla la incorporación de nuevos servidores de predicción en caso necesario. Teniendo en c uenta los temas de portabihdad, la aplicación ha sido desarrollada en JSP y clases Java. 7.6. Multiclasificador basado en redes Bayesianas para PSSP 153 E n el desarrollo del multiclasificador se han diferenciado cinco fases, las cuales representan los diferentes objetivos que se pretenden conseguir: • O btener los servidores de PSSP existentes en Internet. De cada servidor se almacenará la información necesaria para el posterior envío automático de los distintos c onjuntos de datos. • E nviar los conjuntos de datos a los servidores obtenidos en la fase anterior. Además, se deberán recoger los resultados de la predicción de la estructura secundaria de d ichos servidores, almacenándolos para estudios posteriores. Los servidores pueden d evolver la información vía correo electrónico o a través de página Web. • C reación del conjunto de datos para el multiclasificador, a partir de los resultados o btenidos de los servidores de predicción. • D esarrollo de diferentes multiclasificadores, todos ellos basados en redes Bayesianas. • V alidar los resultados obtenidos, tanto de los servidores de predicción contactados, c omo del multiclasificador desarrollado. 7.6.2. Clasificadores d e nivel-0 T ras una búsqueda exhaustiva por Internet se encontraron 9 servidores de predicción de PSSP en funcionamiento. Estos servidores son los que forman parte del nivel - 0. E n la tabla 7.2 se muestran, a modo de resumen, los servidores contactados. Por cada s ervidor se muestra su localización y su método de predicción. Además, en la figura 7.5, se puede observar la localización geográfica de los servidores. Servidores Web de predicción de estructura Servidor G OR J Pred P HD P REDATOR P rof P SIPRED S AM-T02 S OPM S SPro secundaria Localización Universidad de Southampton, Reino Unido Universidad Dundee, Escocia Universidad de Columbia, Estados Unidos Instituto Pasteur, Francia Universidad de Gales, UK Universidad College London, Reino Unido Universidad de California, Santa Cruz, USA Instituto de Biología de Lyon, Francia Universidad de California Irvine, Estados Unidos Método predicción T eoría de la info. C onsenso R edes de neuronas A lg. vecino más cerc. R edes de neuronas R edes de neuronas H omologías H omologías R edes de neuronas T abla 7 .2: Servidores Web de predicción de estructura secundaria A continuaci...
View Full Document

Ask a homework question - tutors are online