10200313

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: 2 5 .11. R esultados experimentales del algoritmo MB-EDA 106 6 .1. 6.2. 6 .3. 6.4. Los aminoácidos y sus abreviaturas Los diferentes tipos de hélices y sus características E stados de la estructura secundaria Métodos para la proyección de las ocho clases en tres clases 7 .1. M atriz de confusión para el problema PSSP 7.2. Servidores Web de predicción de estructura secundaria 7 .3. C omparación de los resultados experimentales obtenidos con los multiclasificadores en relación con P S I P R E D 7.4. Estadísticas para el conjunto de datos HS1771 7 .5. E stadísticas para el conjunto de datos CB513 7.6. Estadísticas para el conjunto de datos CB513 7.7. Estadísticas para el conjunto de datos EVAl 7 .8. E stadísticas para el conjunto de datos EVA2 7.9. Estadísticas para el conjunto de datos EVA3 7 .10. Estadísticas para el conjunto de datos EVA4 7 .11. E stadísticas para el conjunto de datos EVA5 116 119 121 122 138 153 159 161 162 163 164 165 166 167 168 XVI Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional 7.12. Estadísticas para el conjunto de datos EVA6 169 P arte I INTRODUCCIÓN Y O BJETIVOS C apítulo 1 I ntroducción y objetivos D urante los últimos años, la comunidad biomédica ha incrementando en gran medida el USO de las ciencias de la computación y de su tecnología. Esta fusión de la biomedicina y d e la tecnología computacional está ofreciendo sustanciales beneficios que mejoran la c alidad de la salud de los individuos e incrementan el conocimiento biológico. E n la línea marcada por esta fusión, los trabajos realizados en esta tesis se encuadran d entro de dos grandes campos: la clasificación supervisada y la biología computacional. D ía a día, son cada vez más las aportaciones que la clasificación supervisada realiza en el c ampo de la biología computacional, siendo la presente tesis un paso más dentro de este a mplio mundo. E ste capítulo explica las relaciones existentes entre la clasificación supervisada y la b iología computacional, y establece los objetivos de la tesis. El índice del capítulo es el s iguiente: • E n la sección 1.1 se realiza una breve introducción a la jerarquía del aprendizaje, d entro de la cual se puede localizar el aprendizaje con clasificación supervisada. • E n la sección 1.2 se definen dos términos estrechamente relacionados, la bioinformática y la biología computacional. • E n la sección 1.3 se establece la relación entre la clasificación supervisada y la biología computacional. • En la sección 1.4 se presentan los objetivos de esta tesis. • La sección 1.5 contiene la organización del resto de la tesis. 1 .1. Aprendizaje con clasificación supervisada P reguntas siempre difíciles de responder son: ¿qué es el aprendizaje? y ¿qué es la clasificación supervisada? En la figura 1.1 se encuentra representada la jerarquía del aprendizaje a utomático realizada por Kohavi [Koli95], dentro de la cual se localiza el aprendizaje con clasificación supervisada. E l a prendizaje se puede definir [Sim83] como "cambios adaptativos en un sistema, e n el sentido de que permiten al sistema realizar las mismas tareas pero de forma más Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional Aprendizaje Aprendizaje inductivo o empírico Aprendizaje supervisado Aprendizaje de mejora de eficiencia Aprendizaje no supervisado Clasificación F igura 1.1: La jerarquía del aprendizaje automático. Los cuadrados sombreados llevan al aprendizaje con. clasificación supervisada, objeto de esta tesis eficiente y más efectiva la siguiente vez". El aprendizaje se puede dividir en dos grandes ramas, el aprendizaje de mejora de eficiencia y el aprendizaje inductivo o empírico, que se define a continuación. El a prendizaje empírico "se realiza a través de razonamientos de ejemplos suministrados externamente, para producir reglas de carácter general" [Die86]. Dentro del dominio del aprendizaje inductivo esta tesis se centra en el aprendizaje con clasificación supervisada. E n el a prendizaje con clasificacin supervisada el algoritmo de inducción recibe un conjunto de ejemplos, denominado conjunto de entrenamiento, en el que cada instancia consiste en una lista de valores de características y una etiqueta discreta. La tarea del algoritmo es aprender modelos, en amplio sentido, que clasifiquen correctamente instancias sin etiquetar. El término "supervisado" sugiere que algún proceso ha etiquetado las instancias del conjunto de entrenamiento. El término "clasificación" denota el hecho de que la etiqueta es discreta, es decir, que consiste en un número finito de valores. E n el mundo de la clasificación supervisada existen muchos clasificadores que se pueden construir a partir de los datos. Esta tesis se centra en el uso de algoritmos de aprendizaje que permiten construir clasificadores basados en redes Bayesianas. Estos algoritmos contribuyen a una mejor comprensión de los datos, ya que se aprenden estructuras comprensibles, que ayudan a entender el...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online