Por lo tanto se requieren programas especializados ms

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: 99b] y Prof [OKOO], usan l a información evolutiva obtenida con el programa PSI-BLAST que se analiza en la sección 6.5.2. M é t o d o P H D d e R o s t y Sander U no de los métodos de predicción que más éxito obtuvo en su día, y que sigue de plena a ctualidad, es el denominado P H D , reaHzado por Rost y Sander [RS93, RSS93, RSS94a]. E l método PHD está basado en tres niveles de redes neuronales: 1. P r i m e r nivel: secuencia-estructura. E sencialmente tiene la misma arquitectura q ue el'método desarrollado por Qian y Sejnowski, con la diferencia de que realiza l as predicciones basándose en los perfiles de la proteína. E n lugar de proporcionar c omo entrada a la red una simple secuencia, se le proporciona un alineamiento de s ecuencias de proteínas homologas. Para realizar la predicción utiliza una ventana de 13 residuos. La salida de esta red neuronal es la estructura secundaria de la proteína. 2. S e g u n d o nivel: estructura-estructura. L a segunda red neuronal t r a t a de mejorar l a estructura secundaria obtenida por la primera red. La entrada de esta red neuronal e s la salida de la red del primer nivel, cogiendo ventanas de 17 residuos consecutivos, c on el objetivo de predecir la estructura secundaria del residuo central. 3. T ercer nivel: jury decisión. E l tercer nivel realiza una media aritmética de varias r edes denominado jury decisión. C omo entrada toma la salida de los dos anteriores n iveles, pero entrenados con diferente información y procedimientos de aprendizaje. L a salida es una predicción combinada de los anteriores resultados. E l modo en que se extrae la información evolutiva de una proteína es el siguiente: 1. B uscar en una base de datos de estructuras conocidas secuencias similares, empleando métodos de alineamiento de secuencias. 2. U na vez obtenidas las secuencias similares a la secuencia cuya estructura se quiere p redecir, se filtran aquellas que no superan un cierto umbral. Este umbral indica el número de identidades que tiene que haber entre las dos secuencias para que la s ecuencia se tenga en cuenta. 6-5. A lineamiento de secuencias 127 3- Se construye un perfil de secuencias de aminoácidos a partir de los homólogos encontrados. 4. F inalmente, este perfil se emplea para realizar la predicción. 6 .4.5. Límite en la exactitud de la predicción de la estructura secundaria L a asignación de la estructura secundaria puede variar con una misma estructura p rimaria. Una razón es que las estructuras de las proteínas no son "rocas", sino objetos d inámicos con algunas regiones más móviles que otras. Otra razón es que cualquier método d e asignación de la estructura secundaria debe seleccionar determinados umbrales (por e jemplo, DSSP elige un umbral en la energía de Coulomb de un puente de hidrógeno), d ependiendo de los cuales pueden dar estructuras secundarias diferentes. Por lo tanto, las a signaciones varían en torno a un 5-15 % entre diferentes versiones de rayos-X o diferentes m odelos RMN para la misma proteína (Andersen y Rost, resultado no publicado), y en t orno a un 12% entre homólogos estructurales [RS94]. U n valor en torno al 88 % constituye un límite superior operacional para la exactitud e n la predicción de la estructura secundaria. 6 .5. A lineamiento de secuencias C uando se analizan secuencias se suelen utilizar de manera indiscriminada los términos d e similitud y homología. Sin embargo, estos términos se refieren a conceptos muy distintos. S imilitud es la característica resultante de la observación de que dos o más secuencias m uestran algún grado de coincidencia en la secuencia de aminoácidos. La similitud, dado q ue es una observación, no puede ser indicador a priori de ninguna relación biológica entre l as secuencias, ya que ésta se podría deber a cambios que se hayan dado al azar. E n cambio, se habla de h omología c uando la similitud se puede atribuir a verdaderas r azones evolutivas y no simplemente al azar. En este caso, se afirma que hay regiones de l a secuencia conservadas en el tiempo. L a similitud es producto de una medida, mientras que la homología es una hipótesis q ue se postula en base a la similitud de las secuencias estudiadas y otras características a dicionales. Se puede hablar de un porcentaje de similitud entre dos secuencias pero no d e un porcentaje de homología. Ya que la homología es una característica cualitativa, n o es susceptible de ser medida, por lo que dos secuencias simplemente o son o no son h omologas. E l alineamiento es el procedimiento que permite dar los primeros pasos hacia la conclusión de que dos o más secuencias son homologas. Consiste en establecer un segmento entre ellas, donde el número de coincidencias sea máximo. Una coincidencia se presenta cuando el aminoácido de la secuencia A es igual al de la secuencia B o bien si sus características físico-químicas (hidrofobicidad, tamaño, carga, etc.) son similares. Los programas de alineamiento de secuencias ut...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online