124 clasificacin supervisada basada en rrbb aplicacin

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: rque fue la primera descubierta por Pauling y Corey a c omienzos de la década de 1950. Es la más abundante, dándose en la vida real en el 32-38% de los residuos. Tiene una longitud media de 10 residuos. Su formación se debe al establecimiento de puentes de hidrógeno entre un aminoácido y otro que e stá 4 posiciones por debajo de éste. La a hélice presenta un total de 13 átomos por g iro. • 3io h élice. E s infrecuente encontrarla, dándose en un 3.4% de los residuos de una p roteína. Su formación se debe al establecimiento de puentes de hidrógeno entre un a minoácido y otro que está 3 posiciones por debajo de éste. Las a. hélices empiezan O t erminan el 25 % de los casos con algunos residuos en forma de 3io héhce. • vr h élice. D e rara aparición en las proteínas, su formación se debe al establecimiento d e puentes de hidrógeno entre un aminoácido y otro que está 5 posiciones por debajo d e éste. A veces existe un giro de TT h élice al inicio de una a h élice. E n la figura 6.6 se puede observar un dibujo de estas hélices. B e t a laminar E n la estructura ^ l aminar los aminoácidos adoptan la conformación de una hoja de p apel plegada. Representa el 20-28 % de los residuos de una proteína. N o existen ni puentes de hidrógeno ni interacciones de van der Waals entre residuos v ecinos. Estas formaciones son estables como parte de una lámina, en donde las cintas {strands) a lineadas crean la estabilización. Por tanto, la estructura /3 laminar se hace e stable debido a la existencia de puentes de hidrógeno entre los residuos de dos cintas, y a sean estas paralelas o antiparalelas. En la figura 6.7 se puede observar la formación d e puentes de hidrógeno en unas cintas antiparalelas. En la figura 6.8 se pueden observar los puentes de hidrógeno que se forman en unas cintas paralelas. Aunque al realizar una i nspección visual no lo parezca, tanto las formaciones paralelas como las antiparalelas son e xactamente igual de estables y de probables. C oil E l resto de estructuras que se encuentran dentro de una proteína son denominadas de f orma genérica coil. 120 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional alpha 71 tr Hélices í.— ••V F igura 6.6: Las hélices alpha, 3io y n A l_ •.¡•i .. : >;-^ m ü i'^''^ '^-^i I» F igura 6.7: Formación de puentes de hidrógeno en cintas antiparalelas 6 .3.2. Programas de obtención de la estructura secundaria de las proteínas A la hora de poder realizar la predicción de la estructura secundaria de las proteínas se debe partir de una serie de proteínas cuya estructura terciaria es conocida. Una vez 6.3. E structura secundaria de las proteínas 121 y. Sur . A _!^- ir V ^ • ^ ^ 1/ , / / ':rsa"" LJ F igura 6.8: Formación de puentes de hidrógeno en cintas paralelos s eleccionadas las proteínas que formarán parte del conjunto de datos, se debe obtener la e structura secundaria de estas proteínas a partir de su estructura tridimensional. Para r ealizar este trabajo existen tres programas diferentes: DSSP, DEFINE y STRIDE. Estos p rogramas cogen los ficheros en formato P D B y, a partir de ellos, calculan de forma b astante precisa la estructura secundaria. DSSP y DEFINE coinciden en un 95 % d e las posiciones, mientras que DSSP y STRIDE sólo en un 71 % de las posiciones. Debido a su u so masivo en este tipo de técnicas, en esta tesis se usará el programa DSSP. N o m b r e de la clase Abreviatura a h élice H G L E B T 3io hélice T hélice (extremadamente rara) T /3-strand /3-bridge / 3-turn bend r esto s c T abla 6.3: Estados de la estructura secundaria E stos programas calculan la estructura secundaria en ocho estados diferentes. De estos o cho estados se realiza una proyección a sólo tres estados, que son los que se utilizarán p ara la predicción de la estructura secundaria: hélice (H), 0 l ámina (E) y coil ( L). Existen t res métodos para realizar la proyeccción de los ocho estados a tres [CB99]. Los ocho e stados diferentes de la estructura secundaria se muestran en la tabla 6.3 y en la tabla 6.4 122 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional se muestran los métodos para proyectar esos ocho estados en tres. De todas las posibles proyecciones que se pueden realizar, la que resulta más difícil de predecir y la que se su usa de forma más generalizada, es la realizada por el método A. E sta será la proyección que se utilizará a lo largo de toda la tesis. E y B=»E Método A GyH^H resto =^ L E=>E Método B resto => L E E y HHHH => L GGGHHHH ^ HHHHHHH M étodo C B y G GG =^ L E=»E Tabla 6.4: Métodos para la proyección de las ocho clases en tres clases 6.4. P r e d i c c i ó n d e la e s t r u c t u r a s e c u n d a r i a d e las p r o t e í n a s El estudio de la estructura secundaria de las proteínas es de vital importancia, ya que [SLBOO] proporciona un punto de partida para la predicción de la estructura tridimensional de las proteínas y puede mejorar significativamente el análisis de secuencias o las técnicas de threading [R...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online