La informacin evolutiva que se usa en la prediccin

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: CB96], que ayudan en la determinación de la estructura y función de las proteínas. La predicción de la estructura secundaria ha sido ampliamente estudiada durante cuatro décadas y abordada por una amplia variedad de métodos. Los avances en la predicción de la estructura secundaria se han basado, en cierta medida, en desarrollos pertenecientes a la teoría del aprendizaje automático, comenzando con enfoques basados en reglas y pasando por enfoques basados en redes de neuronas. A continuación se muestra cómo se ha desarrollado esta historia y las innovaciones que gran cantidad de investigadores han aportado al problema. Se explican las tres generaciones existentes de métodos de predicción de la estructura secundaria, y en cada una de estas generaciones, se explica en detalle alguno de los métodos más destacados. 6 .4.1. P rimera generación Las primeras estructuras tridimensionales de proteínas, correspondientes a la hemoglobina y mioglobina, fueron publicadas en 1960 [KDS"''60, PRO"*"60]. Casi una década antes, Pauling y Corey propusieron una explicación a la formación de ciertas configuraciones locales como a hélices y /3 láminas [PC51, PCB51]. Poco después, y todavía antes de que se determinara experimentalmente la primera estructura, se realizó el primer intento para relacionar el contenido de determinados aminoácidos con la formación de a hélices 6.4. Predicción de la estructura secundaria de las proteínas 123 [SGC57]. L a idea se amplió para relacionar el contenido de todos los aminoácidos con las a hélices y las /? láminas [BdLBF60, Blo62]. L a principal característica de los métodos de primera generación es el uso de estadísticas de residuos individuales para realizar la predicción. A pesar de que los resultados i nicialmente fueron positivos, en 1983 se hizo evidente que la exactitud de estos métodos h abía sido sobreestimada [RSS94a]. Reglas de Chou-Fasman U n primer acercamiento al problema de la predicción de la estructura secundaria de l as proteínas lo realizaron Chou y Fasman en 1974 [CF74], empleando las 15 estructuras d isponibles en ese momento. Varios años después se actualizó el método con una mayor c antidad de estructuras. Su método implica asignar a cada aminoácido la probabilidad d e que forme una hélice o una /? lámina, basándose en sus frecuencias conocidas. Para p redecir la estructura secundaria de una nueva secuencia se buscan regiones contiguas de residuos con una alta probabilidad de formar una determinada estructura secundaria. Es d ecir, si 4 de 6 residuos contiguos es probable que formen una hélice ó 3 de 5 es probable q ue formen una /3 lámina, entonces a esos residuos se les asigna esa estructura secundaria. E stas regiones son expandidas usando una regla similar. 6.4.2. Segunda generación E l incremento en el número de estructuras conocidas permitió el empleo de estadísticas m ás detalladas, pasándose a la segunda generación de predicción de la estructura secundari a. Normalmente se toman de 11 a 21 residuos contiguos de la proteína y se recopilan e stadísticas con el fin de determinar con qué probabihdad el residuo que se encuentra en la p osición central de ese segmento está en un determinado estado de estructura secundaria. E n la figura 6.9 se muestra el proceso seguido con las ventanas de aminoácidos en la s egunda generación. X, AH x„ X A . ' | N ¡ j . . . ' i V í R , 5 ' ' ; L ,1 ¡ . . . l A ^ Q RR V HH E E H H H'ÍT^L L LL HH F igura 6.9: La segunda generación está basada en el uso de ventanas de aminoácidos para predecir la estructura secundaria L os principales algoritmos de segunda generación se basan en: • I nformación estadística [RS76, Nag77, GOR78, GGR87, BGL+88, GG88, L DS91, V DW91, J LTW93, MY93, DOB94, P F83, T T83]. 124 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional • P ropiedades físico-químicas [CK89]. • M otivos de secuencias [RKW91, BBB+88, QS88]. . R edes de neuronas [HK89, KCL90, SLX92, ZMW92, MS93, CK95, MARW92, GD95]. • T eoría de grafos [Kan88, MS97]. • E stadística multivariable [KMLS92, MKS92]. • R eglas expertas [FA95, ZB96, Aso97, MS97, Y L93, SS94]. • A lgoritmos del vecino más cercano [SS95, KS83]. L a exactitud de los métodos de segunda generación es menor del 70%. Q ian y S ejnowski Q ian y Sejnowski, en 1988, fueron los primeros que trataron de predecir la estructura s ecundaria empleando para ello redes de neuronas. La red de neuronas que emplearon es u n perceptrón multicapa, c ompletamente conectado, con una capa oculta [Bis95, Hay99]. L a entrada a la red de neuronas es una pequeña ventana de aminoácidos, normalmente c on un tamaño de 13 residuos. El objetivo de la red de neuronas es predecir la estructura s ecundaria del aminoácido que se encuentra en la posición central de la ventana que se le d a como entrada a la red. La red tiene 3 nodos de salida que representan la probabilidad d e que el aminoácido tenga como estructura secundaria hélice, ,/3 lámina o coil. D e este m odo, el problema de predicci...
View Full Document

This note was uploaded on 02/01/2012 for the course . . taught by Professor . during the Spring '11 term at Pontificia Universidad Católica de Chile.

Ask a homework question - tutors are online