7 12 desarrollo de un clasificador para la pssp con

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: BLOSUM50 normalmente es mejor para alineamientos con interrupciones. E n el caso de las matrices PAM, las matrices para distancias evolutivas grandes son e xtrapoladas a partir de las de distancias evolutivas pequeñas. En cambio, cada matriz B LOSUM es calculada directamente, es decir, sin emplear extrapolaciones. B LOSUM actúa, generalmente, mejor que las matrices PAM para búsquedas de similitud local. 6.5.2. Métodos de alineamiento de secuencias M é t o d o s de p r o g r a m a c i ó n d i n á m i c a L a idea de la programación dinámica es plantear la solucin del problema en términos d e un problema más sencillo, éste en términos de otro más sencillo y así sucesivamente. De e ste modo, en el caso en que el problema a resolver es la construcción de un alineamiento ó ptimo entre dos secuencias, éste se puede construir empleando para ello alineamientos ó ptimos de subsecuencias más pequeñas. E l primer método de aplicación de la programación dinámica al alineamiento de secuencias fue desarrollado por Needleman y Wunsch en 1970 [NW70]. En 1981 Smith y W aterman desarrollaron un nuevo método [SW81]. La diferencia entre ellos reside en que el primero proporciona un alineamiento global, mientras que el alineamiento proporcionado p or el segundo es local. A p esar de que los métodos de programación dinámica son la forma más exhaustiva p ara la búsqueda de similitud entre dos secuencias, la complejidad de estos métodos es 0{N^), s iendo N l a longitud de las secuencias. En el caso de búsqueda de similitudes en b ases de datos, el tiem.po de computación requerido para este tipo de algoritmos es muy e levado. M é t o d o s heurísticos Los métodos heurísticos buscan velocidad a cambio de sensibilidad y selectividad. Para reducir el espacio de búsqueda y, por tanto, el tiempo de computación, estos métodos i ntentan localizar las posiciones donde es más probable que se encuentre el mejor alineamiento. F ASTA fue el primer algoritmo ampliamente utilizado para búsqueda de similitud en b ases de datos. Fue desarrollado por David Lipman y William Pearson en 1985 [LP85] y m ejorado en 1988 [LP88]. Es empleado principalmente por el EMBL - EBI [European Molecular Biology Laboratories - European Biology Institute). C ompara una secuencia de A DN o una proteína, contra cada una de las secuencias de una base de datos, y devuelve los 6.5. A lineamiento de secuencias 133 m ejores segmentos alineados. Es una herramienta de alineamiento local por pares. Basa su e strategia en identificar diagonales con el mayor número de identidades (residuos iguales) sin incluir interrupciones, aunque posteriormente reevalúa estas regiones usando matrices d e sustitución para permitir que los reemplazos conservativos también sean tenidos en c uenta. P or otra parte, el algoritmo BLAST {Basic Local Alignment Search Tool) fue desarrollado por Altschul, Gish, Miller, Myers y Lipman en 1990 [AGM+90] y es el algoritmo m ás empleado actualmente. La razón por la que se desarrolló BLAST fue la necesidad de i ncrementar la velocidad de FASTA. L a principal característica de BLAST es su velocidad, empleando pocos minutos para c ualquier búsqueda en una base de datos. En cambio, FASTA es notablemente más lento, e mpleando para búsquedas equivalentes hasta varias horas. B LAST es una herramienta ampliamente utilizada para búsqueda de similitudes entre u na secuencia incógnita y las secuencias de una base de datos de proteínas o de ADN. Altschul et al. propusieron en 1997 [AMS"''97] una serie de refinamientos para la comparación d e proteínas, que permiten que el tiempo de ejecución de los programas BLAST decrezca s ustancialmente mientras que aumenta su sensibilidad en la búsqueda de relaciones débiles. E stos refinamientos son: • G a p p e d B L A S T . E l uso de un nuevo criterio en la búsqueda inicial, combinado con una nueva heurística para generar alineamientos con interrupciones, da lugar al programa gapped B LAST, que es aproximadamente tres veces más rápido que el p rograma BLAST original. • P S I - B L A S T . Se introdujo un nuevo método que combina automáticamente los a lineamientos estadísticamente significativos producidos por BLAST en una positionspecific score matrix, y r ealiza la búsqueda en la base de datos con esta matriz. El p rograma resultante PSI-BLAST {Position-Specific Iterated BLAST) e jecuta por i teración a la misma velocidad que gapped B LAST, pero en muchos casos es mucho m ás sensible a similitudes débiles pero biológicamente relevantes entre secuencias. E l funcionamiento de la herramienta PSI-BLAST se puede observar en la figura 6.16. L as búsquedas de similitudes en bases de datos empleando posiüon-specific score matrix ( PSSM), también llamados perfiles, a menudo son mucho más capaces de detectar relaciones débiles que las búsquedas que emplean como query u na simple secuencia [McL83, Sta84, Tay86, BvH87, DE87, GME87, Pat87, SH89, TAK94, YL93]. E l empleo de estos métodos, sin embargo, implica frecuentemente e...
View Full Document

{[ snackBarMessage ]}

Ask a homework question - tutors are online