Este t anto por ciento viene dado por el nmero

Info iconThis preview shows page 1. Sign up to view the full content.

View Full Document Right Arrow Icon
This is the end of the preview. Sign up to access the rest of the document.

Unformatted text preview: ilizan matrices de sustitución, en las que a cada combinación p osible de aminoácidos se le asigna un valor. Estas matrices de sustitución -que se verán e n detalle en la siguiente sección- varían desde modelos simples que asignan el valor 1 si los aminoácidos son iguales y O si son distintos, hasta modelos más complejos evolutivos. 128 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional e structurales y / o funcionales, que fijan un determinado coste por sustituir un aminoácido p or otro dependiendo de ambos aminoácidos. E sta técnica, aparentemente sencilla, se hace más compleja en la medida en que el t amaño de las secuencias a comparar se hace mayor y, más aún, cuando se comparan más de dos secuencias. Para realizar esta tarea, se emplean distintos programas que dadas dos s ecuencias, generan el mejor alineamiento. E l alineamiento se puede clasificar de las siguientes maneras: • Nivel de análisis. • A lineamiento global. • A lineamiento local. • N úmero de secuencias analizadas. • A lineamiento de un par de secuencias. • Alineamiento múltiple. • Con interrupciones {gaps) y sin interrupciones. El alineamiento global se extiende a lo largo de la longitud total de las secuencias, de forma que el número de coincidencias obtenido sea máximo. En. la figura 6.10 se puede ver un ejemplo de este tipo de alineamiento. Aunque en este ejemplo hay una región de i dentidad obvia (la secuencia FGKG), un alineamiento global no alinea estas regiones para t ratar de favorecer que se produzca un mayor número de coincidencias a lo largo de las l ongitudes de las secuencias. LGPSTKQFGKGSSSRIWDN I I II I I LQSIKFGKGNGIMRLIWPN F igura 6.10: Alineamiento global E l alineamiento local e ncuentra el mejor segmento alineado existente entre dos secuencias. E n este caso, el alineamiento tiende a detenerse al final de las regiones de identidad o d e fuerte similitud. Se da mayor prioridad a encontrar estas regiones locales que a e xtender el alineamiento para incluir más pares de aminoácidos. Este tipo de alineamiento favorece encontrar motivos (motifs) de aminoácidos conservados en secuencias de proteínas relacionadsis. En la figura 6.11 se puede observar un ejemplo de alineamiento local, en donde los guiones indican la parte de la secuencia no incluida en el alineamiento. FGKG FGKG F igura 6.11: Alineamiento local E l alineamiento local, además de ser más efectivo desde el punto de vista computacional, tiene mayor sentido biológico, pues es sabido que sólo una región relativamente 6.5. A lineamiento de secuencias 129 p equeña de la secuencia de aminoácidos de una proteína es la que constituye su sitio a ctivo, y por tanto, la que le confiere su función. E l alineamiento de un par de secuencias r ecibe dos secuencias y encuentra el segmento m ejor alineado entre ellas. En cambio, el alineamiento múltiple t rabaja sobre muchas s ecuencias y el resultado que obtiene es una secuencia consenso. Esta secuencia consenso t iene en cada posición el aminoácido que más se ha conservado en esa posición en todas las secuencias estudiadas. E n la figura 6.12 se muestra un fragmento de un alineamiento múltiple, en donde los a steriscos señalan las regiones de secuencia consenso de todas las secuencias. MSDN M M M MD KKQQALELALKQIEKQFGKGSIMKLGDG-ADHSIEAIPSGSIALDI AINTDTSGKQKALTMVLNQIERSFGKGAIMRLGDA-TRMRVETIST6ALTLDL DRQKALEAAVSQIERAFGKGSIMKLGGKDQWETEWSTRILGLDV DE NKKRALAAALGQIEKQFGKGAVMRMGDHE-RQAIPAISTGSLGLDI KIEKSFGKGSIMKMGEE -WEQVEVIPTGSIALNA MDDKTSKAAAA EKAKALAAALSQIEKQFGKGSIMRYGDNEVEHDIQWSTGSLGLDI M MDD MDE MSD M M M AIDE---NKAKALAAALGQIEKQFGKGSIMRLGEDR-SMNVETISTGSLSLDV NKSKALAAALSQIEKQFGKGSIMRMGDADIGEDLQWSTGSLGLDI NRSKALAAALSQIEKQFGKGSIMRMGDTDVAADIQAVSTGSLGLDI DKSKALAAALAQIEKSFGKGAIMKMDGSQQEENLEVISTGSLGLDL AIDE NKQKALAAALGQIEKQFGKGSIMRLGEDR-SMNVETISTGSLSLDV DE---NKKRALAAALGQIERQFGKCAVMRMGDHE-RQAIPAISTGSLGLDI TA EKSKALAAALAQIEKQFGKGSIMRMGDGEAAEDIQWSTGSLGLDI MSQNSLRLVEDKSVDKSKALEAALSQIERSFGKGSIMKLGSNENVIEIETISTGSLGLDI M AIDE NKQKALAAALGQIEKQFGKGSIMRLGEDR-SMDVETISTGSLSLDI M SAISNNPDKEKALNLVLNQIERNFGKGAIMRLGDA-AQMKVATIPSGALTLDQ MDE QRSKGLSAALSQIDKQFGKGAVMRLGDHNAIKDIEVYSTGSLGLDL M DE NKQKALAAALGQIEKQFGKGSIMRLGDNR-TMDVETISTGSLSLDI * ***** * F igura 6.12:*Alineamiento múltiple L a complejidad en la realización de un alineamiento múltiple es función geométrica del n úmero de secuencias sumadas al proceso. Por lo tanto, se requieren programas especializados más exigentes, en cuanto a capacidad de cómputo, que aquellos que sólo realizan a lineamientos por pares. LGPSTKQFGKGSSRSIWDN I IIIII LQSIKFGKGNGIMRLIWPN F igura 6.13: Alineamiento sin interrupciones LGPSTKQFGKG--SSRSIWDN LQ-SIK-FGKGNGIMRLIWPN F igura 6.14: Alineamiento con interrupciones L a introducción de interrupciones en las secuencias permite incrementar el número de 130 Clasificación Supervisada Basada en RRBB. Aplicación en Biología Computacional coincidencias del alineamiento. Este intento de incrementar el número de coincidencias, puede llegar a d...
View Full Document

Ask a homework question - tutors are online