Estrategias Reconocer fragmentos de secuencia asociados a características funcionales o estructurales concretas Agrupar la secuencia en una familia y heredar la información
Motivos Motivo: fragmento corto de secuencia altamente conservado asociado a alguna característica funcional o estructural Se conservan a grandes distancias evolutivas debido a restricciones funcionales o estructurales Ayudan a la predicción y a la detección de homología remota
C-x(2,4)-C-x(12)-H-x(3,5)-H C X(2,4) C X(12) H X(3,5) H
Motivos Modos de expresión: –Expresiones regulares (patrones) –Perfiles (expresión cuantitativa) –HMMs (Hidden Markov Models)
Patrones ALRDFATHDDF SMTAEATHDSI ECDQAATHEAS A-T-H-[DE]
Patrones [AC]-x-V-x(4)-{ED} A o C 1 aa 4 aa Nunca E o D Sólo V
Patrones <A-x-[ST](2)-x(0,1)-V N-Terminal Uno o ningún aa. Dos aminoácidos S o T
Construcción de patrones Deducción jerárquica a partir de alineamientos múltiples –Manual –eMOTIF
Construcción manual de patrones
Grupos de aminoácidos (eMOTIF) AGMuy pequeños STHidroxilo PAGST Pequeños QNGlu/Asn QNEDÁcidos/polares KRBásicos Fuertes VLIHidrofóbicos pequeños VLIMHidrofóbicos FYWAromáticos KRHBásicos DEAcidos
Bases de datos de patrones PROSITE –Recoge motivos ya reconocidos Motivos habituales –Centros activos –Lugares de interacción con grupos prostéticos –Lugares de modificación (glicosilación, fosforilación,...) –Puentes disulfuro
[GA]-x(1,2)-[DE]-x-Y-x-[STAP]-x-C-[NKR]-x-[CH]-[LIVMFYWH] G GQ D L Y V P V C R L C Y
Precauciones con PROSITE Es necesario ser crítico con la validez del resultado: motivos cortos presentan una gran probabilidad y no son necesariamente significativos, (aunque pueden ser correctos en realidad). PROSITE permite eliminar hits de baja significación estadística de manera automática
Búsqueda inversa Contesta a la pregunta: ¿qué proteínas contienen un motivo concreto? Permite –Comprobar la validez estadística de un resultado –Comprobar nuevos motivos
Otras bases de datos BLOCKS –Bloques de alineamiento múltiple associadas con patrones conocidos PRINTS –Conjuntos de patrones no necesariamente contiguos en la secuencia