La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a la Bioinformática

Presentaciones similares


Presentación del tema: "Introducción a la Bioinformática"— Transcripción de la presentación:

1 Introducción a la Bioinformática
FASTA

2 Semejansas y diferencias entre FASTA y BLAST
Ambos programas no usan el mismo sistema de puntaje para alinear las secuencias de las bases de datos emparejadas con la secuencia query. 2

3 ktup. Tanto FASTA como BLAST usan una estrategia de búsqueda inicial basada en palabras cortas.
ktup en FASTA es el parámetro que indica el tamaño de la palabra utilizada en esta búsqueda inicial. FASTA utiliza por default ktup=2, mientras que BLAST utiliza ktup=3.

4 Matrices y scores

5

6 Homólogos distantes. Existe una opción en FASTA (-F) que les permite ignorar (i.e. que no aparezcan en el output) secuencias altamente similares al query. Esto es útil, por ejemplo, para focalizar una búsqueda en las secuencias más divergentes. No existe una opción similar en BLAST.

7 Filtrado de secuencias de baja complejidad
Filtrado de secuencias de baja complejidad. Por default, BLAST filtra secuencias de baja complejidad o repeticiones. FASTA no!. Esto puede afectar la capacidad de discriminar falsos positivos, aunque FASTA provee otro tipo de opciones para manejar este tipo de casos.

8 Muchas secuencias son altamente repetitivas
Muchas secuencias son altamente repetitivas. Si la secuencia query contiene regiones de baja complejidad o repeticiones, es posible que una búsqueda encuentre muchas secuencias no relacionadas, con altos scores (por ej hits contra colas de poly-A o regiones ricas en Prolina) o repeticiones como Alu. BLAST permite filtrar el primer tipo de casos, mediante la opción -F. FASTA en cambio no provee esta alternativa. Es el usuario el que tiene que filtrar el query antes de realizar una búsqueda.

9 Secuencias cortas. Si buscamos un primer o un péptido, al utilizar BLAST debemos tener en cuenta que BLAST no es muy útil al respecto. Esto es porque BLAST tiene un límite inferior sobre la longitud que puede tener una palabra (ktup). En el caso de nucleótidos, el límite inferior es 7 (el default es 11). En este sentido FASTA es mejor, porque siempre pueden usar ktup=1. Por otra parte, en el caso específico de péptidos, FASTA provee algunos algoritmos particulares de búsqueda (fastf3, fasts3 y tfasf3, tfasts3).

10 Versiones de FASTA FASTA: compara secuencia de una proteína o DNA Query / biblioteca de secuencias de proteínas o DNA. TFASTA: compara secuencia de una proteína Query / biblioteca de secuencias de ADN FASTF/TFASTF y FASTS/TFASTS: compara pequeños fragmentos de pépticos / base de datos de secuencias de proteína (FASTF/FASTS) o base de datos de secuencias de ADN (TFASTF/TFASTS).

11 FASTX y FASTY: Traduce una secuencia de ADN en sus 3 regiones de marco de lectura forward y compara estos 3 marcos con una base de datos de proteínas. TFASTX y TFASTY: compara una secuencia de proteínas con una base de datos de ADN traduciendo cada secuencia de ADN en sus 6 posibles marcos de lectura.

12 GRACIAS

13

14 Ejemplo: Realizaremos un FASTA de la secuencia de M. bovis
MBOVIS(MrWr) MRALIIVDVQNDFCEGGSLAVTGGAALARAISDYLAEAADYHHVVATKDFHIDPGDDFSGTPDYSSSWPPHCVSGTPGADFHPSLDTSAIEAVFYKGAYTGAYSGFEGVDENGTPLLNWLRQRGVDEVDVVGIATDHCVRQTAEDAVRNGLATRVLVDLTAGVSADTTVAALEEMRTASVELVCSPDGTA 14

15 15

16 16

17 17

18 18

19 19

20 20


Descargar ppt "Introducción a la Bioinformática"

Presentaciones similares


Anuncios Google