Introducción a la Bioinformática

Slides:



Advertisements
Presentaciones similares
Representación del conocimiento
Advertisements

Conceptos básicos de Internet
Diseño y análisis de algoritmos
III - Gestión de memoria
PSI-BLAST.
BLAST.
TEORÍA GENERAL DE SISTEMAS
DIAGRAMAS DE FLUJO Y PSEUDOCÓDIGO
DIAGRAMAS DE FLUJO Y PSEUDOCÓDIGO
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
PROTOCOLOS Un protocolo es un conjunto de reglas que hacen que la comunicación en una red sea más eficiente.
Encuentra las 12 diferencias
Estrategias de Búsqueda
International Nucleotide Sequence Database Collaboration
O (m × n).
ALGORITMOS es un conjunto preescrito de instrucciones o reglas bien definidas, ordenadas y finitas que permite realizar una actividad mediante pasos.
La PD no es adecuada para buscar en BD
Programación de Computadores
Genome-Wide Analysis of the Core DNA Replication
Matrices Es una estructura homogénea, compuesta por varios elementos, todos del mismo tipo y almacenados consecutivamente en memoria A cada elemento se.
Trabajo presentado por: LUIS FERNANDO OBANDO ING
Jonathan Rivero Guzmán Biología Profundización PRE-USM
Análisis y Diseño de Algoritmos. Propiedades : f ( n )  O ( f ( n ) ) a ) O ( f ( n ) )  O ( g ( n ) )  f ( n )  g ( n )

Desarrollando el Espíritu Emprendedor
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.

COGs Cluster of Orthologous Groups. Genes Ortólogos Comparten una gran similitud en secuencias. Pueden provenir de un ancestro común.
Asignación de Espacio No Contiguo
Administración de Memoria
Genoma Humano. Introducción Todas las instrucciones necesarias para crear un ser humano pueden ser escritas con la combinación de cuatro letras que representan.
Unidad VII: Química de Nucleótidos
Teresa Monedero y Paloma Carrera
VARIACIÓN EN EL TAMAÑO DEL GENOMA
Capítulo 7 Gestión de memoria.
Diccionario de Datos.
Unidad II: Fundamentos de Programación
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Busqueda avanzada con BLAST Preparada por Genis Parra.
FILTROS. Un filtro es un programa que recibe una entrada, la procesa y devuelve una salida. Relacionando filtros simples podemos hacer prácticamente cualquier.
Alineamiento de dos secuencias
Traducción de proteínas
PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
Análisis y Diseño de Algoritmos
Introducción a la tecnología Realizado por: Miguel Ángel Arias.
ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005.
Algoritmos para alineamientos locales: FastA
Bioinformática: DR_2283 Aida Moreno Moral Pablo Mier Muñoz Claudia Lucía Millán Nebot.
Javier Ramírez M1 Tema 1 REALIZADO POR JAVIER RAMÍREZ M SIGUIENTE.
Alex Sánchez Introducción a la Bioinformática Herramientas de búsqueda en bases de datos SRS y Entrez.
ACIDOS NUCLEICOS SEMANA 32 SEMANA 32.
Alineamiento local: búsqueda de homologías
Síntesis de proteínas en eucariontes.
EXPORTACIÓN.
M ANUAL DE U SUARIO DE W ORDPRESS Nombre: Diana Selena Puglla P. Curso y Paralelo: Primero “B”
Entendiendo las partes
MARKETING INTERNACIONAL.
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
SEGMENTACIÓN DE LA RED UNIVERSIDAD NACIONAL DE INGENIERÍA
TEMA 4.7 mRNAs EUCARIÓTICOS.
Las funciones son librerías ya estandarizadas que permiten al usuario realizar sus respectivas programaciones. Una función es un conjunto de líneas de.
Actividad 12. Estimación en los proyectos de software. M.C. Juan Carlos Olivares Rojas Syllabus May, 2009.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
ESTRUCTURAS DE DATOS “Conceptualización de estructuras de datos” Por: Eduardo Robayo.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
JOSE ALBERTO JIMENEZ JIMENEZ KATTY HIPOLITO. 7.1 INTRODUCCION AL LENGUAJE EMSAMBLADOR.
PROSITE: Guía rápida Dirección URL de PROSITE.
Capítulo 7 Números hasta 20 Primeros Básicos MATERIAL PEDAGÓGICO IRA.
Transcripción de la presentación:

Introducción a la Bioinformática FASTA

Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear las secuencias de las bases de datos emparejadas con la secuencia query. 2

ktup. Tanto FASTA como BLAST usan una estrategia de búsqueda inicial basada en palabras cortas. ktup en FASTA es el parámetro que indica el tamaño de la palabra utilizada en esta búsqueda inicial. FASTA utiliza por default ktup=2, mientras que BLAST utiliza ktup=3.

Matrices y scores

Homólogos distantes. Existe una opción en FASTA (-F) que les permite ignorar (i.e. que no aparezcan en el output) secuencias altamente similares al query. Esto es útil, por ejemplo, para focalizar una búsqueda en las secuencias más divergentes. No existe una opción similar en BLAST.

Filtrado de secuencias de baja complejidad Filtrado de secuencias de baja complejidad. Por default, BLAST filtra secuencias de baja complejidad o repeticiones. FASTA no!. Esto puede afectar la capacidad de discriminar falsos positivos, aunque FASTA provee otro tipo de opciones para manejar este tipo de casos.

Muchas secuencias son altamente repetitivas Muchas secuencias son altamente repetitivas. Si la secuencia query contiene regiones de baja complejidad o repeticiones, es posible que una búsqueda encuentre muchas secuencias no relacionadas, con altos scores (por ej hits contra colas de poly-A o regiones ricas en Prolina) o repeticiones como Alu. BLAST permite filtrar el primer tipo de casos, mediante la opción -F. FASTA en cambio no provee esta alternativa. Es el usuario el que tiene que filtrar el query antes de realizar una búsqueda.

Secuencias cortas. Si buscamos un primer o un péptido, al utilizar BLAST debemos tener en cuenta que BLAST no es muy útil al respecto. Esto es porque BLAST tiene un límite inferior sobre la longitud que puede tener una palabra (ktup). En el caso de nucleótidos, el límite inferior es 7 (el default es 11). En este sentido FASTA es mejor, porque siempre pueden usar ktup=1. Por otra parte, en el caso específico de péptidos, FASTA provee algunos algoritmos particulares de búsqueda (fastf3, fasts3 y tfasf3, tfasts3).

Versiones de FASTA FASTA: compara secuencia de una proteína o DNA Query / biblioteca de secuencias de proteínas o DNA. TFASTA: compara secuencia de una proteína Query / biblioteca de secuencias de ADN FASTF/TFASTF y FASTS/TFASTS: compara pequeños fragmentos de pépticos / base de datos de secuencias de proteína (FASTF/FASTS) o base de datos de secuencias de ADN (TFASTF/TFASTS).

FASTX y FASTY: Traduce una secuencia de ADN en sus 3 regiones de marco de lectura forward y compara estos 3 marcos con una base de datos de proteínas. TFASTX y TFASTY: compara una secuencia de proteínas con una base de datos de ADN traduciendo cada secuencia de ADN en sus 6 posibles marcos de lectura.

GRACIAS

Ejemplo: Realizaremos un FASTA de la secuencia de M. bovis MBOVIS(MrWr) MRALIIVDVQNDFCEGGSLAVTGGAALARAISDYLAEAADYHHVVATKDFHIDPGDDFSGTPDYSSSWPPHCVSGTPGADFHPSLDTSAIEAVFYKGAYTGAYSGFEGVDENGTPLLNWLRQRGVDEVDVVGIATDHCVRQTAEDAVRNGLATRVLVDLTAGVSADTTVAALEEMRTASVELVCSPDGTA 14

15

16

17

18

19

20