La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

¿Qué es GenBank? https://www.ncbi.nlm.nih.gov/genbank/

Presentaciones similares


Presentación del tema: "¿Qué es GenBank? https://www.ncbi.nlm.nih.gov/genbank/"— Transcripción de la presentación:

1

2 ¿Qué es GenBank? https://www.ncbi.nlm.nih.gov/genbank/
GenBank es la base de datos (BD) de secuencias genéticas del NIH. Contiene todas las secuencias de ADN de acceso público y, además, incluye anotaciones. Las secuencias están distribuidas en 3 BD: Nucleotide, EST y GSS ¿Qué es GenBank?

3 NAR (Database Issue) del 4 de Enero de 2017

4 International Nucleotide Sequence Database Collaboration

5 Cada dos meses sale una nueva versión de GenBank.
La versión 218 (del 15 de Febrero de 2017) contiene más de 199 millones de secuencias Más o menos cada 18 meses se duplica el número de secuencias de GenBank Es posible descargar la base de datos completa desde el sitio ftp del NCBI. ftp://ftp.ncbi.nih.gov/genbank El crecimiento de GenBank

6 También crece el número de usuarios de GenBank

7 Hay varias formas de enviar secuencias a GenBank
¿Cómo envío una secuencia a GenBank?

8 Cada secuencia pertenece a una de las 20 divisiones de GenBank
(12) (8) Cada secuencia pertenece a una de las 20 divisiones de GenBank

9 ¿Cómo accedo a una secuencia de GenBank?
Hay varias formas de acceder a las secuencias de nucleótidos almacenadas en Gen Bank: (1) a través de la base de datos Nucleotide, (2) a través de la herramienta BLAST o (3) a través de programas específicos desarrollados por el NCBI. ¿Cómo accedo a una secuencia de GenBank?

10 Acceso directo: La base de datos Nucleotide
Puedo acceder a las secuencias almacenadas en GenBank a través de la base de datos Nucleotide. Acceso directo: La base de datos Nucleotide

11 Acceso directo: La base de datos EST
Puedo acceder a las secuencias almacenadas en GenBank a través de la base de datos EST. Acceso directo: La base de datos EST

12 Acceso directo: La base de datos GSS
Puedo acceder a las secuencias almacenadas en GenBank a través de la base de datos GSS (Genome Survey Sequences). Acceso directo: La base de datos GSS

13 Acceso indirecto: desde la herramienta BLAST
Acceso indirecto: desde la herramienta BLAST

14 Acceso indirecto desde la página de resultados de BLAST
Pincha aquí para acceder al registro de GenBank correspondiente a una de las secuencias que ha encontrado BLAST Resultados de una búsqueda en BLAST Acceso indirecto desde la página de resultados de BLAST

15 Pincha aquí para seleccionar GenBank
Pincha aquí para acceder al fichero de GenBank correspondiente al gen que codifica esta proteína Acceso indirecto: desde un registro de la BD UniProtKB

16

17 The flat file format

18 Otras formas de visualiazar la secuencia
Pincha aquí para ver la secuencia con otro formato Pincha aquí para seleccionar qué parte de la secuencia quieres ver. Pincha aquí para ver la secuencia mediante un gráfico interactivo Pincha aquí para obtener la secuencia en formato FASTA El formato FASTA es aceptado por la mayoría de los programas de análisis de secuencias Otras formas de visualiazar la secuencia

19 Secuencia ininterrumpida de nucleótidos (70 por cada línea)
Línea de definición: Es la primera línea, e incluye una escueta definición de la secuencia. Siempre empieza por el símbolo > (mayor que) Secuencia ininterrumpida de nucleótidos (70 por cada línea) Es posible que te interese guardar esta secuencia en tu ordenador. Puedes hacer corta y pega y guardarla en un fichero de texto. La secuencia de nucleótidos en formato FASTA

20 Gráfico interactivo de la secuencia (1)
Sequence Viewer Entre los dos paneles se encuentra la barra de menús Panel general (overview panel) Panel gráfico (graphical panel) Gráfico interactivo de la secuencia (1)

21 Gráfico interactivo de la secuencia (2)
Región vista en pantalla. Se puede desplazar pinchando y desplazando el rectángulo coloreado. Desplázate por la secuencia (hacia la derecha o hacia la izquierda Se puede cambiar la región vista en pantalla pinchando y desplazando las flechas blancas con fondo azul de los extremos. Hebra complementaria (complement) Zoom Hebra directa 5’→3’ (forward) Hebra directa (5’3’) y proteína que codifica. La hebra complementaria también puede codificar proteínas. Anotaciones Gráfico interactivo de la secuencia (2)

22 Gráfico interactivo de la secuencia (3)
Configura las características que quieres ver en el panel Cambia las coordenadas de la región vista Ver directamente la secuencia Ayuda Menú herramientas Busca una característica concreta Gráfico interactivo de la secuencia (3)

23 Forward, reverse, complement and reverse-complement
Forward: cualquier secuencia escrita en sentido (5’ 3’) 5’-gaggagaagtctgccgttactgccctgtgg-3’ Reverse: la secuencia anterior escrita en sentido (3’ 5’) 3’-ggtgtcccgtcattgccgtctgaagaggag-5’ Complement: la secuencia complementaria escrita en sentido (3’ 5’) 5’-gaggagaagtctgccgttactgccctgtgg-3’ 3’-ctcctcttcagacggcaatgacgggacacc-5’ Reverse-complement: la secuencia complementaria escrita en sentido (5’ 3’) 5’-gaggagaagtctgccgttactgccctgtgg-3’ 5’-ccacagggcagtaacggcagacttctcctc-3’ Forward, reverse, complement and reverse-complement

24 ¿Qué sentido tiene todo esto?
La hebra del ADN que sirve de molde para la transcripción es la hebra no codificante. También se llama hebra sin sentido (antisense) o hebra (─). La hebra complementaria no sirve de molde para la transcripción, y se denomina hebra codificante. Su secuencia es igual a la del transcrito de RNA (cambiando U por T). También se llama hebra con sentido (sense) o hebra (+). Es la secuencia que se manda a las bases de datos. 3’ 5’ 5’ 3’ 5’ 3’ ¿Qué sentido tiene todo esto?

25 Contenido de un registro de GenBank
Los registros almacenados en la base de datos GenBank constan de varios apartados: 1.- Encabezamiento: información general sobre el registro (identificadores, número de acceso, descripción del gen y del organismo de donde procede) 2.- Referencias bibliográficas y autores que envían las secuencias 3.- Tabla de características (Features table): Incluye las anotaciones y su ubicación 4.- Secuencia de nucleótidos Contenido de un registro de GenBank

26 Referencias bibliográficas
Encabezamiento Referencias bibliográficas La última referencia (en este caso es la 2) incluye detalles sobre quién ha enviado la secuencia a la base de datos Encabezamiento y referencias bibliográficas

27 Tipo de característica
Se detalla la ubicación exacta (location) de cada característica y se añaden uno o más calificadores (qualifiers). También hay enlaces a otras BD. La tabla de características reúne todas las anotaciones de la secuencia Tabla de características (Features table)

28 Símbolo que indica que se ha llegado al final del registro
Secuencia de nucleótidos. Cada línea contiene 60 nucleótidos agrupados en 6 bloques de 10. El tipo de letra es “Courier” para que cada línea ocupe siempre la misma anchura. Símbolo que indica que se ha llegado al final del registro La secuencia de nucleótidos

29 Se puede ver cada característica por separado
Pinchando en cada característica (feature), la puedes ver con todo detalle Se puede ver cada característica por separado

30 Vista detallada de una característica (CDS)
Se resalta la región de la secuencia de nucleótidos que corresponde a la CDS (empieza por ATG y termina en TAA) Pincha aquí para obtener la región seleccionada en formato FASTA Enlaces a otras BD que ofrecen información relacionada Pincha aquí para obtener la región seleccionada en el formato de GenBank Pincha aquí para ver los detalles relacionados con la característica seleccionada Pincha aquí para seleccionar otra característica Vista detallada de una característica (CDS)

31 Cómo guardar una copia del registro en tu ordenador
Pincha aquí para hacerte con una copia del registro Seleccionar la parte del registro que te interesa Pincha aquí para crear un fichero con tu selección Pincha aquí para seleccionar el formato en que quieres almacenar el registro Cómo guardar una copia del registro en tu ordenador

32

33 Introduce aquí el término de la búsqueda
Puedes seleccionar otras bases de datos Inicia la búsqueda Información sobre el NCBI Documentación sobre el NCBI Otras bases de datos

34 Cómo hacer una búsqueda sencilla
Para buscar secuencias en Gen Bank se puede introducir el nombre de una proteína, de un gen o del autor que envió la secuencia. También se puede introducir directamente el número de acceso. Si se ponen términos compuestos, entre comillas. Cómo hacer una búsqueda sencilla

35 Aquí se introduce el término que queremos buscar: colicin
Inicio la búsqueda NUCLEOTIDE: Búsqueda rápida

36 Resultados de la búsqueda
También ha encontrado secuencias EST y GSS secuencias encontradas Esta búsqueda no ha sido muy productiva Hay que definir mejor los términos de la búsqueda para que me sea útil Resultados de la búsqueda

37 Búsqueda más detallada con un término compuesto
Inicio de la búsqueda Los términos compuestos se ponen entre comillas Búsqueda más detallada con un término compuesto

38 Búsqueda más detallada con un término compuesto
117 secuencias encontradas Resultados de la búsqueda clasificados por organismo Selecciona las secuencias de Escherichia coli Puedes filtrar los resultados de la búsqueda Búsqueda más detallada con un término compuesto

39 Búsqueda con varios términos usando operadores lógicos
Inicio de la búsqueda Puedo introducir más de un término y usar los operadores lógicos (AND, OR, NOT) Búsqueda con varios términos usando operadores lógicos

40 Selecciona la secuencia que quieres ver
Pincha aquí para ordenar los resultados con otros criterios Pincha aquí para cambiar el formato de presentación de los resultados de la búsqueda Pincha aquí para acceder a la secuencia Selecciona la secuencia que quieres ver

41 Enlaces a otras bases de datos
Registro de GenBank seleccionado

42 Búsqueda avanzada

43 Parámetros para la búsqueda avanzada
Introduce un operador lógico Introduce aquí los términos de la búsqueda Selecciona en qué campo hay que buscar cada término Añade otro término de búsqueda Parámetros para la búsqueda avanzada

44 Bibliografía Capítulo 2: How most people use Bioinformatics
Capítulo 3: Using nucleotide sequences databases Bibliografía


Descargar ppt "¿Qué es GenBank? https://www.ncbi.nlm.nih.gov/genbank/"

Presentaciones similares


Anuncios Google