La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

© Copyright Ebiointel,SL 2006 NAR Nucelic Acid Research The  Molecular  Biology  Database  Collection  2006  update.

Presentaciones similares


Presentación del tema: "© Copyright Ebiointel,SL 2006 NAR Nucelic Acid Research The  Molecular  Biology  Database  Collection  2006  update."— Transcripción de la presentación:

1 © Copyright Ebiointel,SL 2006 NAR Nucelic Acid Research The  Molecular  Biology  Database  Collection  2006  update

2 © Copyright Ebiointel,SL 2006 NAR

3 © Copyright Ebiointel,SL 2006

4 EMBL-GB-DDBJ http://www.ebi.ac.uk/services http://www.ebi.ac.uk/services / http://www.ncbi.nlm.nih.gov / http://www.ddbj.nig.ac.jp/Welcome-e.html

5 © Copyright Ebiointel,SL 2006 EBI-EMBL Tool Box

6 © Copyright Ebiointel,SL 2006

7 NCBI-GenBank

8 © Copyright Ebiointel,SL 2006

9 Preparación y edición Sumisión Vía Web en BankIt Sequin (software) Asignación de códigos de acceso Revisiones y actualizaciones Colaboración internacional intercambio de entre EMBL, GenBank i DDBJ Almacenamiento y formato de las secuencias

10 © Copyright Ebiointel,SL 2006 Identificadores Identificadores comunes en bioinformática –Locus Name –Accession Numbers –GenInfo ID (gi) –Pubmed ID –…

11 © Copyright Ebiointel,SL 2006 LOCUS IDs Letras identificativas del organismo + código del gen: –ECRECA: Escherichia coli recA gene Actualmente NO se utiliza esta identificación por el crecimiento de la base de datos. Accesion number –AC 1 letra + 5 números (X00123), 2 letras + 6 números (AJ000123) 3 letras + 8 números

12 © Copyright Ebiointel,SL 2006 Registros Una colección de registros (records). Cada registro tiene varios campos. Cada campo contiene información específica. Cada campo contiene datos de un tipo determinado. –Ej: texto, números enteros, fechas Cada registro tiene una clave primaria. Un identificador único que define al registro sin ambigüedad.

13 © Copyright Ebiointel,SL 2006 Registros gi = Genbank Identifier: Clave única : Clave primaria Cambia con cada actualización del registro correspondiente a la secuencia Cada entrada en la bd tiene un único ID No sujetos a versiones La entrada se mantiene a lo largo del tiempo Las diferentes versiones de una misma secuencia se administran mediante los códigos de acceso (AC) Accession Number: Clave secundaria Refiere al mismo locus y secuencia, a pesar de los cambios en la secuencia. Accession + Version es equivalente al gi (representa un identificador único) Ejemplo: AF405321.2Accession: AF405321Version: 2

14 © Copyright Ebiointel,SL 2006 Ficheros ASCII SenzilloMúltipleMixto FASTA Clustal RSF EMBLPhylip GenBankMSF GCG Stadem FASTA senzillo Formatos secuencias >sp|P03017|RECA_ECOLI RecA protein (Recombinase A) - Escherichia coli. AIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGR IVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPD TGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAG NLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGS >sp|P03017|RECA_ECOLI RecA protein (Recombinase A) - Escherichia coli. AIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGR IVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPD TGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAG NLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGS  Seq1. Descripción/título de la secuencia AGTACGTAGTAGCTGCTGCTACGTGCGCTAGCTAGTACGTCA CGACGTAGATGCTAGCTGACTCGATGC  Seq1. Descripción/título de la secuencia AGTACGTAGTAGCTGCTGCTACGTGCGCTAGCTAGTACGTCA CGACGTAGATGCTAGCTGACTCGATGC

15 © Copyright Ebiointel,SL 2006 Feature key examples Key Description conflict Separate determinations of the "same" sequence differ rep_origin Origin of replication protein_bind Protein binding site on DNA CDS Protein-coding sequence misc_RNA Generic label for an undefined RNA D-loop Mitochondrial or other D-loop structure Anotacición Qualifiers auxiliary information Location instructions for finding the feature Key Location/Qualifiers CDS 86..742 /product="hypoxanthine phosphoribosyltransferase" /label=hprt /note="hprt catalyzes vital steps in the reutilization pathway for purine biosynthesis and its deficiency leads to forms of ""gouty"" arthritis" rep_origin 234..243 /direction=left CDS 109..564 /usedin=X10009:catalase Location Description 467 Points to a single base in the presented sequence 340..565 Points to a continuous range of bases bounded by and including the starting and ending bases <345..500 Indicates that the exact lower boundary point of a feature is unknown. The location begins at some base previous to the first base specified (which need not be contained in the presented sequence) and con- tinues to and includes the ending base (102.110) Indicates that the exact location is unknown but that it is one of the bases between bases 102 and 110, in- clusive Feature key a keyword indicating functional group Features & Qualifiers EMBL Features & Qualifiers EMBL Feature Table Definition Feature Table Definition Anotaciones

16 © Copyright Ebiointel,SL 2006 Ejemplo anotación Eukaryotic gene source 1..1509 /organism="Mus musculus" /strain="CD1" promoter <1..9 /gene="ubc42" mRNA join(10..567,789..1320) /gene="ubc42" CDS join(54..567,789..1254) /gene="ubc42" /product="ubiquitin conjugating enzyme" /function="cell division control" /translation="MVSSFLLAEYKNLIVNPSEHFKISVNEDNLTEGPPDTLY QKIDTVLLSVISLLNEPNPDSPANVDAAKSYRKYLYKEDLESYPMEKSLDECS AEDIEYFKNVPVNVLPVPSDDYEDEEMEDGTYILTYDDEDEEEDEEMDDE" exon 10..567 /gene="ubc42" /number=1 intron 568..788 /gene="ubc42" /number=1 exon 789..1320 /gene="ubc42" /number=2 polyA_signal 1310..1317 /gene="ubc42"

17 © Copyright Ebiointel,SL 2006 Ejemplo anotación Bacterial Operon source 1..9430 /organism="Lactococcus sp." /strain="MG1234" -35_signal 160..165 /gene="galA" /evidence=EXPERIMENTAL -10_signal 179..184 /gene="galA" /evidence=EXPERIMENTAL CDS 405..1934 /gene="galA" /product="galactose permease" /function="galactose transporter" /evidence=EXPERIMENTAL CDS 2003..3001 /gene="galM" /product="aldose 1-epimerase" /EC_number="5.1.3.3" /function="mutarotase" CDS 3235..4537 /gene="galK" /product="galactokinase" /EC_number="2.7.1.6" /evidence=EXPERIMENTAL misc_RNA 189..6865 /gene="galAMK" /evidence=EXPERIMENTAL

18 © Copyright Ebiointel,SL 2006

19 GenBank Overview Bases de secuencia nucleotidicas

20 © Copyright Ebiointel,SL 2006

21 Prot Prim Swiss-Prot PIR Protein International Resource Bases de secuencia de proteínas

22 © Copyright Ebiointel,SL 2006 PIR Entrada PIR

23 © Copyright Ebiointel,SL 2006 Ejemplos secuencias Exemples Formats Ejemplo de una secuencia en los diferentes bancos de datos (reconbinasa A)

24 © Copyright Ebiointel,SL 2006 Prot Secun Prosite (Patrones) interpro, iproclass (dominios/clasificación) Protein Data Bank PDB: Protein Data Bank (estructura) DIP (base de datos de interacciones entre proteínas) Swiss 2D-page (mapas bidimensionales) BRENDA (enzimas) PharmGKB (dianas terapeuticas) Therapeutic Target Database (dianas terapeuticas) Bases de datos especializados de proteínas

25 © Copyright Ebiointel,SL 2006 http://us.expasy.org/prosite / Bancos especializados de proteínas

26 © Copyright Ebiointel,SL 2006 www.ebi.ac.uk/interpro Bancos especializados de proteínas

27 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

28 © Copyright Ebiointel,SL 2006 http://dip.doe-mbi.ucla.edu/dip/Search.cgi Identificar interacciones entre proteínas

29 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas http://us.expasy.org

30 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

31 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

32 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

33 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

34 © Copyright Ebiointel,SL 2006 Bancos especializados de proteínas

35 © Copyright Ebiointel,SL 2006 BD Genom Bases Genómicas Genomes OnLine Database

36 © Copyright Ebiointel,SL 2006 BD otras Otras Bases genómicas

37 © Copyright Ebiointel,SL 2006 1-La estructura del domino globular de la histona H5 (1Hst) se ha resuelto por cristalografía. Quieres estudiar la estabilidad de la primera hélice utilizando un péptido que incluya dicha hélice, ¿cual es la secuencia de dicho péptido? 2- Quieres realizar un estudio de los niveles de histona mediante geles bidimensionales. ¿Que tejidos podrás usar como referencia de su nivel? 3- ¿Cuales de estas proteinas se pueden usar como diana terapeutica de la diabetes ( Diabetes mellitus) ? a) Acyl-CoA desaturase 1 b) 3-phosphoinositide dependent protein kinase-1 c) Endothelin receptor d) Todas ellas 4- ¿Cuáles de las anteriores coresponden a un enzima y cual es su EC- number? Exemples

38 © Copyright Ebiointel,SL 2006 5- Estas realizando un estudio comparativo de extractos proteicos de riñón mediante geles bidimensionales entre ratas control y ratas con insuficiencia renal. Ves modificaciones en la intensidad del spot marcado con una flecha ¿de que proteína se trata? 6-busca los posibles lugares de fosforilación de la histona h10 humana por la ck2.


Descargar ppt "© Copyright Ebiointel,SL 2006 NAR Nucelic Acid Research The  Molecular  Biology  Database  Collection  2006  update."

Presentaciones similares


Anuncios Google