Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porJosefa Arroyo Palma Modificado hace 10 años
1
© Copyright Ebiointel,SL 2006 NAR Nucelic Acid Research The Molecular Biology Database Collection 2006 update
2
© Copyright Ebiointel,SL 2006 NAR
3
© Copyright Ebiointel,SL 2006
4
EMBL-GB-DDBJ http://www.ebi.ac.uk/services http://www.ebi.ac.uk/services / http://www.ncbi.nlm.nih.gov / http://www.ddbj.nig.ac.jp/Welcome-e.html
5
© Copyright Ebiointel,SL 2006 EBI-EMBL Tool Box
6
© Copyright Ebiointel,SL 2006
7
NCBI-GenBank
8
© Copyright Ebiointel,SL 2006
9
Preparación y edición Sumisión Vía Web en BankIt Sequin (software) Asignación de códigos de acceso Revisiones y actualizaciones Colaboración internacional intercambio de entre EMBL, GenBank i DDBJ Almacenamiento y formato de las secuencias
10
© Copyright Ebiointel,SL 2006 Identificadores Identificadores comunes en bioinformática –Locus Name –Accession Numbers –GenInfo ID (gi) –Pubmed ID –…
11
© Copyright Ebiointel,SL 2006 LOCUS IDs Letras identificativas del organismo + código del gen: –ECRECA: Escherichia coli recA gene Actualmente NO se utiliza esta identificación por el crecimiento de la base de datos. Accesion number –AC 1 letra + 5 números (X00123), 2 letras + 6 números (AJ000123) 3 letras + 8 números
12
© Copyright Ebiointel,SL 2006 Registros Una colección de registros (records). Cada registro tiene varios campos. Cada campo contiene información específica. Cada campo contiene datos de un tipo determinado. –Ej: texto, números enteros, fechas Cada registro tiene una clave primaria. Un identificador único que define al registro sin ambigüedad.
13
© Copyright Ebiointel,SL 2006 Registros gi = Genbank Identifier: Clave única : Clave primaria Cambia con cada actualización del registro correspondiente a la secuencia Cada entrada en la bd tiene un único ID No sujetos a versiones La entrada se mantiene a lo largo del tiempo Las diferentes versiones de una misma secuencia se administran mediante los códigos de acceso (AC) Accession Number: Clave secundaria Refiere al mismo locus y secuencia, a pesar de los cambios en la secuencia. Accession + Version es equivalente al gi (representa un identificador único) Ejemplo: AF405321.2Accession: AF405321Version: 2
14
© Copyright Ebiointel,SL 2006 Ficheros ASCII SenzilloMúltipleMixto FASTA Clustal RSF EMBLPhylip GenBankMSF GCG Stadem FASTA senzillo Formatos secuencias >sp|P03017|RECA_ECOLI RecA protein (Recombinase A) - Escherichia coli. AIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGR IVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPD TGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAG NLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGS >sp|P03017|RECA_ECOLI RecA protein (Recombinase A) - Escherichia coli. AIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGR IVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPD TGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAG NLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGS Seq1. Descripción/título de la secuencia AGTACGTAGTAGCTGCTGCTACGTGCGCTAGCTAGTACGTCA CGACGTAGATGCTAGCTGACTCGATGC Seq1. Descripción/título de la secuencia AGTACGTAGTAGCTGCTGCTACGTGCGCTAGCTAGTACGTCA CGACGTAGATGCTAGCTGACTCGATGC
15
© Copyright Ebiointel,SL 2006 Feature key examples Key Description conflict Separate determinations of the "same" sequence differ rep_origin Origin of replication protein_bind Protein binding site on DNA CDS Protein-coding sequence misc_RNA Generic label for an undefined RNA D-loop Mitochondrial or other D-loop structure Anotacición Qualifiers auxiliary information Location instructions for finding the feature Key Location/Qualifiers CDS 86..742 /product="hypoxanthine phosphoribosyltransferase" /label=hprt /note="hprt catalyzes vital steps in the reutilization pathway for purine biosynthesis and its deficiency leads to forms of ""gouty"" arthritis" rep_origin 234..243 /direction=left CDS 109..564 /usedin=X10009:catalase Location Description 467 Points to a single base in the presented sequence 340..565 Points to a continuous range of bases bounded by and including the starting and ending bases <345..500 Indicates that the exact lower boundary point of a feature is unknown. The location begins at some base previous to the first base specified (which need not be contained in the presented sequence) and con- tinues to and includes the ending base (102.110) Indicates that the exact location is unknown but that it is one of the bases between bases 102 and 110, in- clusive Feature key a keyword indicating functional group Features & Qualifiers EMBL Features & Qualifiers EMBL Feature Table Definition Feature Table Definition Anotaciones
16
© Copyright Ebiointel,SL 2006 Ejemplo anotación Eukaryotic gene source 1..1509 /organism="Mus musculus" /strain="CD1" promoter <1..9 /gene="ubc42" mRNA join(10..567,789..1320) /gene="ubc42" CDS join(54..567,789..1254) /gene="ubc42" /product="ubiquitin conjugating enzyme" /function="cell division control" /translation="MVSSFLLAEYKNLIVNPSEHFKISVNEDNLTEGPPDTLY QKIDTVLLSVISLLNEPNPDSPANVDAAKSYRKYLYKEDLESYPMEKSLDECS AEDIEYFKNVPVNVLPVPSDDYEDEEMEDGTYILTYDDEDEEEDEEMDDE" exon 10..567 /gene="ubc42" /number=1 intron 568..788 /gene="ubc42" /number=1 exon 789..1320 /gene="ubc42" /number=2 polyA_signal 1310..1317 /gene="ubc42"
17
© Copyright Ebiointel,SL 2006 Ejemplo anotación Bacterial Operon source 1..9430 /organism="Lactococcus sp." /strain="MG1234" -35_signal 160..165 /gene="galA" /evidence=EXPERIMENTAL -10_signal 179..184 /gene="galA" /evidence=EXPERIMENTAL CDS 405..1934 /gene="galA" /product="galactose permease" /function="galactose transporter" /evidence=EXPERIMENTAL CDS 2003..3001 /gene="galM" /product="aldose 1-epimerase" /EC_number="5.1.3.3" /function="mutarotase" CDS 3235..4537 /gene="galK" /product="galactokinase" /EC_number="2.7.1.6" /evidence=EXPERIMENTAL misc_RNA 189..6865 /gene="galAMK" /evidence=EXPERIMENTAL
18
© Copyright Ebiointel,SL 2006
19
GenBank Overview Bases de secuencia nucleotidicas
20
© Copyright Ebiointel,SL 2006
21
Prot Prim Swiss-Prot PIR Protein International Resource Bases de secuencia de proteínas
22
© Copyright Ebiointel,SL 2006 PIR Entrada PIR
23
© Copyright Ebiointel,SL 2006 Ejemplos secuencias Exemples Formats Ejemplo de una secuencia en los diferentes bancos de datos (reconbinasa A)
24
© Copyright Ebiointel,SL 2006 Prot Secun Prosite (Patrones) interpro, iproclass (dominios/clasificación) Protein Data Bank PDB: Protein Data Bank (estructura) DIP (base de datos de interacciones entre proteínas) Swiss 2D-page (mapas bidimensionales) BRENDA (enzimas) PharmGKB (dianas terapeuticas) Therapeutic Target Database (dianas terapeuticas) Bases de datos especializados de proteínas
25
© Copyright Ebiointel,SL 2006 http://us.expasy.org/prosite / Bancos especializados de proteínas
26
© Copyright Ebiointel,SL 2006 www.ebi.ac.uk/interpro Bancos especializados de proteínas
27
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
28
© Copyright Ebiointel,SL 2006 http://dip.doe-mbi.ucla.edu/dip/Search.cgi Identificar interacciones entre proteínas
29
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas http://us.expasy.org
30
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
31
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
32
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
33
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
34
© Copyright Ebiointel,SL 2006 Bancos especializados de proteínas
35
© Copyright Ebiointel,SL 2006 BD Genom Bases Genómicas Genomes OnLine Database
36
© Copyright Ebiointel,SL 2006 BD otras Otras Bases genómicas
37
© Copyright Ebiointel,SL 2006 1-La estructura del domino globular de la histona H5 (1Hst) se ha resuelto por cristalografía. Quieres estudiar la estabilidad de la primera hélice utilizando un péptido que incluya dicha hélice, ¿cual es la secuencia de dicho péptido? 2- Quieres realizar un estudio de los niveles de histona mediante geles bidimensionales. ¿Que tejidos podrás usar como referencia de su nivel? 3- ¿Cuales de estas proteinas se pueden usar como diana terapeutica de la diabetes ( Diabetes mellitus) ? a) Acyl-CoA desaturase 1 b) 3-phosphoinositide dependent protein kinase-1 c) Endothelin receptor d) Todas ellas 4- ¿Cuáles de las anteriores coresponden a un enzima y cual es su EC- number? Exemples
38
© Copyright Ebiointel,SL 2006 5- Estas realizando un estudio comparativo de extractos proteicos de riñón mediante geles bidimensionales entre ratas control y ratas con insuficiencia renal. Ves modificaciones en la intensidad del spot marcado con una flecha ¿de que proteína se trata? 6-busca los posibles lugares de fosforilación de la histona h10 humana por la ck2.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.