Protein Grouping Kerman Aloria Miraflores de la Sierra. Madrid Diciembre 10-11, 2012
2 Protein inference Identificación de proteínas: Identificación de péptidos Perdida de la relación directa entre péptido y proteína Posibles ambigüedades para determinar la presencia de ciertas proteínas en la muestra: - La presencia de un conjunto de péptidos puede ser explicado por diferentes conjuntos de proteínas (ej. isoformas) - Diferentes péptidos pueden explicar un mismo espectro (ej. Leu/Ile)
3 Protein inference Objetivo: Gestionar las ambigüedades inherentes a la tecnología shotgun Posibles opciones: Elegir la explicación más sencilla (número mínimo de proteínas) Elegir una proteína representativa por grupo (¿cuál?) Presentar todas las posibles proteínas clasificadas en base a su evidencia experimental
4 Protein inference B A C D E F H G J I K N M L Diferentes escenarios posibles Propuesta de report Minimal list of proteins 1- Protein A Peptides 1, 2 2- Protein B Peptides 3, 4 3- Protein C Peptides 5, 6*, 7* 4- Protein D Peptides 6*, 7*, 8 5- Protein E Peptides 9*, 10*, 11*, 12* Protein F Peptides 9*, 10*, 11*, 12* 6- Protein G Peptides 13, 14*, 15*, 16* 7- Protein I Peptides 17, 18* 8- Protein K Peptides 19*, Protein group Protein L Peptides 21*, 22*, 23*, 24* Protein M Peptides 21*, 22*, 23* Protein N Peptides 22*, 23*, 24* Protein count: 9 No conclusive evidence 10- Protein H Peptides 14*, 15*, 16* 11- Protein J Peptides 18*, 19* Nesvizhskii A, Aebersold R: Interpretation of shotgun proteomic data. Mol Cell Proteomics 2005, 4(10):1419–1440 (modificado).
5 PAnalyzer PAnalyzer, a software tool to group and report the list of identified proteins into four categories following the recommendations proposed by Nesvizhskii & Aebersold Conclusive protein: a protein identified by at least one unique (distinct, discrete) peptide* Indistinguishable protein: a member of a group of proteins sharing all peptides* that are exclusive to the group Non-conclusive protein: a protein sharing all its matched peptides* with either conclusive or indistinguishable proteins Ambiguous group member: a protein sharing at least one peptide* not matched to either conclusive or indistinguishable proteins *peptides are considered different only if they can be distinguished by evidence in mass spectrum Prieto G. et al.: PAnalyzer: A software tool for protein inference in shotgun proteomics. BMC Bioinformatics 2012
6 PAnalyzer Propuesta Nesvizhskii & AebersoldPAnalyzer Distinct Differentiable Indistinguishable Subset Subsumable Group of proteins identified by shared peptides only Conclusive Indistinguishable Non-conclusive Ambiguous group
7 MASCOT Para cada una de las entradas debe de haber al menos un péptido diferente Opciones para exportar resultados de MASCOT
8 CH60_HUMAN CH60_DROME CH60C_XANAC MASCOT Opciones por defecto CH60C_CAEEL ProteínasPéptidos (23 péptidos > identity)Protein categoryPeptide category Conclusive Unique: 1, 3-10, Shared: 2, Conclusive
9 MASCOT Include same-set protein hits CH60_HUMAN CH60_DROME CH60C_XANAC CH60C_CAEEL ProteínasPéptidos (23 péptidos > identity)Protein categoryPeptide category Conclusive Unique: 1, 3-10, Shared: 2, 11, CH60C_XANC5 23 CH60C_XANC8 23 CH60C_XANCH 23 CH60C_XANCP 23 CH60C_XANOR 23 CH60C_XANOM 23 Indistinguishable
10 CH60_HUMAN CH60_CRIGR, MOUSE, RAT CH60_POMPY CH60_EUGGR MASCOT Include same-set protein hits and sub-set protein hits CH60_BOVIN CH60C_CANAL, PARBR, YEAST, VIBPA, VIBVU, VIBVY 9-19 CH60_CHICK CH60C_DROME 211 CH60C_ARATH CH60_DROME CH60_CAEEL 222 CH60_XANAC, XANC5, XANC8, XANCH, XANCP, XANOR, XANOM 23 ProteínasPéptidos (23 péptidos > identity)Protein categoryPeptide category Conclusive Non conclusive Conclusive Indistinguishable Unique: 8, 20, 21, 22 Shared: 1-7, 9-19, 23
11 MASCOT Es necesario exportar todas las proteínas que contengan algún péptido identificado y agruparlas - Para determinar la evidencia de la presencia de una proteína en la muestra - Para saber si un péptido es realmente único
12 Cuestiones a discutir Dos secuencias que machean con un mismo espectro y con el mismo score, unique or indistinguishable? TLNDELELIEGMK TLNDELEIIEGMK score 90 MASCOT Unique PAnalyzer Indistinguishable ¿Hay que tener en cuenta los macheos secundarios si superan el identity threshold? mismo espectro ? péptidoscoreproteína VGGTSDVEVNEK VGGSSEVEVNEK 81 (38) 42 (38) CH60_HUMAN CH60_DROME ?
13 Cuestiones a discutir Proteínas indistinguibles con diferentes non-discriminating peptides Protein A Protein B Protein C peptide 2peptide 1 peptide 2peptide 3 Conclusive ProteínasPéptidosProtein category Indistinguishable No hay evidencia que determine la presencia de la proteína B respecto a la proteína C