Download - Protein Grouping Kerman Aloria
Protein GroupingKerman Aloria
Miraflores de la Sierra. MadridDiciembre 10-11, 2012
2
Protein inference
Identificación de proteínas:• Identificación de péptidos
• Perdida de la relación directa entre péptido y proteína
• Posibles ambigüedades para determinar la presencia de ciertas proteínas en la muestra:
- La presencia de un conjunto de péptidos puede ser explicado por diferentes conjuntos de proteínas (ej. isoformas)
- Diferentes péptidos pueden explicar un mismo espectro (ej. Leu/Ile)
3
Protein inference
Objetivo:Gestionar las ambigüedades inherentes a la tecnología shotgun
Posibles opciones:• Elegir la explicación más sencilla (número mínimo de proteínas)
• Elegir una proteína representativa por grupo (¿cuál?)
• Presentar todas las posibles proteínas clasificadas en base a su evidencia experimental
4
Protein inference
BA C
D
EF H
G
JI
K N
ML
1 2 3 4 5 6 7 8
9 10 11 12 13 14 15 16
17 18 19 20 21 22 23 24
Diferentes escenarios posiblesPropuesta de “report”
Minimal list of proteins
1- Protein A → Peptides 1, 22- Protein B → Peptides 3, 43- Protein C → Peptides 5, 6*, 7*4- Protein D → Peptides 6*, 7*, 85- Protein E → Peptides 9*, 10*, 11*, 12* Protein F → Peptides 9*, 10*, 11*, 12*6- Protein G → Peptides 13, 14*, 15*, 16*7- Protein I → Peptides 17, 18*8- Protein K → Peptides 19*, 209- Protein group Protein L → Peptides 21*, 22*, 23*, 24* Protein M → Peptides 21*, 22*, 23* Protein N → Peptides 22*, 23*, 24*
Protein count: 9
No conclusive evidence10- Protein H → Peptides 14*, 15*, 16*11- Protein J → Peptides 18*, 19*
Nesvizhskii A, Aebersold R: Interpretation of shotgun proteomic data. Mol Cell Proteomics 2005, 4(10):1419–1440 (modificado).
5
PAnalyzer• PAnalyzer, a software tool to group and report the list of identified proteins into four categories following the recommendations proposed by Nesvizhskii & Aebersold
• Conclusive protein: a protein identified by at least one unique (distinct, discrete) peptide*
• Indistinguishable protein: a member of a group of proteins sharing all peptides* that are exclusive to the group
• Non-conclusive protein: a protein sharing all its matched peptides* with either conclusive or indistinguishable proteins
• Ambiguous group member: a protein sharing at least one peptide* not matched to either conclusive or indistinguishable proteins
*peptides are considered different only if they can be distinguished by evidence in mass spectrum
Prieto G. et al.: PAnalyzer: A software tool for protein inference in shotgun proteomics. BMC Bioinformatics 2012
6
PAnalyzer
Propuesta Nesvizhskii & Aebersold PAnalyzer
Distinct
Differentiable
Indistinguishable
Subset
Subsumable
Group of proteins identified by shared
peptides only
Conclusive
Indistinguishable
Non-conclusive
Ambiguous group
7
MASCOT
• Para cada una de las entradas debe de haber al menos un péptido diferente
• Opciones para exportar resultados de MASCOT
8
CH60_HUMAN
CH60_DROME
CH60C_XANAC
3-10
2 11
2
MASCOT• Opciones por defecto
CH60C_CAEEL
20-21
22
Proteínas Péptidos (23 péptidos > identity) Protein category Peptide category
Conclusive
Conclusive
Conclusive
Unique: 1, 3-10, 12-23
Shared: 2, 11
23 Conclusive
21 12-1911
9
MASCOT• Include same-set protein hits
CH60_HUMAN
CH60_DROME
CH60C_XANAC
3-10
2 11
2CH60C_CAEEL
20-21
22
Proteínas Péptidos (23 péptidos > identity) Protein category Peptide category
Conclusive
Conclusive
Conclusive
Unique: 1, 3-10, 12-22
Shared: 2, 11, 23
23
21 12-1911
CH60C_XANC5 23
CH60C_XANC8 23
CH60C_XANCH 23
CH60C_XANCP 23
CH60C_XANOR 23
CH60C_XANOM 23
Indistinguishable
10
CH60_HUMAN
CH60_CRIGR, MOUSE, RAT
CH60_POMPY
CH60_EUGGR
1-7 8 9-19
1-2 5-6
1-2
2-7
MASCOT• Include same-set protein hits and sub-set protein hits
9-12 14-19
CH60_BOVIN 4 6 9-14 16-19
CH60C_CANAL, PARBR, YEAST, VIBPA, VIBVU, VIBVY
9-19
CH60_CHICK 1-2 14-196 9-12
CH60C_DROME 2 11
CH60C_ARATH 2 19
2
19
CH60_DROME 20-212 11
CH60_CAEEL 222
CH60_XANAC, XANC5, XANC8, XANCH, XANCP, XANOR, XANOM
23
Proteínas Péptidos (23 péptidos > identity) Protein category Peptide category
Conclusive
Non conclusive
Conclusive
Conclusive
Indistinguishable
Unique: 8, 20, 21, 22
Shared: 1-7, 9-19, 23
11
MASCOT
• Es necesario exportar todas las proteínas que contengan algún péptido identificado y agruparlas
- Para determinar la evidencia de la presencia de una proteína en la muestra
- Para saber si un péptido es realmente único
12
Cuestiones a discutir• Dos secuencias que “machean” con un mismo espectro y con el mismo score, unique or indistinguishable?
TLNDELELIEGMK
TLNDELEIIEGMK
score
90
90
MASCOT
Unique
Unique
PAnalyzer
Indistinguishable
• ¿Hay que tener en cuenta los “macheos” secundarios si superan el identity threshold?mismo espectro
?péptido score proteína
VGGTSDVEVNEK
VGGSSEVEVNEK
81 (38)
42 (38)
CH60_HUMAN
CH60_DROME ?
13
Cuestiones a discutir
• Proteínas indistinguibles con diferentes “non-discriminating peptides”
Protein A
Protein B
Protein C
peptide 2peptide 1
peptide 2 peptide 3
peptide 3
Conclusive
Proteínas Péptidos Protein category
Indistinguishable
No hay evidencia que determine la presencia de la proteína B respecto a la proteína C