sa mot a web server for the iden5fica5on of mo5fs of
play

SA-Mot: a web server for the iden5fica5on of mo5fs of - PowerPoint PPT Presentation

SA-Mot: a web server for the iden5fica5on of mo5fs of interest extracted from protein loops Leslie REGAD MTi, UMR-S973 Inserm, Univ Paris


  1. SA-­‑Mot: ¡a ¡web ¡server ¡for ¡the ¡iden5fica5on ¡of ¡ mo5fs ¡of ¡interest ¡extracted ¡from ¡protein ¡loops ¡ ¡ Leslie ¡REGAD ¡ MTi, ¡UMR-­‑S973 ¡Inserm, ¡Univ ¡Paris ¡Diderot ¡ ¡ ¡ JOBIM, ¡Rennes, ¡03 ¡juillet ¡2012 ¡

  2. Protein ¡loops: ¡ • ¡link ¡between ¡regular ¡secondary ¡structures: ¡α-­‑helix ¡and ¡β-­‑strand ¡ ¡ • ¡involved ¡in ¡the ¡ligand ¡specificity ¡and ¡protein ¡func=on ¡ ¡ • ¡variable ¡regions ¡in ¡terms ¡of ¡structure ¡and ¡sequence ¡ • ¡previous ¡studies ¡of ¡SHORT ¡loops: ¡ ¡ o ¡extrac=on ¡of ¡small ¡structural ¡mo=fs ¡from ¡short ¡ loops ¡(Hutchinson ¡et ¡al., ¡1994) ¡ ¡ o ¡short ¡loop ¡classifica=on ¡(Wojick ¡et ¡al., ¡1999, ¡ Fernandez ¡et ¡al., ¡2004) ¡ ¡ Extrac=on ¡of ¡some ¡structural ¡mo=fs ¡from ¡SHORT ¡loops ¡

  3. SA-­‑Mot ¡Web ¡server ¡protocole ¡ hUps://sa-­‑mot.m=.univ-­‑paris-­‑diderot.fr ¡ • ¡Analysis ¡of ¡all ¡loops ¡of ¡given ¡protein ¡ Protein ¡target: ¡Topo ¡II ¡ Loop ¡informa:ons ¡ complexed ¡with ¡ANP ¡ SA-­‑Mot ¡ SA-­‑Mot ¡mo=f ¡ ¡database ¡

  4. SA-­‑Mot ¡motif ¡database ¡ Contains ¡important ¡loop ¡mo=fs ¡: ¡ • – For ¡the ¡protein ¡structure ¡ – For ¡the ¡protein ¡func=on ¡ Extrac=on ¡mo=fs ¡from ¡loops: ¡ • – Based ¡on ¡ ¡ o Structural ¡alphabet ¡HMM-­‑SA ¡(Camproux ¡et ¡al., ¡2004) ¡ o Structural ¡word ¡no=on ¡(Regad ¡et ¡al., ¡2010) ¡ – Without ¡superimposi=on ¡of ¡loop ¡structures ¡

  5. Presentation ¡of ¡HMM-­‑SA ¡ Camproux ¡et ¡al., ¡J ¡Mol ¡Biol, ¡2004 ¡ Use ¡ HMM-­‑SA ¡(Hidden ¡Markov ¡Model ¡– ¡Structural ¡Alphabet) ¡ • – Classifica=on ¡of ¡all ¡4-­‑residue ¡fragments ¡extracted ¡from ¡a ¡large ¡set ¡of ¡ protein ¡structures ¡ • Based ¡on ¡the ¡geometry ¡of ¡4-­‑residue ¡fragments ¡ • Used ¡hidden ¡Markov ¡model ¡ � � ��� � � � � � � � � � � � � � ��� � � ���

  6. Simplification ¡of ¡a ¡protein ¡structure ¡using ¡HMM-­‑SA ¡ Camproux ¡et ¡al., ¡J ¡mol ¡Biol, ¡2004 ¡ Development ¡of ¡the ¡ STRUCTURAL ¡WORD ¡ no=on ¡

  7. Extraction ¡of ¡structural ¡motif ¡HMM-­‑SA ¡ Regad ¡et ¡al., ¡CSDA, ¡2008 ¡ Extrac=on ¡of ¡7-­‑residue ¡structural ¡mo=fs ¡using ¡HMM-­‑SA ¡ • – 4 ¡SL-­‑words ¡= ¡7-­‑residue ¡fragments ¡ 1gpw_B ¡ Pos: ¡7-­‑13 ¡VDVKNGK ¡ 1sfi_A ¡ Pos: ¡28-­‑34 ¡AEYHNTQ ¡

  8. Extraction ¡of ¡structural ¡motifs ¡using ¡HMM-­‑SA ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡ YUOD: ¡ ¡ DRPI: ¡ ¡ PZCD ¡: ¡ ¡ 183 ¡7-­‑AA ¡fragments ¡ ¡ 389 ¡7-­‑AA ¡fragments ¡ ¡ 983 ¡7-­‑AA ¡fragments ¡ ¡ Recurrent ¡structural ¡words: ¡cluster ¡of ¡7-­‑AA ¡fragments ¡with ¡similar ¡geometry ¡ • (RMSd ¡= ¡0.85 ¡Å) ¡ Extrac=on ¡of ¡structural ¡word ¡ ¡ • � rapid ¡extrac=on ¡of ¡structural ¡mo=fs ¡from ¡protein ¡loops ¡without ¡ superimposi=on ¡of ¡protein ¡structures ¡

  9. SA-­‑Mot ¡database ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡ 4,911 ¡protein ¡structures ¡ • – Non ¡redundant ¡(< ¡50% ¡of ¡iden=ty ¡sequence) ¡ – High ¡resolu=on ¡(< ¡2.5 ¡Å) ¡ – Classified ¡in ¡SCOP ¡classifica=on ¡ Loop ¡ extrac=on ¡  90, ¡811 ¡loops ¡ ¡of ¡7 ¡to ¡35 ¡residues ¡  25,305 ¡≠ ¡structural ¡words ¡seen ¡between ¡1 ¡to ¡1234 ¡=mes ¡ Word ¡ extrac=on ¡ = ¡238,158 ¡7-­‑residue ¡fragments ¡

  10. 2-­‑ ¡Different ¡type ¡of ¡SA-­‑Mot ¡motifs ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡ Occurrence: ¡ ¡ • – Rare ¡words : ¡link ¡to ¡uncertain ¡region ¡ – Recurrent ¡words : ¡regular ¡structures ¡ • Weak ¡RMSD ¡ • Strong ¡AA-­‑score ¡ • Over-­‑representated ¡in ¡loop ¡dataset: ¡ non-­‑random ¡mo@fs ¡  Regular ¡structures ¡with ¡conserved ¡structures ¡and ¡amino ¡acid ¡specifici@es ¡ PZCD: ¡ 983 ¡7-­‑AA ¡fragments ¡ ¡ DRPI: ¡ 389 ¡7-­‑AA ¡fragments ¡ ¡

  11. Link ¡between ¡structural ¡words ¡and ¡binding ¡sites ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡ Loops ¡ooen ¡involved ¡in ¡protein ¡func=on ¡ • Over-­‑representa=on ¡of ¡word ¡in ¡each ¡SCOP ¡superfamilies ¡ ¡ • ¡ ¡ ¡Extrac=on ¡of ¡specific ¡words ¡for ¡protein ¡func=on ¡

  12. 3-­‑ ¡Quantification ¡of ¡the ¡specificity ¡of ¡a ¡motif ¡for ¡a ¡function ¡ Superfamily ¡: ¡ Superfamily: ¡ ¡ 52540 ¡ 81301 ¡ 1gky ¡ 1no5 ¡ 1ex7 ¡ 1wot ¡ 1ex6 ¡ 2i9g ¡ Simplifica=on ¡of ¡protein ¡structures ¡using ¡HMM-­‑SA ¡ …KZaaaAZILPMMNDYUODNH… � …ZCGBQLNTMXJUBQKUOZILP… � …CGBQAWZILPNNTRYUODNL… � …JFCGBQSJMHVQLLQKUXMMN… � …SVZWaaZIMPNXTFYUODXX… � …VOCGBQGIHBAABBQKUQXYZ… � Computa=on ¡of ¡over-­‑represnta=on ¡of ¡4-­‑SL ¡words ¡in ¡SCOP ¡superfamily ¡ Words ¡ Sf ¡52540 ¡ Sf ¡81301 ¡ ZILP ¡ OR ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡2 ¡SUPERFAMILIES ¡ YUOD ¡ OR ¡ NS ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡ CGBQ ¡ NS ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡

  13. Other ¡SA-­‑Mot ¡motif ¡types ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡ Words ¡specific ¡to ¡a ¡lot ¡of ¡superfamilies ¡ ¡ ¡ ¡UBIQUITOUS ¡WORDS ¡ • ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡structure ¡ Word ¡specific ¡to ¡one ¡ ¡superfamily ¡ ¡ ¡CANDIDATE ¡FUNCTIONAL ¡WORDS ¡ • ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡func=on ¡ DODQ ¡ YUOD ¡ EIJU ¡ Ca 2+ -binding site RUDO ¡ ATP/GTP-­‑binding ¡site ¡ NAD(P)-­‑binding ¡site ¡ SAM/SAH-­‑binding ¡site ¡

  14. SA-­‑Mot ¡Input ¡ Regad ¡et ¡al., ¡NAR, ¡2011 ¡ Our ¡own ¡pdb ¡files ¡ ¡ • Pdb ¡code ¡(4 ¡characters) ¡ •

  15. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡ Encoding ¡into ¡ HMM-­‑SA ¡

  16. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡ Encoding ¡into ¡ HMM-­‑SA ¡ SA-­‑Mot ¡mo=f ¡ ¡database ¡ Extrac=on ¡of ¡SA-­‑Mot ¡mo=fs ¡ Word ¡ Occ ¡ OR_l ¡ RMSd ¡ AA ¡ OR_sf ¡ type ¡ score ¡ Score ¡ score ¡ HBBQ ¡ 854 ¡ 34 ¡ 0.61 ¡ 12 ¡ 34 ¡ Ubi ¡ PKCD ¡ 56 ¡ 0.4 ¡ 0.54 ¡ 2 ¡ 0.7 ¡ YUOD ¡ 183 ¡ 2.5 ¡ 0.55 ¡ 23 ¡ 120 ¡ Fct ¡

  17. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

  18. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

  19. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

  20. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

  21. SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

  22. Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡ puta=ve ¡kinase ¡ from ¡Chloroflexus ¡auran:acus ¡ J-­‑10-­‑fl ¡(pdb ¡code ¡2rhm) ¡ • SA-­‑Mot ¡

  23. Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡ Flexible ¡regions ¡

  24. Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡ Over-­‑represented ¡in ¡ATP-­‑binding ¡protein ¡ Over-­‑represented ¡YVTN ¡Repeat ¡like ¡ Over-­‑represented ¡Trypsin ¡like ¡Serine ¡Protease ¡ Candidate ¡ func=onal ¡sites ¡ ATP-­‑binding ¡site ¡ Flexible ¡regions ¡

  25. Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡ Iden=fica=on ¡of ¡structural ¡mo=fs ¡of ¡interest ¡ • – For ¡protein ¡structure ¡ – For ¡protein ¡func=on ¡ • Puta=ve ¡func=onal ¡sites ¡ • ATP-­‑binding ¡site ¡ ¡  ¡in ¡agreement ¡with ¡kinase ¡ac=vity ¡ ¡  ¡no ¡found ¡with ¡other ¡predic=on ¡mo=f ¡server ¡

Recommend


More recommend