(c) 1992-2000 Regents of the University of California, Santa Cruz
Sequence Alignment and Modeling Software System
http://www.cse.ucsc.edu/research/compbio/sam.html

Citations (SAM, SAM-T99, HMMs)

Sequence numbers correspond to the following labels:

    • T0473 CmR9, Clostridium thermocellum, 68 residues
    • gi|191160896|ref|ZP_03022779.1|_2:64 conserved hypothetical protein [Geobacter sp. M21]
    • gi|190997627|gb|EDV73072.1| conserved hypothetical protein [Geobacter sp. M21]
    • gi|191160909|ref|ZP_03022792.1|_1:59 conserved hypothetical protein [Geobacter sp. M21]
    • gi|190997640|gb|EDV73085.1| conserved hypothetical protein [Geobacter sp. M21]
                        10             20              30            40
                        |              |               |             |
   1 .....MK...IT.K.DMIIADVLQMD....RG.TAPIF....IN.NGM.HCLG....CPSSMGES
   2 .....MK...IT.K.DMIIADVLQMD....RG.TAPIF....IN.NGM.HCLG....CPSSMGES
   3 m....VQ...IT.K.DTIIGDILDIA....PE.TAPLF....LS.IGM.HCLG....CPSSRGET
   4 .....MQ...IT.K.DMTIGEIVRNF....PN.SIEIL....MS.FGM.GCVG....CPSAQGES
   5 .....MQ...IT.K.DMTIGEIVRNF....PS.SIEIL....MS.FGM.GCVG....CPSAQGES
   6 .....MT...IT.K.EMTITEVVTKY....PK.TIPIF....YK.HGM.GCLG....CAAAQFEN
   7 ms...EK...VT.K.DMTISEVLKKN....PK.TAEVF....MK.HGM.QCLG....CPSAAGET
   8 .....MK...IT.K.DMIIADIIAID....QN.LIPIL....LD.TGM.HCIG....CPSAQGES
   9 .....MK...IS.K.DMTIGEVVRNH....PE.CVEVL....FN.FGL.GCVG....CPSAQAET
  10 m....AT...IT.K.EMSITEVVSKY....PQ.TVPVF....ME.HGM.GCLG....CAAARFEN
  11 .....MK...IT.E.TMGIGECVAKF....PN.TVPVF....MS.FGM.SCLG....CSAARFEN
  12 m....AK...VT.K.DMIISDVLNMD....KG.TVPIF....LE.SGM.HCLG....CPSSSGES
  13 .....M-...IT.K.DMTIGEILRVK....PE.SAQVL....MD.MGM.GCLG....CPSAQFET
  14 .....M-...IT.K.DWTITDIVEKY....PK.TTEIL....MN.HGM.HCFG....CMAARFEN
  15 .....MT...IT.R.DMLIGDLLRMK....PE.AASIL....MG.FGM.GCLG....CPSSQMES
  16 .....MK...IN.R.DMTIMDVMQLD....RE.VATIF....MK.YGL.HCLG....XPGATMES
  17 tap..KQ...VT.R.DTIIGDILDMD....QT.TAPYF....ME.IGM.HCLG....CPASRGET
  18 m....PR...IT.T.DTIIADVLRID....RG.TIPIF....LN.NGL.HCLG....CPSAQGES
  19 m....SK...IT.R.DMTMGYIVKEF....PQ.TVEVF....QR.YGM.GCLS....CPTAQLES
  20 mal..--...IT.K.DMTVGQVLRSY....PQ.TVQTF....LE.LGM.HCLG....CPSSTMES
  21 .....M-...IT.K.DMTVGQVLRSY....PQ.TVQTF....LE.LGM.HCLG....CPSSTMES
  22 m....EK...IT.K.DTLIGNALKIN....PN.SASIL....MS.FGM.GCLG....CPSSQMET
  23 vvp..LQ...IT.K.DLSIMDVLRAY....PQ.VRPVF....IR.HGM.GCLE....CMGAMDET
  24 .....M-...IT.K.DMVIQEIVTKY....PQ.TLPVF....GQ.FNM.GCLG....CSGALFET
  25 m....AE...FS.K.DTKIGELIDQF....PE.SAPIL....ME.IGM.HCLG....CPASQMET
  26 stsd.-E...IT.K.DTVIGDILKIN....PE.SASTL....ME.AGM.HCLG....CPASQMET
  27 .....MQ...IT.K.DMGIMDIVNKY....PQ.AVSVF....QA.YGM.GCIG....CMAARFET
  28 m....AK...VT.K.DMLIGQLITLD....PN.IAPIL....MR.AGM.HCLG....CPSSQMES
  29 mad..-K...IT.K.DMTFFAVMQAY....PQ.SLDVL....RK.HRL.GCVG....CMGAQNES
  30 tne..MA...IS.K.DMIIADLIALD....PN.YAAIL....MA.SGM.GCVG....CPSSQGES
  31 .....MT...IT.K.DSIIGDILDAY....GEvTAPFF....LE.MGM.HCLG....CPASRGET
  32 vqp..GK...IT.K.DSIIGQVIRDN....PR.TIAVF....RA.HGM.GCLG....CPSASGES
  33 msd..-K...IT.K.DMKFSEILNYG....QP.VVQVF....MK.YQM.GCLG....CAVAKFET
  34 .....M-...VT.K.DMTIGEVIQKN....PG.AAEIL....MS.FGM.GCVC....CPSALGET
  35 .....M-...IT.K.DMTIGEVVKND....SS.KAEVL....MS.FGM.GCVG....CPSAQAET
  36 m....AT...VT.K.DTIIGDILDMD....RT.TAPFF....LE.MGM.HCLG....CPASRGES
  37 m....AK...IT.K.DMIIKDIININ....MG.CIPIL....LN.EGM.HCVG....CPASQGET
  38 .....M-...IT.K.DMTIGEVIRKM....PT.AAEVL....MS.FGM.GCVG....CPSAQAET
  39 .....MK...IT.K.DMLIGDIIQIH....PD.AVEIL....FN.FGL.SCVG....CPASQMET
  40 m....AQ...IS.K.TMTISEILSVD....KV.VIPVL....MN.SGM.HCLG....CPSAQGET
  41 m....AQ...VT.K.DMTFAAVMRMH....PD.VVKVL....AK.YNL.GCIG....CMGAQNES
  42 .....MK...IT.K.DMTIGEIVRNH....EG.AAEVL....MS.FGM.GCVG....CPSAQSET
  43 .....M-...IT.K.DMTIGEVVSAD....QS.KAQVL....MS.FGM.GCVG....CPSAQAET
  44 .....MP...FG.S.DDLVDDIMRTA....PH.TIRVF....LA.FRL.ACVG....CPIATFHT
  45 .....MP...IR.H.DSVVDDLMRTQ....PA.TIRTF....LD.FRM.GCCG....CPIATFHT
  46 m....NT...IT.K.DMVIGDLLAID....EN.FAAIL....MA.SGM.HCVG....CPSSQGET
  47 ma...VN...IT.K.EMTMGELLSID....RG.VAVVL....MN.AGM.HCIG....CPSSIGES
  48 .....MK...IK.K.EMLIGQILSEK....PE.SIGTL....MS.FGM.GCIM....CPSSQMET
  49 sengv--...IT.K.DMIIADIVSED....AE.NTKIL....ME.FGM.HCIG....CPSSQMET
  50 .....M-...IT.K.DLTIGEIIRIK....EN.APQIL....MS.FGM.GCVG....CPSAQAET
  51 .....MT...IR.D.DLPVDEVMRSW....PA.TIRTF....LD.FRM.QCCG....CPIAAFHT
  52 m....SQ...VT.K.DMTFAAVMRMH....PD.VVKVL....AK.YNL.GCIG....CMGAQNES
  53 .....M-...LT.G.AEKITDVVEKY....PQ.SVEVF....QK.YGM.HCFG....CMAARFEN
  54 rrki.M-...IT.K.DMTVGEIIRIK....EN.AAEIL....MS.FGM.GCIG....CPSAQSES
  55 .....MEt..FT.K.NTTIGELLSVY....PE.CAPIL....ME.IGM.HCLG....CPSAQMET
  56 .....MS...ID.R.TLVVEDVMSRW....PA.TIRVF....LD.FKL.ACVG....CPIATFHT
  57 m....AQ...IT.K.DMTFGELLSKYystcPK.LVDDL....ME.AGM.GCIG....CPHSQMES
  58 .....M-...IS.K.EMTIGEIIRRY....PQ.TLPVF....EK.YGL.DCHD....CQIADFEA
  59 ms...QQ...FT.K.DMTFAQALQAN....PE.VAKVL....RK.YNL.GCIG....CMGAQNES
  60 m....KK...VT.E.DMTIAEVLKMD....RE.VAGIF....MK.YGL.HCLG....CPGATMES
  61 avr..QT...LH.D.DMTMDAIMREW....PA.TIRVV....LD.HGL.LCVG....CPIAPFHT
  62 .....M-...IT.K.DMIIGDIIRQH....PA.TVQVF....AR.HGL.ECYE....CQIADLET
  63 ear..MP...IS.F.DELVDDVMRRR....PE.TIRVF....LA.FQM.RCVG....CPIACFHN
  64 .....M-...IT.K.DMIIGDIIRKH....PR.TLTVF....VK.YGL.DCNE....CQIADYEE
  65 vmm..AQ...VS.R.DTTIGEALSMN....PG.IAPIL....QE.IGM.HCLG....CPASQGES
  66 md...-K...IN.K.DTTVGEVIRMN....PA.NAQKL....MN.FGM.GCVG....CPSAQSET
  67 mpp..PK...LD.DpDLPLDVLMTTW....PE.TVRVF....MD.HDM.LCVG....CMVSPFHS
  68 .....M-...IT.K.TMRIGDIIRTY....PQ.SLKIF....EK.YGL.DCYE....CQVADYEE
  69 .....M-...IT.R.DMIIADIIRKY....PE.TLPVF....KK.HRL.ECYE....CQISDLET
  70 ms...QQ...VT.K.DMTFAQVMRMH....QD.AVKVL....AK.YNL.GCVG....CMGAQNES
  71 .....MH...LD.P.DMTLEEIMRAW....PP.AISVI....LR.HHM.LCVG....CPITAFHT
  72 .....MK...YT.K.DSLVGEVLDND....ES.LARYF....LE.MGM.HCLG....CPSSRGET
  73 mpp..PK...LD.DpDLPLDVLMTTW....PE.TVRVF....MD.HDM.LCVG....CMVSPFHS
  74 m....AR...VT.K.EMTMGELLQTYyeqcPE.IVDVL....TG.LGM.HCIG....CPSSIGES
  75 hpq..PD...-D.P.DIPLIELMALW....PQ.TIPVF....VR.HRM.LCVG....CLVSPFHT
  76 m....PE...IDlS.TVTVGEWLRRW....PE.TVRVF....LN.YKM.NCPA....CPIAPFMT
  77 mt...QK...FT.K.DMTFAQALQTH....PG.VAGVL....RS.YNL.GCIG....CMGAQNES
  78 m....AK...IS.K.DMLINDILAVD....AG.NAAIL....MA.AGM.HCIG....CLAAAGET
  79 qat..AK...IT.K.DMTFLEMLRTY....PE.TAKVL....KK.YNL.ACAG....CMGAQSEP
  80 kked.-K...FH.R.DMLVGSIIGMD....PQ.AAQIL....SD.SGM.GCLG....CPASQSET
  81 m....AK...IS.K.DMLINDILAID....AG.NAAIL....MA.AGM.HCIG....CLAAAGES
  82 m....EK...VT.K.DMNIMEAVEKY....PI.IAQVL....MR.YGL.GCVG....CIISSAET
  83 asp..CE...ID.A.ATLVDDLMRQR....PQ.TIGVF....LR.RRL.YCVG....CPVGHFHT
  84 eke..VL...IT.K.KMSTGEVTKKY....PA.TKEVF....AKyFGK.GCFD....CPSFGTED
  85 .....M-...VT.G.DMNIMEAVEKY....PV.IVEVL....QR.NGL.GCVG....CMIASGET
  86 .....MA...LT.A.DSTIAELLREK....PE.SAQVL....FR.FGM.GCLG....CAIANNET
  87 etk..PK...IT.K.KTSIGDVIQNY....PE.TESVV....KKyFGA.GCYT....CPGSKTED
  88 .....M-...VT.G.DMNIMEAVEKY....PI.IVEVL....QR.NGL.GCVG....CMIASGET
  89 .....M-...VT.G.DMNIMEAVEKY....PV.IVEVL....QR.NGL.GCVG....CMIASGET
  90 m....AD...LT.A.DSTIYDLLQAK....PE.ATEAL....FK.FGM.GCVG....CAIARGET
  91 .....--...--.-.-MTISEILRRY....PE.TLPVF....ER.HHL.DCYD....CQLADFEQ
  92 .....--...--.-.-------MRRK....PE.TIRVF....LA.FQM.RCVG....CPIACFHN
  93 .....--...--.-.-MTISEILRRY....PE.TLPVF....ER.HHL.DCYD....CQLADFEQ
  94 vvk..PR...FY.K.EMTVGEAMAVH....PE.AGLVF....SS.YHLgGCSH....CSINELET
  95 mr...PD...LD.DpDLPLSRLFDRW....PA.TAAVF....LT.RRM.LCPG....CPIAPFHT
  96 vvk..PR...FY.K.EMTVGEAMAVH....PE.AGLVF....SS.YHLgGCSH....CSINELET
  97 .....MA...LS.K.DSTILEVLQEK....PD.AGAIF....AR.FGM.GCVG....CAISRGET
  98 .....MK...FT.L.EMKLKDIMAAN....PK.TVEAM....QE.LGL.HCLG....CPFSVNET
  99 .....MA...IT.L.DSTIADLLREK....PE.SAATL....QS.FGM.GCLG....CAIANNET
 100 .....MK...LD.S.KMTVGELVTRH....PS.VMEVF....IK.RRM.PCVG....CPTERFHT
 101 .....MKkhiIN.G.EMKIWDVIQDY....PE.TYGIF....RQ.FGY.PDIRkgdtAVTSHFMK
 102 vfk..MK...FT.L.EMKLKDIMAAN....PK.TVEAM....QE.LGL.HCLG....CPFSVNET
 103 kpd..PD...-D.P.DLPLARLLQTW....PA.SAGVF....LE.RRM.LCPG....CPIAPFHT
 104 kpd..PD...-D.P.DLPLARLFQTW....PA.SAGVF....LE.RRM.LCPG....CPIAPFHT
 105 stk..PR...FF.K.EMTVGEAIAIH....PE.AGLVF....SS.YHLgGCSH....CSINEVET
 106 prr..PR...FD.DpDLPLSTLFGEW....PD.MVEVF....LA.KQM.LCPG....CPVAPFHA
 107 kaa..TE...IS.R.SMTIEDILGMF....PY.KAQKLsqeiTN.AGL.HCVG....CHAAVWET
 108 ms...M-...FD.K.TTKMAAVLKGH....PK.AKEVL....ES.FGL.QCST....CSGAKHES
 109 genkv--...IT.K.DMIINDVIQKY....SK.TIGIF....KD.FGV.D--S....CCGGGF-S
 110 m....PV...IT.K.EMSIIEVVQKY....PE.TVEVF....RK.YGM.GCFG....--------


               50          60           
               |           |           
   1 IEDACAVHG.ID..ADKLVKELNEYFEKKEV...
   2 IEDACAVHG.ID..ADKLVKELNEYFEKKEV...
   3 VEQACMVHG.VD..VDALLAELNKMTAGAAQ...
   4 LEQAAMVHG.MD..IEKLLEALNKAI-----...
   5 LEQAAMVHG.MD..IEKLLEALNKAI-----...
   6 IEQGARAHG.IN..IDELIADLNKVVAEQAQs..
   7 VEQAAMVHG.AD..ADKLLEELNKVFENEE-...
   8 LEEACMVHG.ID..VDELVAKLNAFEEAK--...
   9 IEEACSVHG.MD..VNELVEALNKEAK----...
  10 IEQGALAHG.ID..VDGLIADLNKVANKAE-...
  11 IGQGARAHG.ID..VDKLIEELNKVVGKDDDacg
  12 IEDACAIHG.ID..ADQLIDNLNKYLENK--...
  13 LEQACEVHG.QD..VEDILAKLNK-------...
  14 IEQGAMAHG.IN..VDELMKELNDAIKE---...
  15 LEQAAAVHG.IN..IEQLLEKLNA-------...
  16 ISDAGNVHG.ID..VDKLVDDLNKFFEEKGN...
  17 IEEACEVHG.VN..CDELLEKLNTHLAAKKA...
  18 IEEACALHG.ID..AQKLVDELNEYLKSKGLld.
  19 LEKGAMLHG.LD..VQELLEELNKVVQ----...
  20 IEGAALTHG.KK..PDELVEKLNKVIAAN--...
  21 IEGAALTHG.KK..PDELVEKLNKVIAAN--...
  22 IEQAAAVHG.ID..AEALLEKLNA-------...
  23 IASGARMHG.LD..LDQLLKDLNEAIKNRDQe..
  24 LEQGALAHG.ID..VDAMLKALNDLIKK---...
  25 LEEAAMVHG.ID..CGLLVEKINAAAKAMGK...
  26 LEEACSVHG.ID..VEELLNKLNA-------...
  27 LEEGANAHG.IN..VDDLVDDLNENI-----...
  28 LEEAAMVHG.MD..ADVLVQQINDFLGE---...
  29 LEQGANAHG.ID..VNALLKDLNDAVA----...
  30 IEQAAYVHG.MD..LDELLGRLNEYAQTKEA...
  31 VAQACDVHG.VD..ADELVKKLNEAVGN---...
  32 VEKAAGIHG.ID..LEELLSELNKV------...
  33 LEQGANAHG.VD..VDALLKDLNAAIDND--...
  34 IEEAAMVHG.ID..ADEIIKSLNYSKEENN-...
  35 IEEAAMVHG.IN..LDELIEALNK-------...
  36 LEQACLVHN.VD..PDELVEKLNEHLAGK--...
  37 LEEACIVHG.LD..ADVLAKKLNDFVVSVDGe..
  38 LEEAAIVHG.IN..LDDLIEAINNIEY----...
  39 LEEATMVHG.LN..LDLLLDVLNENNT----...
  40 LEEACMHHG.LN..ADELETQINDALAGI--...
  41 LEQGCAAHG.IN..VDEIVADINKLF-----...
  42 LAEAAMVHG.ME..LDALLEALNK-------...
  43 IAEAATVHG.LN..LDDLLEALNR-------...
  44 VEDACREHG.ID..RDKFLAALCDCVPA---...
  45 VDDACREHD.VD..RDVFLVALRDAMADQDSpga
  46 LEEAAFVHG.MN..VNELLGRLNEYMETKQA...
  47 LEEACMVHG.IE..VDELLKNINEYFANK--...
  48 LEEAAMVHG.ID..PNTIVAALNEDHKEEAEa..
  49 LEDACAVHG.LN..VEELIKKLNK-------...
  50 IEDAVKVHG.IN..LEELLEQLNK-------...
  51 MKDACREHG.VD..RDSFVAALEATIAG---...
  52 LEQGCAAHG.IS..VDEIVADINKLF-----...
  53 VEQGAMAHG.ID..VPSLIKDLNKAIGNQS-...
  54 LEDAANVHG.LN..LDDLLKALN--------...
  55 LGEAAMVHG.ID..ADLLVEKINAARAAK--...
  56 IEDSCHEHG.IA..EAPFLAALRKAVAKSQEvls
  57 IEEGAMGHG.ID..PDLLVAKLNATLEASQA...
  58 VEHGASVHK.VD..IGRLMEDLNRIINA---...
  59 LEQGCSAHG.LD..VNEVLKDLNAIGQ----...
  60 ISDAGNVHG.ID..VSLLIADLNKHFESN--...
  61 IIDAAREHD.LD..PASLARDLKRAVAEEDTgts
  62 LEHGAGHHK.LD..IEALLEELNRTVITP--...
  63 VADACREHG.VD..ADTFLSALCACT-----...
  64 LEHGAGVHK.VN..IEQLLSELNEHIGSGTE...
  65 LAEAAMVHG.ID..AELLVEKINAFLNA---...
  66 LREASLVHG.ID..LDRLIKALSEDKN----...
  67 VSEACAEYH.LD..EEVFRAALAEAVEAAHRrwg
  68 LEHGAGVHK.TD..LEKLLKELNELIQS---...
  69 LEHGAEVHR.VG..IDGLLEELNRSIA----...
  70 LEQGCGAHG.LN..VDDVVRDLNALF-----...
  71 VNDACREHM.ID..EGAFLEELRAAIAAVEGaii
  72 IEQACEVHG.AD..CARLLEQLNGTA-----...
  73 VSEACAEYH.LD..EVVFRAALADAVEAAHRrwg
  74 LADAAYVHG.ID..SDLLVEKLNATINAKLGe..
  75 VTDACAEYD.LD..EGEFLAELKMAIGMA--...
  76 IDEAASEYR.VD..ANLLKRDLMQMLKERAPqer
  77 LEQGANAHG.LN..VEDILRDLNALA-----...
  78 LEEAAAVHG.LD..AAELEVEINDYLAKKEEqqa
  79 IDLGAINHG.LD..PEQLLADLNAAVK----...
  80 LADACLVHG.LD..VEEILKQLNQ-------...
  81 LEEAAAVHG.LD..AVELEQEINDYLAKKEAe..
  82 LGEGIAVHG.LN..PDIIIEEVNMILEKQEE...
  83 IEEAAREHG.LE..PKALLAELRFIPCL---...
  84 INLACMMHN.TD..VDKFVQELNEAAYKEINkt.
  85 LAEGIEAHG.LD..TKAILAEINSLIKE---...
  86 IREAAQAHG.IP..LEEMLSALGVAE-----...
  87 IAFGATMHN.VD..PEVIIKELNEIIEKHK-s..
  88 LAEGIEAHG.LD..AKAILDEINSLIKE---...
  89 LAEGIEAHG.LD..TKAILDEINSLIKE---...
  90 IREAAEAHG.IP..LAELLNALG--IKE---...
  91 LEHGATVHK.ID..VESLLCELNCSIKK---...
  92 VADACREHG.VD..PDLFLSALSAAT-----...
  93 LEHGATVHK.ID..VESLLCELNCNIKK---...
  94 IEQVCMGYG.VE..VDVLVESLNNLLEDSED...
  95 VVEACAEYG.LD..EDEFRRALRLLAGI---...
  96 IEQVCMGYG.VE..VDVLIESLNNLLEDSQD...
  97 VAEAAAAHG.IP..LEELMSALGISA-----...
  98 LLNAAQMHK.LD..PEKLLEAVNSVEQGEMSeaa
  99 IREAAMVHG.IP..LEELAKKLGL-------...
 100 IEDIARING.IV..LEHLLKDLLDAIGVGEEt..
 101 LRTAAHAYH.ID..LDKLLEALNDAIAGHDRgac
 102 LLNAAQMHK.LD..PEKLLEAVNSVEQGEMSeaa
 103 VIEACAEYG.LD..EGEVRRALRLVVMP---...
 104 VIEACAEYG.LD..EGEVRRALRLVVMP---...
 105 IEQVCMGYG.VE..VDTLIDSLNNLFAEE--...
 106 ITDACEEYE.LD..EEVFRAELRRAARL---...
 107 LEAGMMTHGkTDaqIDELVRRLNALLQEPVDqss
 108 IELGATNHG.LD..VNELLTHLNALFDEPPGk..
 109 IEKTAAMSG.GD..MEKLLEKLNKAIDE---...
 110 ---------.--..-----------------...