TopFIND 4.0

O13535: Transposon Ty1-H Gag-Pol polyprotein

General Information

Protein names
- Transposon Ty1-H Gag-Pol polyprotein
- Gag-Pol-p199
- TY1A-TY1B
- Transposon Ty1 TYA-TYB polyprotein
- p190
- Capsid protein
- CA
- Gag-p45
- p54
- Ty1 protease
- PR
- 3.4.23.-
- Pol-p20
- p23
- Integrase
- IN
- Pol-p71
- p84
- p90
- Reverse transcriptase/ribonuclease H
- RT
- RT-RH
- 2.7.7.49
- 2.7.7.7
- 3.1.26.4
- Pol-p63
- p60

Gene names TY1B-H
Organism Saccharomyces cerevisiae
Protease Family
Protease ID
Chromosome location
UniProt ID O13535

4

N-termini

4

C-termini

0

Cleavages

0

Substrates

Sequence

        10         20         30         40         50         60 
MESQQLSNYP HISHGSACAS VTSKEVHTNQ DPLDVSASKI QEYDKASTKA NSQQTTTPAS 
        70         80         90        100        110        120 
SAVPENLHHA SPQPASVPPP QNGPYPQQCM MTQNQANPSG WSFYGHPSMI PYTPYQMSPM 
       130        140        150        160        170        180 
YFPPGPQSQF PQYPSSVGTP LSTPSPESGN TFTDSSSADS DMTSTKKYVR PPPMLTSPND 
       190        200        210        220        230        240 
FPNWVKTYIK FLQNSNLGGI IPTVNGKPVP PMLTSPNDFP NWVKTYIKFL QNSNLGGIIP 
       250        260        270        280        290        300 
TVNGKPVRQI TDDELTFLYN TFQIFAPSQF LPTWVKDILS VDYTDIMKIL SKSIEKMQSD 
       310        320        330        340        350        360 
TQEANDIVTL ANLQYNGSTP ADAFETKVTN IIDRLNNNGI HINNKVACQL IMRGLSGEYK 
       370        380        390        400        410        420 
FLRYTRHRHL NMTVAELFLD IHAIYEEQQG SRNSKPNYRR NPSDEKNDSR SYTNTTKPKV 
       430        440        450        460        470        480 
IARNPQKTNN SKSKTARAHN VSTSNNSPST DNDSISKSTT EPIQLNNKHD LHLGQKLTES 
       490        500        510        520        530        540 
TVNHTNHSDD ELPGHLLLDS GASRTLIRSA HHIHSASSNP DINVVDAQKR NIPINAIGDL 
       550        560        570        580        590        600 
QFHFQDNTKT SIKVLHTPNI AYDLLSLNEL AAVDITACFT KNVLERSDGT VLAPIVKYGD 
       610        620        630        640        650        660 
FYWVSKKYLL PSNISVPTIN NVHTSESTRK YPYPFIHRML AHANAQTIRY SLKNNTITYF 
       670        680        690        700        710        720 
NESDVDWSSA IDYQCPDCLI GKSTKHRHIK GSRLKYQNSY EPFQYLHTDI FGPVHNLPKS 
       730        740        750        760        770        780 
APSYFISFTD ETTKFRWVYP LHDRREDSIL DVFTTILAFI KNQFQASVLV IQMDRGSEYT 
       790        800        810        820        830        840 
NRTLHKFLEK NGITPCYTTT ADSRAHGVAE RLNRTLLDDC RTQLQCSGLP NHLWFSAIEF 
       850        860        870        880        890        900 
STIVRNSLAS PKSKKSARQH AGLAGLDIST LLPFGQPVIV NDHNPNSKIH PRGIPGYALH 
       910        920        930        940        950        960 
PSRNSYGYII YLPSLKKTVD TTNYVILQGK ESRLDQFNYD ALTFDEDLNR LTASYHSFIA 
       970        980        990       1000       1010       1020 
SNEIQQSNDL NIESDHDFQS DIELHPEQLR NVLSKAVSPT DSTPPSTHTE DSKRVSKTNI 
      1030       1040       1050       1060       1070       1080 
RAPREVDPNI SESNILPSKK RSSTPQISDI ESTGSGGMHR LDVPLLAPMS QSNTHESSHA 
      1090       1100       1110       1120       1130       1140 
SKSKDFRHSD SYSDNETNHT NVPISSTGGT NNKTVPQTSE QETEKRIIHR SPSIDTSSSE 
      1150       1160       1170       1180       1190       1200 
SNSLHHVVPI KTSDTCPKEN TEESIIADLP LPDLPPEPPT ELSDSFKELP PINSHQTNSS 
      1210       1220       1230       1240       1250       1260 
LGGIGDSNAY TTINSKKRSL EDNETEIKVS RDTWNTKNMR SLEPPRSKKR IHLIAAVKAV 
      1270       1280       1290       1300       1310       1320 
KSIKPIRTTL RYDEAITYNK DIKEKEKYIQ AYHKEVNQLL MMKTWDTDRY YDRKEIDPKR 
      1330       1340       1350       1360       1370       1380 
VINSMFIFNR KRDGTHKARF VARGDIQHPD TYDPGMQSNT VHHYALMTSL SLALDNNYYI 
      1390       1400       1410       1420       1430       1440 
TQLDISSAYL YADIKEELYI RPPPHLGMND KLIRLKKSLY GLKQSGANWY ETIKSYLIKQ 
      1450       1460       1470       1480       1490       1500 
CGMEEVRGWS CVFKNSQVTI CLFVDDMILF SKDLNANKKI ITTLKKQYDT KIINLGESDN 
      1510       1520       1530       1540       1550       1560 
EIQYDILGLE IKYQRGKYMK LGMENSLTEK IPKLNVPLNP KGRKLSAPGQ PGLYIDQDEL 
      1570       1580       1590       1600       1610       1620 
EIDEDEYKEK VHEMQKLIGL ASYVGYKFRF DLLYYINTLA QHILFPSRQV LDMTYELIQF 
      1630       1640       1650       1660       1670       1680 
MWDTRDKQLI WHKNKPTEPD NKLVAISDAS YGNQPYYKSQ IGNIYLLNGK VIGGKSTKAS 
      1690       1700       1710       1720       1730       1740 
LTCTSTTEAE IHAISESVPL LNNLSHLVQE LNKKPITKGL LTDSKSTISI IISNNEEKFR 
      1750       1760       1770       1780       1790    
NRFFGTKAMR LRDEVSGNHL HVCYIETKKN IADVMTKPLP IKTFKLLTNK WIH

Isoforms



Sequence View



Filter Information:


(REFRESH)

Directness:


Physiological Relevance:


Evidence Codes:


Methodology:


Perturbation of System:


Biological System:


Protease Assignment Confidence:


Evidence Names:


Database:


Lab:



Protein Neighborhood

Domains & Features

4 N-termini - 4 C-termini - 0 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

    Protease Position Sequence Evidence type Method Source (database) Source (Lab) Evidence name Publications (PMIDs)

Substrates

    Substrate Position Sequence Evidence type Method Source (database) Source (Lab) Evidence name Publications (PMIDs)