Q8NI27: THO complex subunit 2

General Information

Protein names	- THO complex subunit 2 - Tho2 - hTREX120
Gene names	THOC2
Organism	Homo sapiens
Protease Family
Protease ID
Chromosome location
UniProt ID	Q8NI27

7 N-termini

5 C-termini

3 Cleavages

0 Substrates

Sequence

        10         20         30         40         50         60
MAAAAVVVPA EWIKNWEKSG RGEFLHLCRI LSENKSHDSS TYRDFQQALY ELSYHVIKGN
        70         80         90        100        110        120
LKHEQASNVL SDISEFREDM PSILADVFCI LDIETNCLEE KSKRDYFTQL VLACLYLVSD
       130        140        150        160        170        180
TVLKERLDPE TLESLGLIKQ SQQFNQKSVK IKTKLFYKQQ KFNLLREENE GYAKLIAELG
       190        200        210        220        230        240
QDLSGSITSD LILENIKSLI GCFNLDPNRV LDVILEVFEC RPEHDDFFIS LLESYMSMCE
       250        260        270        280        290        300
PQTLCHILGF KFKFYQEPNG ETPSSLYRVA AVLLQFNLID LDDLYVHLLP ADNCIMDEHK
       310        320        330        340        350        360
REIAEAKQIV RKLTMVVLSS EKMDEREKEK EKEEEKVEKP PDNQKLGLLE ALLKIGDWQH
       370        380        390        400        410        420
AQNIMDQMPP YYAASHKLIA LAICKLIHIT IEPLYRRVGV PKGAKGSPVN ALQNKRAPKQ
       430        440        450        460        470        480
AESFEDLRRD VFNMFCYLGP HLSHDPILFA KVVRIGKSFM KEFQSDGSKQ EDKEKTEVIL
       490        500        510        520        530        540
SCLLSITDQV LLPSLSLMDC NACMSEELWG MFKTFPYQHR YRLYGQWKNE TYNSHPLLVK
       550        560        570        580        590        600
VKAQTIDRAK YIMKRLTKEN VKPSGRQIGK LSHSNPTILF DYILSQIQKY DNLITPVVDS
       610        620        630        640        650        660
LKYLTSLNYD VLAYCIIEAL ANPEKERMKH DDTTISSWLQ SLASFCGAVF RKYPIDLAGL
       670        680        690        700        710        720
LQYVANQLKA GKSFDLLILK EVVQKMAGIE ITEEMTMEQL EAMTGGEQLK AEGGYFGQIR
       730        740        750        760        770        780
NTKKSSQRLK DALLDHDLAL PLCLLMAQQR NGVIFQEGGE KHLKLVGKLY DQCHDTLVQF
       790        800        810        820        830        840
GGFLASNLST EDYIKRVPSI DVLCNEFHTP HDAAFFLSRP MYAHHISSKY DELKKSEKGS
       850        860        870        880        890        900
KQQHKVHKYI TSCEMVMAPV HEAVVSLHVS KVWDDISPQF YATFWSLTMY DLAVPHTSYE
       910        920        930        940        950        960
REVNKLKVQM KAIDDNQEMP PNKKKKEKER CTALQDKLLE EEKKQMEHVQ RVLQRLKLEK
       970        980        990       1000       1010       1020
DNWLLAKSTK NETITKFLQL CIFPRCIFSA IDAVYCARFV ELVHQQKTPN FSTLLCYDRV
      1030       1040       1050       1060       1070       1080
FSDIIYTVAS CTENEASRYG RFLCCMLETV TRWHSDRATY EKECGNYPGF LTILRATGFD
      1090       1100       1110       1120       1130       1140
GGNKADQLDY ENFRHVVHKW HYKLTKASVH CLETGEYTHI RNILIVLTKI LPWYPKVLNL
      1150       1160       1170       1180       1190       1200
GQALERRVHK ICQEEKEKRP DLYALAMGYS GQLKSRKSYM IPENEFHHKD PPPRNAVASV
      1210       1220       1230       1240       1250       1260
QNGPGGGPSS SSIGSASKSD ESSTEETDKS RERSQCGVKA VNKASSTTPK GNSSNGNSGS
      1270       1280       1290       1300       1310       1320
NSNKAVKEND KEKGKEKEKE KKEKTPATTP EARVLGKDGK EKPKEERPNK DEKARETKER
      1330       1340       1350       1360       1370       1380
TPKSDKEKEK FKKEEKAKDE KFKTTVPNAE SKSTQERERE KEPSRERDIA KEMKSKENVK
      1390       1400       1410       1420       1430       1440
GGEKTPVSGS LKSPVPRSDI PEPEREQKRR KIDTHPSPSH SSTVKDSLIE LKESSAKLYI
      1450       1460       1470       1480       1490       1500
NHTPPPLSKS KEREMDKKDL DKSRERSRER EKKDEKDRKE RKRDHSNNDR EVPPDLTKRR
      1510       1520       1530       1540       1550       1560
KEENGTMGVS KHKSESPCES PYPNEKDKEK NKSKSSGKEK GSDSFKSEKM DKISSGGKKE
      1570       1580       1590
SRHDKEKIEK KEKRDSSGGK EEKKHHKSSD KHR

Isoforms

- Isoform 2 of THO complex subunit 2

Sequence View

        10         20         30         40         50         60
MAAAAVVVPA EWIKNWEKSG RGEFLHLCRI LSENKSHDSS TYRDFQQALY ELSYHVIKGN
        70         80         90        100        110        120
LKHEQASNVL SDISEFREDM PSILADVFCI LDIETNCLEE KSKRDYFTQL VLACLYLVSD
       130        140        150        160        170        180
TVLKERLDPE TLESLGLIKQ SQQFNQKSVK IKTKLFYKQQ KFNLLREENE GYAKLIAELG
       190        200        210        220        230        240
QDLSGSITSD LILENIKSLI GCFNLDPNRV LDVILEVFEC RPEHDDFFIS LLESYMSMCE
       250        260        270        280        290        300
PQTLCHILGF KFKFYQEPNG ETPSSLYRVA AVLLQFNLID LDDLYVHLLP ADNCIMDEHK
       310        320        330        340        350        360
REIAEAKQIV RKLTMVVLSS EKMDEREKEK EKEEEKVEKP PDNQKLGLLE ALLKIGDWQH
       370        380        390        400        410        420
AQNIMDQMPP YYAASHKLIA LAICKLIHIT IEPLYRRVGV PKGAKGSPVN ALQNKRAPKQ
       430        440        450        460        470        480
AESFEDLRRD VFNMFCYLGP HLSHDPILFA KVVRIGKSFM KEFQSDGSKQ EDKEKTEVIL
       490        500        510        520        530        540
SCLLSITDQV LLPSLSLMDC NACMSEELWG MFKTFPYQHR YRLYGQWKNE TYNSHPLLVK
       550        560        570        580        590        600
VKAQTIDRAK YIMKRLTKEN VKPSGRQIGK LSHSNPTILF DYILSQIQKY DNLITPVVDS
       610        620        630        640        650        660
LKYLTSLNYD VLAYCIIEAL ANPEKERMKH DDTTISSWLQ SLASFCGAVF RKYPIDLAGL
       670        680        690        700        710        720
LQYVANQLKA GKSFDLLILK EVVQKMAGIE ITEEMTMEQL EAMTGGEQLK AEGGYFGQIR
       730        740        750        760        770        780
NTKKSSQRLK DALLDHDLAL PLCLLMAQQR NGVIFQEGGE KHLKLVGKLY DQCHDTLVQF
       790        800        810        820        830        840
GGFLASNLST EDYIKRVPSI DVLCNEFHTP HDAAFFLSRP MYAHHISSKY DELKKSEKGS
       850        860        870        880        890        900
KQQHKVHKYI TSCEMVMAPV HEAVVSLHVS KVWDDISPQF YATFWSLTMY DLAVPHTSYE
       910        920        930        940        950        960
REVNKLKVQM KAIDDNQEMP PNKKKKEKER CTALQDKLLE EEKKQMEHVQ RVLQRLKLEK
       970        980        990       1000       1010       1020
DNWLLAKSTK NETITKFLQL CIFPRCIFSA IDAVYCARFV ELVHQQKTPN FSTLLCYDRV
      1030       1040       1050       1060       1070       1080
FSDIIYTVAS CTENEASRYG RFLCCMLETV TRWHSDRATY EKECGNYPGF LTILRATGFD
      1090       1100       1110       1120       1130       1140
GGNKADQLDY ENFRHVVHKW HYKLTKASVH CLETGEYTHI RNILIVLTKI LPWYPKVLNL
      1150       1160       1170       1180       1190       1200
GQALERRVHK ICQEEKEKRP DLYALAMGYS GQLKSRKSYM IPENEFHHKD PPPRNAVASV
      1210       1220       1230       1240       1250       1260
QNGPGGGPSS SSIGSASKSD ESSTEETDKS RERSQCGVKA VNKASSTTPK GNSSNGNSGS
      1270       1280       1290       1300       1310       1320
NSNKAVKEND KEKGKEKEKE KKEKTPATTP EARVLGKDGK EKPKEERPNK DEKARETKER
      1330       1340       1350       1360       1370       1380
TPKSDKEKEK FKKEEKAKDE KFKTTVPNAE SKSTQERERE KEPSRERDIA KEMKSKENVK
      1390       1400       1410       1420       1430       1440
GGEKTPVSGS LKSPVPRSDI PEPEREQKRR KIDTHPSPSH SSTVKDSLIE LKESSAKLYI
      1450       1460       1470       1480       1490       1500
NHTPPPLSKS KEREMDKKDL DKSRERSRER EKKDEKDRKE RKRDHSNNDR EVPPDLTKRR
      1510       1520       1530       1540       1550       1560
KEENGTMGVS KHKSESPCES PYPNEKDKEK NKSKSSGKEK GSDSFKSEKM DKISSGGKKE
      1570       1580       1590
SRHDKEKIEK KEKRDSSGGK EEKKHHKSSD KHR

Name	Sequence	Position	Evidence type	Method	Source (database)	Evidence name
Q8NI27-1-unknown	MAAAAV...	1	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
Q8NI27-534-unknown	SHPLLV...	534	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC6592
Q8NI27-911-unknown	KAIDDN...	911	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC14778
Q8NI27-1180-unknown	MIPENE...	1180	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt92115
Q8NI27-1217-unknown	SKSDES...	1217	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC12918
Q8NI27-1217-unknown	SKSDES...	1217	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt138179
Q8NI27-1412-unknown	IDTHPS...	1412	inferred from electronic annotation	unknown	Ensembl	inferred from ensembl protein ENSP00000415244
Q8NI27-1412-unknown	IDTHPS...	1412	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt200690
Q8NI27-1508-unknown	GVSKHK...	1508	inferred from electronic annotation	unknown	Ensembl	inferred from ensembl protein ENSP00000402168
Q8NI27-1508-unknown	GVSKHK...	1508	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt200729

Sequence	Position	Evidence type	Method	Source (database)	Evidence name
...NETYNS	533	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC6592
...LKVQMK	910	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC14778
...SIGSAS	1216	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC12918
...SIGSAS	1216	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt121207
...EKKEKT	1284	inferred from electronic annotation	unknown	Ensembl	inferred from ensembl protein ENSP00000416639
...SDKHR	1593	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
...SDKHR	1593	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt87733

Protease	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)
CATL1_HUMAN	533	TYNS.\|.SHPL	inferred from experiment	unknown	MEROPS	Schilling O	Biniossek ML et al.:Proteomic identification of pro... (C01.060)	21967108,
GRAM_HUMAN	910	VQMK.\|.KAID	inferred from experiment	unknown	MEROPS	Bovenschen N	de Poot SA et al.:Human and mouse granzyme M disp... (S01.139)	21564021,
GRAB_HUMAN	1216	GSAS.\|.SKSD	inferred from experiment	unknown	MEROPS	Gevaert K	Van Damme P et al.:Complementary positional proteo... (M14.017)	20526345,

TopFIND

Q8NI27: THO complex subunit 2

General Information

7

N-termini

5

C-termini

3

Cleavages

0

Substrates

Sequence

Isoforms

Filter Information:

Directness:

Physiological Relevance:

Evidence Codes:

Methodology:

Perturbation of System:

Biological System:

Protease Assignment Confidence:

Evidence Names:

Database:

Lab:

Protein Neighborhood

Domains & Features

7 N-termini - 5 C-termini - 3 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

Substrates