TopFIND 4.0

Q96T58: Msx2-interacting protein

General Information

Protein names
- Msx2-interacting protein
- SMART/HDAC1-associated repressor protein
- SPEN homolog

Gene names SPEN
Organism Homo sapiens
Protease Family
Protease ID
Chromosome location
UniProt ID Q96T58

6

N-termini

3

C-termini

0

Cleavages

0

Substrates

Sequence

        10         20         30         40         50         60 
MVRETRHLWV GNLPENVREE KIIEHFKRYG RVESVKILPK RGSEGGVAAF VDFVDIKSAQ 
        70         80         90        100        110        120 
KAHNSVNKMG DRDLRTDYNE PGTIPSAARG LDDTVSIASR SREVSGFRGG GGGPAYGPPP 
       130        140        150        160        170        180 
SLHAREGRYE RRLDGASDNR ERAYEHSAYG HHERGTGGFD RTRHYDQDYY RDPRERTLQH 
       190        200        210        220        230        240 
GLYYASRSRS PNRFDAHDPR YEPRAREQFT LPSVVHRDIY RDDITREVRG RRPERNYQHS 
       250        260        270        280        290        300 
RSRSPHSSQS RNQSPQRLAS QASRPTRSPS GSGSRSRSSS SDSISSSSST SSDSSDSSSS 
       310        320        330        340        350        360 
SSDDSPARSV QSAAVPAPTS QLLSSLEKDE PRKSFGIKVQ NLPVRSTDTS LKDGLFHEFK 
       370        380        390        400        410        420 
KFGKVTSVQI HGTSEERYGL VFFRQQEDQE KALTASKGKL FFGMQIEVTA WIGPETESEN 
       430        440        450        460        470        480 
EFRPLDERID EFHPKATRTL FIGNLEKTTT YHDLRNIFQR FGEIVDIDIK KVNGVPQYAF 
       490        500        510        520        530        540 
LQYCDIASVC KAIKKMDGEY LGNNRLKLGF GKSMPTNCVW LDGLSSNVSD QYLTRHFCRY 
       550        560        570        580        590        600 
GPVVKVVFDR LKGMALVLYN EIEYAQAAVK ETKGRKIGGN KIKVDFANRE SQLAFYHCME 
       610        620        630        640        650        660 
KSGQDIRDFY EMLAERREER RASYDYNQDR TYYESVRTPG TYPEDSRRDY PARGREFYSE 
       670        680        690        700        710        720 
WETYQGDYYE SRYYDDPREY RDYRNDPYEQ DIREYSYRQR ERERERERFE SDRDRDHERR 
       730        740        750        760        770        780 
PIERSQSPVH LRRPQSPGAS PSQAERLPSD SERRLYSRSS DRSGSCSSLS PPRYEKLDKS 
       790        800        810        820        830        840 
RLERYTKNEK TDKERTFDPE RVERERRLIR KEKVEKDKTD KQKRKGKVHS PSSQSSETDQ 
       850        860        870        880        890        900 
ENEREQSPEK PRSCNKLSRE KADKEGIAKN RLELMPCVVL TRVKEKEGKV IDHTPVEKLK 
       910        920        930        940        950        960 
AKLDNDTVKS SALDQKLQVS QTEPAKSDLS KLESVRMKVP KEKGLSSHVE VVEKEGRLKA 
       970        980        990       1000       1010       1020 
RKHLKPEQPA DGVSAVDLEK LEARKRRFAD SNLKAEKQKP EVKKSSPEME DARVLSKKQP 
      1030       1040       1050       1060       1070       1080 
DVSSREVILL REGEAERKPV RKEILKRESK KIKLDRLNTV ASPKDCQELA SISVGSGSRP 
      1090       1100       1110       1120       1130       1140 
SSDLQARLGE LAGESVENQE VQSKKPIPSK PQLKQLQVLD DQGPEREDVR KNYCSLRDET 
      1150       1160       1170       1180       1190       1200 
PERKSGQEKS HSVNTEEKIG IDIDHTQSYR KQMEQSRRKQ QMEMEIAKSE KFGSPKKDVD 
      1210       1220       1230       1240       1250       1260 
EYERRSLVHE VGKPPQDVTD DSPPSKKKRM DHVDFDICTK RERNYRSSRQ ISEDSERTGG 
      1270       1280       1290       1300       1310       1320 
SPSVRHGSFH EDEDPIGSPR LLSVKGSPKV DEKVLPYSNI TVREESLKFN PYDSSRREQM 
      1330       1340       1350       1360       1370       1380 
ADMAKIKLSV LNSEDELNRW DSQMKQDAGR FDVSFPNSII KRDSLRKRSV RDLEPGEVPS 
      1390       1400       1410       1420       1430       1440 
DSDEDGEHKS HSPRASALYE SSRLSFLLRD REDKLRERDE RLSSSLERNK FYSFALDKTI 
      1450       1460       1470       1480       1490       1500 
TPDTKALLER AKSLSSSREE NWSFLDWDSR FANFRNNKDK EKVDSAPRPI PSWYMKKKKI 
      1510       1520       1530       1540       1550       1560 
RTDSEGKMDD KKEDHKEEEQ ERQELFASRF LHSSIFEQDS KRLQHLERKE EDSDFISGRI 
      1570       1580       1590       1600       1610       1620 
YGKQTSEGAN STTDSIQEPV VLFHSRFMEL TRMQQKEKEK DQKPKEVEKQ EDTENHPKTP 
      1630       1640       1650       1660       1670       1680 
ESAPENKDSE LKTPPSVGPP SVTVVTLESA PSALEKTTGD KTVEAPLVTE EKTVEPATVS 
      1690       1700       1710       1720       1730       1740 
EEAKPASEPA PAPVEQLEQV DLPPGADPDK EAAMMPAGVE EGSSGDQPPY LDAKPPTPGA 
      1750       1760       1770       1780       1790       1800 
SFSQAESNVD PEPDSTQPLS KPAQKSEEAN EPKAEKPDAT ADAEPDANQK AEAAPESQPP 
      1810       1820       1830       1840       1850       1860 
ASEDLEVDPP VAAKDKKPNK SKRSKTPVQA AAVSIVEKPV TRKSERIDRE KLKRSNSPRG 
      1870       1880       1890       1900       1910       1920 
EAQKLLELKM EAEKITRTAS KNSAADLEHP EPSLPLSRTR RRNVRSVYAT MGDHENRSPV 
      1930       1940       1950       1960       1970       1980 
KEPVEQPRVT RKRLERELQE AAAVPTTPRR GRPPKTRRRA DEEEENEAKE PAETLKPPEG 
      1990       2000       2010       2020       2030       2040 
WRSPRSQKTA AGGGPQGKKG KNEPKVDATR PEATTEVGPQ IGVKESSMEP KAAEEEAGSE 
      2050       2060       2070       2080       2090       2100 
QKRDRKDAGT DKNPPETAPV EVVEKKPAPE KNSKSKRGRS RNSRLAVDKS ASLKNVDAAV 
      2110       2120       2130       2140       2150       2160 
SPRGAAAQAG ERESGVVAVS PEKSESPQKE DGLSSQLKSD PVDPDKEPEK EDVSASGPSP 
      2170       2180       2190       2200       2210       2220 
EATQLAKQME LEQAVEHIAK LAEASASAAY KADAPEGLAP EDRDKPAHQA SETELAAAIG 
      2230       2240       2250       2260       2270       2280 
SIINDISGEP ENFPAPPPYP GESQTDLQPP AGAQALQPSE EGMETDEAVS GILETEAATE 
      2290       2300       2310       2320       2330       2340 
SSRPPVNAPD PSAGPTDTKE ARGNSSETSH SVPEAKGSKE VEVTLVRKDK GRQKTTRSRR 
      2350       2360       2370       2380       2390       2400 
KRNTNKKVVA PVESHVPESN QAQGESPAAN EGTTVQHPEA PQEEKQSEKP HSTPPQSCTS 
      2410       2420       2430       2440       2450       2460 
DLSKIPSTEN SSQEISVEER TPTKASVPPD LPPPPQPAPV DEEPQARFRV HSIIESDPVT 
      2470       2480       2490       2500       2510       2520 
PPSDPSIPIP TLPSVTAAKL SPPVASGGIP HQSPPTKVTE WITRQEEPRA QSTPSPALPP 
      2530       2540       2550       2560       2570       2580 
DTKASDVDTS SSTLRKILMD PKYVSATSVT STSVTTAIAE PVSAAPCLHE APPPPVDSKK 
      2590       2600       2610       2620       2630       2640 
PLEEKTAPPV TNNSEIQASE VLVAADKEKV APVIAPKITS VISRMPVSID LENSQKITLA 
      2650       2660       2670       2680       2690       2700 
KPAPQTLTGL VSALTGLVNV SLVPVNALKG PVKGSVTTLK SLVSTPAGPV NVLKGPVNVL 
      2710       2720       2730       2740       2750       2760 
TGPVNVLTTP VNATVGTVNA APGTVNAAAS AVNATASAVT VTAGAVTAAS GGVTATTGTV 
      2770       2780       2790       2800       2810       2820 
TMAGAVIAPS TKCKQRASAN ENSRFHPGSM PVIDDRPADA GSGAGLRVNT SEGVVLLSYS 
      2830       2840       2850       2860       2870       2880 
GQKTEGPQRI SAKISQIPPA SAMDIEFQQS VSKSQVKPDS VTASQPPSKG PQAPAGYANV 
      2890       2900       2910       2920       2930       2940 
ATHSTLVLTA QTYNASPVIS SVKADRPSLE KPEPIHLSVS TPVTQGGTVK VLTQGINTPP 
      2950       2960       2970       2980       2990       3000 
VLVHNQLVLT PSIVTTNKKL ADPVTLKIET KVLQPANLGS TLTPHHPPAL PSKLPTEVNH 
      3010       3020       3030       3040       3050       3060 
VPSGPSIPAD RTVSHLAAAK LDAHSPRPSG PGPSSFPRAS HPSSTASTAL STNATVMLAA 
      3070       3080       3090       3100       3110       3120 
GIPVPQFISS IHPEQSVIMP PHSITQTVSL SHLSQGEVRM NTPTLPSITY SIRPEALHSP 
      3130       3140       3150       3160       3170       3180 
RAPLQPQQIE VRAPQRASTP QPAPAGVPAL ASQHPPEEEV HYHLPVARAT APVQSEVLVM 
      3190       3200       3210       3220       3230       3240 
QSEYRLHPYT VPRDVRIMVH PHVTAVSEQP RAADGVVKVP PASKAPQQPG KEAAKTPDAK 
      3250       3260       3270       3280       3290       3300 
AAPTPTPAPV PVPVPLPAPA PAPHGEARIL TVTPSNQLQG LPLTPPVVVT HGVQIVHSSG 
      3310       3320       3330       3340       3350       3360 
ELFQEYRYGD IRTYHPPAQL THTQFPAASS VGLPSRTKTA AQGPPPEGEP LQPPQPVQST 
      3370       3380       3390       3400       3410       3420 
QPAQPAPPCP PSQLGQPGQP PSSKMPQVSQ EAKGTQTGVE QPRLPAGPAN RPPEPHTQVQ 
      3430       3440       3450       3460       3470       3480 
RAQAETGPTS FPSPVSVSMK PDLPVSLPTQ TAPKQPLFVP TTSGPSTPPG LVLPHTEFQP 
      3490       3500       3510       3520       3530       3540 
APKQDSSPHL TSQRPVDMVQ LLKKYPIVWQ GLLALKNDTA AVQLHFVSGN NVLAHRSLPL 
      3550       3560       3570       3580       3590       3600 
SEGGPPLRIA QRMRLEATQL EGVARRMTVE TDYCLLLALP CGRDQEDVVS QTESLKAAFI 
      3610       3620       3630       3640       3650       3660 
TYLQAKQAAG IINVPNPGSN QPAYVLQIFP PCEFSESHLS RLAPDLLASI SNISPHLMIV 
   
IASV

Isoforms



Sequence View



Filter Information:


(REFRESH)

Directness:


Physiological Relevance:


Evidence Codes:


Methodology:


Perturbation of System:


Biological System:


Protease Assignment Confidence:


Evidence Names:


Database:


Lab:



Protein Neighborhood

Domains & Features

6 N-termini - 3 C-termini - 0 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

    Protease Position Sequence Evidence type Method Source (database) Source (Lab) Evidence name Publications (PMIDs)

Substrates

    Substrate Position Sequence Evidence type Method Source (database) Source (Lab) Evidence name Publications (PMIDs)