Q02388: Collagen alpha-1(VII) chain

General Information

Protein names	- Collagen alpha-1(VII) chain - Long-chain collagen - LC collagen
Gene names	COL7A1
Organism	Homo sapiens
Protease Family
Protease ID	I02.967
Chromosome location
UniProt ID	Q02388

6 N-termini

3 C-termini

4 Cleavages

0 Substrates

Sequence

        10         20         30         40         50         60
MTLRLLVAAL CAGILAEAPR VRAQHRERVT CTRLYAADIV FLLDGSSSIG RSNFREVRSF
        70         80         90        100        110        120
LEGLVLPFSG AASAQGVRFA TVQYSDDPRT EFGLDALGSG GDVIRAIREL SYKGGNTRTG
       130        140        150        160        170        180
AAILHVADHV FLPQLARPGV PKVCILITDG KSQDLVDTAA QRLKGQGVKL FAVGIKNADP
       190        200        210        220        230        240
EELKRVASQP TSDFFFFVND FSILRTLLPL VSRRVCTTAG GVPVTRPPDD STSAPRDLVL
       250        260        270        280        290        300
SEPSSQSLRV QWTAASGPVT GYKVQYTPLT GLGQPLPSER QEVNVPAGET SVRLRGLRPL
       310        320        330        340        350        360
TEYQVTVIAL YANSIGEAVS GTARTTALEG PELTIQNTTA HSLLVAWRSV PGATGYRVTW
       370        380        390        400        410        420
RVLSGGPTQQ QELGPGQGSV LLRDLEPGTD YEVTVSTLFG RSVGPATSLM ARTDASVEQT
       430        440        450        460        470        480
LRPVILGPTS ILLSWNLVPE ARGYRLEWRR ETGLEPPQKV VLPSDVTRYQ LDGLQPGTEY
       490        500        510        520        530        540
RLTLYTLLEG HEVATPATVV PTGPELPVSP VTDLQATELP GQRVRVSWSP VPGATQYRII
       550        560        570        580        590        600
VRSTQGVERT LVLPGSQTAF DLDDVQAGLS YTVRVSARVG PREGSASVLT VRREPETPLA
       610        620        630        640        650        660
VPGLRVVVSD ATRVRVAWGP VPGASGFRIS WSTGSGPESS QTLPPDSTAT DITGLQPGTT
       670        680        690        700        710        720
YQVAVSVLRG REEGPAAVIV ARTDPLGPVR TVHVTQASSS SVTITWTRVP GATGYRVSWH
       730        740        750        760        770        780
SAHGPEKSQL VSGEATVAEL DGLEPDTEYT VHVRAHVAGV DGPPASVVVR TAPEPVGRVS
       790        800        810        820        830        840
RLQILNASSD VLRITWVGVT GATAYRLAWG RSEGGPMRHQ ILPGNTDSAE IRGLEGGVSY
       850        860        870        880        890        900
SVRVTALVGD REGTPVSIVV TTPPEAPPAL GTLHVVQRGE HSLRLRWEPV PRAQGFLLHW
       910        920        930        940        950        960
QPEGGQEQSR VLGPELSSYH LDGLEPATQY RVRLSVLGPA GEGPSAEVTA RTESPRVPSI
       970        980        990       1000       1010       1020
ELRVVDTSID SVTLAWTPVS RASSYILSWR PLRGPGQEVP GSPQTLPGIS SSQRVTGLEP
      1030       1040       1050       1060       1070       1080
GVSYIFSLTP VLDGVRGPEA SVTQTPVCPR GLADVVFLPH ATQDNAHRAE ATRRVLERLV
      1090       1100       1110       1120       1130       1140
LALGPLGPQA VQVGLLSYSH RPSPLFPLNG SHDLGIILQR IRDMPYMDPS GNNLGTAVVT
      1150       1160       1170       1180       1190       1200
AHRYMLAPDA PGRRQHVPGV MVLLVDEPLR GDIFSPIREA QASGLNVVML GMAGADPEQL
      1210       1220       1230       1240       1250       1260
RRLAPGMDSV QTFFAVDDGP SLDQAVSGLA TALCQASFTT QPRPEPCPVY CPKGQKGEPG
      1270       1280       1290       1300       1310       1320
EMGLRGQVGP PGDPGLPGRT GAPGPQGPPG SATAKGERGF PGADGRPGSP GRAGNPGTPG
      1330       1340       1350       1360       1370       1380
APGLKGSPGL PGPRGDPGER GPRGPKGEPG APGQVIGGEG PGLPGRKGDP GPSGPPGPRG
      1390       1400       1410       1420       1430       1440
PLGDPGPRGP PGLPGTAMKG DKGDRGERGP PGPGEGGIAP GEPGLPGLPG SPGPQGPVGP
      1450       1460       1470       1480       1490       1500
PGKKGEKGDS EDGAPGLPGQ PGSPGEQGPR GPPGAIGPKG DRGFPGPLGE AGEKGERGPP
      1510       1520       1530       1540       1550       1560
GPAGSRGLPG VAGRPGAKGP EGPPGPTGRQ GEKGEPGRPG DPAVVGPAVA GPKGEKGDVG
      1570       1580       1590       1600       1610       1620
PAGPRGATGV QGERGPPGLV LPGDPGPKGD PGDRGPIGLT GRAGPPGDSG PPGEKGDPGR
      1630       1640       1650       1660       1670       1680
PGPPGPVGPR GRDGEVGEKG DEGPPGDPGL PGKAGERGLR GAPGVRGPVG EKGDQGDPGE
      1690       1700       1710       1720       1730       1740
DGRNGSPGSS GPKGDRGEPG PPGPPGRLVD TGPGAREKGE PGDRGQEGPR GPKGDPGLPG
      1750       1760       1770       1780       1790       1800
APGERGIEGF RGPPGPQGDP GVRGPAGEKG DRGPPGLDGR SGLDGKPGAA GPSGPNGAAG
      1810       1820       1830       1840       1850       1860
KAGDPGRDGL PGLRGEQGLP GPSGPPGLPG KPGEDGKPGL NGKNGEPGDP GEDGRKGEKG
      1870       1880       1890       1900       1910       1920
DSGASGREGR DGPKGERGAP GILGPQGPPG LPGPVGPPGQ GFPGVPGGTG PKGDRGETGS
      1930       1940       1950       1960       1970       1980
KGEQGLPGER GLRGEPGSVP NVDRLLETAG IKASALREIV ETWDESSGSF LPVPERRRGP
      1990       2000       2010       2020       2030       2040
KGDSGEQGPP GKEGPIGFPG ERGLKGDRGD PGPQGPPGLA LGERGPPGPS GLAGEPGKPG
      2050       2060       2070       2080       2090       2100
IPGLPGRAGG VGEAGRPGER GERGEKGERG EQGRDGPPGL PGTPGPPGPP GPKVSVDEPG
      2110       2120       2130       2140       2150       2160
PGLSGEQGPP GLKGAKGEPG SNGDQGPKGD RGVPGIKGDR GEPGPRGQDG NPGLPGERGM
      2170       2180       2190       2200       2210       2220
AGPEGKPGLQ GPRGPPGPVG GHGDPGPPGA PGLAGPAGPQ GPSGLKGEPG ETGPPGRGLT
      2230       2240       2250       2260       2270       2280
GPTGAVGLPG PPGPSGLVGP QGSPGLPGQV GETGKPGAPG RDGASGKDGD RGSPGVPGSP
      2290       2300       2310       2320       2330       2340
GLPGPVGPKG EPGPTGAPGQ AVVGLPGAKG EKGAPGGLAG DLVGEPGAKG DRGLPGPRGE
      2350       2360       2370       2380       2390       2400
KGEAGRAGEP GDPGEDGQKG APGPKGFKGD PGVGVPGSPG PPGPPGVKGD LGLPGLPGAP
      2410       2420       2430       2440       2450       2460
GVVGFPGQTG PRGEMGQPGP SGERGLAGPP GREGIPGPLG PPGPPGSVGP PGASGLKGDK
      2470       2480       2490       2500       2510       2520
GDPGVGLPGP RGERGEPGIR GEDGRPGQEG PRGLTGPPGS RGERGEKGDV GSAGLKGDKG
      2530       2540       2550       2560       2570       2580
DSAVILGPPG PRGAKGDMGE RGPRGLDGDK GPRGDNGDPG DKGSKGEPGD KGSAGLPGLR
      2590       2600       2610       2620       2630       2640
GLLGPQGQPG AAGIPGDPGS PGKDGVPGIR GEKGDVGFMG PRGLKGERGV KGACGLDGEK
      2650       2660       2670       2680       2690       2700
GDKGEAGPPG RPGLAGHKGE MGEPGVPGQS GAPGKEGLIG PKGDRGFDGQ PGPKGDQGEK
      2710       2720       2730       2740       2750       2760
GERGTPGIGG FPGPSGNDGS AGPPGPPGSV GPRGPEGLQG QKGERGPPGE RVVGAPGVPG
      2770       2780       2790       2800       2810       2820
APGERGEQGR PGPAGPRGEK GEAALTEDDI RGFVRQEMSQ HCACQGQFIA SGSRPLPSYA
      2830       2840       2850       2860       2870       2880
ADTAGSQLHA VPVLRVSHAE EEERVPPEDD EYSEYSEYSV EEYQDPEAPW DSDDPCSLPL
      2890       2900       2910       2920       2930       2940
DEGSCTAYTL RWYHRAVTGS TEACHPFVYG GCGGNANRFG TREACERRCP PRVVQSQGTG

TAQD

Isoforms

- Isoform 2 of Collagen alpha-1(VII) chain

Sequence View

        10         20         30         40         50         60
MTLRLLVAAL CAGILAEAPR VRAQHRERVT CTRLYAADIV FLLDGSSSIG RSNFREVRSF
        70         80         90        100        110        120
LEGLVLPFSG AASAQGVRFA TVQYSDDPRT EFGLDALGSG GDVIRAIREL SYKGGNTRTG
       130        140        150        160        170        180
AAILHVADHV FLPQLARPGV PKVCILITDG KSQDLVDTAA QRLKGQGVKL FAVGIKNADP
       190        200        210        220        230        240
EELKRVASQP TSDFFFFVND FSILRTLLPL VSRRVCTTAG GVPVTRPPDD STSAPRDLVL
       250        260        270        280        290        300
SEPSSQSLRV QWTAASGPVT GYKVQYTPLT GLGQPLPSER QEVNVPAGET SVRLRGLRPL
       310        320        330        340        350        360
TEYQVTVIAL YANSIGEAVS GTARTTALEG PELTIQNTTA HSLLVAWRSV PGATGYRVTW
       370        380        390        400        410        420
RVLSGGPTQQ QELGPGQGSV LLRDLEPGTD YEVTVSTLFG RSVGPATSLM ARTDASVEQT
       430        440        450        460        470        480
LRPVILGPTS ILLSWNLVPE ARGYRLEWRR ETGLEPPQKV VLPSDVTRYQ LDGLQPGTEY
       490        500        510        520        530        540
RLTLYTLLEG HEVATPATVV PTGPELPVSP VTDLQATELP GQRVRVSWSP VPGATQYRII
       550        560        570        580        590        600
VRSTQGVERT LVLPGSQTAF DLDDVQAGLS YTVRVSARVG PREGSASVLT VRREPETPLA
       610        620        630        640        650        660
VPGLRVVVSD ATRVRVAWGP VPGASGFRIS WSTGSGPESS QTLPPDSTAT DITGLQPGTT
       670        680        690        700        710        720
YQVAVSVLRG REEGPAAVIV ARTDPLGPVR TVHVTQASSS SVTITWTRVP GATGYRVSWH
       730        740        750        760        770        780
SAHGPEKSQL VSGEATVAEL DGLEPDTEYT VHVRAHVAGV DGPPASVVVR TAPEPVGRVS
       790        800        810        820        830        840
RLQILNASSD VLRITWVGVT GATAYRLAWG RSEGGPMRHQ ILPGNTDSAE IRGLEGGVSY
       850        860        870        880        890        900
SVRVTALVGD REGTPVSIVV TTPPEAPPAL GTLHVVQRGE HSLRLRWEPV PRAQGFLLHW
       910        920        930        940        950        960
QPEGGQEQSR VLGPELSSYH LDGLEPATQY RVRLSVLGPA GEGPSAEVTA RTESPRVPSI
       970        980        990       1000       1010       1020
ELRVVDTSID SVTLAWTPVS RASSYILSWR PLRGPGQEVP GSPQTLPGIS SSQRVTGLEP
      1030       1040       1050       1060       1070       1080
GVSYIFSLTP VLDGVRGPEA SVTQTPVCPR GLADVVFLPH ATQDNAHRAE ATRRVLERLV
      1090       1100       1110       1120       1130       1140
LALGPLGPQA VQVGLLSYSH RPSPLFPLNG SHDLGIILQR IRDMPYMDPS GNNLGTAVVT
      1150       1160       1170       1180       1190       1200
AHRYMLAPDA PGRRQHVPGV MVLLVDEPLR GDIFSPIREA QASGLNVVML GMAGADPEQL
      1210       1220       1230       1240       1250       1260
RRLAPGMDSV QTFFAVDDGP SLDQAVSGLA TALCQASFTT QPRPEPCPVY CPKGQKGEPG
      1270       1280       1290       1300       1310       1320
EMGLRGQVGP PGDPGLPGRT GAPGPQGPPG SATAKGERGF PGADGRPGSP GRAGNPGTPG
      1330       1340       1350       1360       1370       1380
APGLKGSPGL PGPRGDPGER GPRGPKGEPG APGQVIGGEG PGLPGRKGDP GPSGPPGPRG
      1390       1400       1410       1420       1430       1440
PLGDPGPRGP PGLPGTAMKG DKGDRGERGP PGPGEGGIAP GEPGLPGLPG SPGPQGPVGP
      1450       1460       1470       1480       1490       1500
PGKKGEKGDS EDGAPGLPGQ PGSPGEQGPR GPPGAIGPKG DRGFPGPLGE AGEKGERGPP
      1510       1520       1530       1540       1550       1560
GPAGSRGLPG VAGRPGAKGP EGPPGPTGRQ GEKGEPGRPG DPAVVGPAVA GPKGEKGDVG
      1570       1580       1590       1600       1610       1620
PAGPRGATGV QGERGPPGLV LPGDPGPKGD PGDRGPIGLT GRAGPPGDSG PPGEKGDPGR
      1630       1640       1650       1660       1670       1680
PGPPGPVGPR GRDGEVGEKG DEGPPGDPGL PGKAGERGLR GAPGVRGPVG EKGDQGDPGE
      1690       1700       1710       1720       1730       1740
DGRNGSPGSS GPKGDRGEPG PPGPPGRLVD TGPGAREKGE PGDRGQEGPR GPKGDPGLPG
      1750       1760       1770       1780       1790       1800
APGERGIEGF RGPPGPQGDP GVRGPAGEKG DRGPPGLDGR SGLDGKPGAA GPSGPNGAAG
      1810       1820       1830       1840       1850       1860
KAGDPGRDGL PGLRGEQGLP GPSGPPGLPG KPGEDGKPGL NGKNGEPGDP GEDGRKGEKG
      1870       1880       1890       1900       1910       1920
DSGASGREGR DGPKGERGAP GILGPQGPPG LPGPVGPPGQ GFPGVPGGTG PKGDRGETGS
      1930       1940       1950       1960       1970       1980
KGEQGLPGER GLRGEPGSVP NVDRLLETAG IKASALREIV ETWDESSGSF LPVPERRRGP
      1990       2000       2010       2020       2030       2040
KGDSGEQGPP GKEGPIGFPG ERGLKGDRGD PGPQGPPGLA LGERGPPGPS GLAGEPGKPG
      2050       2060       2070       2080       2090       2100
IPGLPGRAGG VGEAGRPGER GERGEKGERG EQGRDGPPGL PGTPGPPGPP GPKVSVDEPG
      2110       2120       2130       2140       2150       2160
PGLSGEQGPP GLKGAKGEPG SNGDQGPKGD RGVPGIKGDR GEPGPRGQDG NPGLPGERGM
      2170       2180       2190       2200       2210       2220
AGPEGKPGLQ GPRGPPGPVG GHGDPGPPGA PGLAGPAGPQ GPSGLKGEPG ETGPPGRGLT
      2230       2240       2250       2260       2270       2280
GPTGAVGLPG PPGPSGLVGP QGSPGLPGQV GETGKPGAPG RDGASGKDGD RGSPGVPGSP
      2290       2300       2310       2320       2330       2340
GLPGPVGPKG EPGPTGAPGQ AVVGLPGAKG EKGAPGGLAG DLVGEPGAKG DRGLPGPRGE
      2350       2360       2370       2380       2390       2400
KGEAGRAGEP GDPGEDGQKG APGPKGFKGD PGVGVPGSPG PPGPPGVKGD LGLPGLPGAP
      2410       2420       2430       2440       2450       2460
GVVGFPGQTG PRGEMGQPGP SGERGLAGPP GREGIPGPLG PPGPPGSVGP PGASGLKGDK
      2470       2480       2490       2500       2510       2520
GDPGVGLPGP RGERGEPGIR GEDGRPGQEG PRGLTGPPGS RGERGEKGDV GSAGLKGDKG
      2530       2540       2550       2560       2570       2580
DSAVILGPPG PRGAKGDMGE RGPRGLDGDK GPRGDNGDPG DKGSKGEPGD KGSAGLPGLR
      2590       2600       2610       2620       2630       2640
GLLGPQGQPG AAGIPGDPGS PGKDGVPGIR GEKGDVGFMG PRGLKGERGV KGACGLDGEK
      2650       2660       2670       2680       2690       2700
GDKGEAGPPG RPGLAGHKGE MGEPGVPGQS GAPGKEGLIG PKGDRGFDGQ PGPKGDQGEK
      2710       2720       2730       2740       2750       2760
GERGTPGIGG FPGPSGNDGS AGPPGPPGSV GPRGPEGLQG QKGERGPPGE RVVGAPGVPG
      2770       2780       2790       2800       2810       2820
APGERGEQGR PGPAGPRGEK GEAALTEDDI RGFVRQEMSQ HCACQGQFIA SGSRPLPSYA
      2830       2840       2850       2860       2870       2880
ADTAGSQLHA VPVLRVSHAE EEERVPPEDD EYSEYSEYSV EEYQDPEAPW DSDDPCSLPL
      2890       2900       2910       2920       2930       2940
DEGSCTAYTL RWYHRAVTGS TEACHPFVYG GCGGNANRFG TREACERRCP PRVVQSQGTG

TAQD

Name	Sequence	Position	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMID)
Q02388-1-unknown	MTLRLL...	1	inferred from isoform by sequence similarity	unknown	TopFIND		inferred from TNt71289
Q02388-17-unknown	EAPRVR...	17	inferred from electronic annotation	electronic annotation	UniProtKB		inferred from uniprot
Q02388-17-unknown	EAPRVR...	17	inferred from isoform by sequence similarity	unknown	TopFIND		inferred from TNt111868
Q02388-296-unknown	GLRPLT...	296	inferred from cleavage	unknown	TopFIND		Inferred from cleavage TC15892
Q02388-296-unknown	GLRPLT...	296	inferred from isoform by sequence similarity	unknown	TopFIND		inferred from TNt149759
Q02388-2822-unknown	DTAGSQ...	2822	inferred from cleavage	unknown	TopFIND		Inferred from cleavage TC31838
Q02388-2822-unknown	DTAGSQ...	2822	inferred from cleavage	unknown	TopFIND		Inferred from cleavage TC31850
Q02388-2822-unknown	DTAGSQ...	2822	inferred from cleavage	unknown	TopFIND		Inferred from cleavage TC684
Q02388-2822-unknown	DTAGSQ...	2822	inferred from isoform by sequence similarity	unknown	TopFIND		inferred from TNt159252
Q02388-2910-	GGCGGN...	2910		Subtiligase Based Positive Selection		Wells	apoptotic_RPMI_Dox	23264352
Q02388-2910-unknown	GGCGGN...	2910	inferred from isoform by sequence similarity	unknown	TopFIND		inferred from TNt177331

Sequence	Position	Evidence type	Method	Source (database)	Evidence name
...SVRLRG	295	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC15892
...SVRLRG	295	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt133148
...PSYAAD	2821	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC31838
...PSYAAD	2821	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC31850
...PSYAAD	2821	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC684
...PSYAAD	2821	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142756
...GTAQD	2944	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
...GTAQD	2944	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt66907

Protease	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)
KLK13_HUMAN	295	RLRG.\|.GLRP	inferred from experiment	unknown	MEROPS	Diamandis EP	Borgono CA et al.:Defining the extended substrate... (S01.306)	17976015,
TLL1_HUMAN	2821	YAAD.\|.DTAG	inferred from experiment	unknown	MEROPS	Greenspan DS	Ge G et al.:Bone morphogenetic protein-1/to... (M12.016)	15292192,
TLL2_HUMAN	2821	YAAD.\|.DTAG	inferred from experiment	unknown	MEROPS	Bruckner-Tuderman L	Rattenholl A et al.:Proteinases of the bone morphog... (M12.005)	11986329,
BMP1_HUMAN	2821	YAAD.\|.DTAG	inferred from experiment	unknown	MEROPS	Bruckner-Tuderman L	Rattenholl A et al.:Proteinases of the bone morphog... (M12.005)	11986329,

TopFIND

Q02388: Collagen alpha-1(VII) chain

General Information

6

N-termini

3

C-termini

4

Cleavages

0

Substrates

Sequence

Isoforms

Filter Information:

Directness:

Physiological Relevance:

Evidence Codes:

Methodology:

Perturbation of System:

Biological System:

Protease Assignment Confidence:

Evidence Names:

Database:

Lab:

Protein Neighborhood

Domains & Features

6 N-termini - 3 C-termini - 4 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

Substrates