P02462: Collagen alpha-1(IV) chain

General Information

Protein names	- Collagen alpha-1(IV) chain - Arresten
Gene names	COL4A1
Organism	Homo sapiens
Protease Family
Protease ID
Chromosome location
UniProt ID	P02462

5 N-termini

3 C-termini

2 Cleavages

0 Substrates

Sequence

        10         20         30         40         50         60
MGPRLSVWLL LLPAALLLHE EHSRAAAKGG CAGSGCGKCD CHGVKGQKGE RGLPGLQGVI
        70         80         90        100        110        120
GFPGMQGPEG PQGPPGQKGD TGEPGLPGTK GTRGPPGASG YPGNPGLPGI PGQDGPPGPP
       130        140        150        160        170        180
GIPGCNGTKG ERGPLGPPGL PGFAGNPGPP GLPGMKGDPG EILGHVPGML LKGERGFPGI
       190        200        210        220        230        240
PGTPGPPGLP GLQGPVGPPG FTGPPGPPGP PGPPGEKGQM GLSFQGPKGD KGDQGVSGPP
       250        260        270        280        290        300
GVPGQAQVQE KGDFATKGEK GQKGEPGFQG MPGVGEKGEP GKPGPRGKPG KDGDKGEKGS
       310        320        330        340        350        360
PGFPGEPGYP GLIGRQGPQG EKGEAGPPGP PGIVIGTGPL GEKGERGYPG TPGPRGEPGP
       370        380        390        400        410        420
KGFPGLPGQP GPPGLPVPGQ AGAPGFPGER GEKGDRGFPG TSLPGPSGRD GLPGPPGSPG
       430        440        450        460        470        480
PPGQPGYTNG IVECQPGPPG DQGPPGIPGQ PGFIGEIGEK GQKGESCLIC DIDGYRGPPG
       490        500        510        520        530        540
PQGPPGEIGF PGQPGAKGDR GLPGRDGVAG VPGPQGTPGL IGQPGAKGEP GEFYFDLRLK
       550        560        570        580        590        600
GDKGDPGFPG QPGMPGRAGS PGRDGHPGLP GPKGSPGSVG LKGERGPPGG VGFPGSRGDT
       610        620        630        640        650        660
GPPGPPGYGP AGPIGDKGQA GFPGGPGSPG LPGPKGEPGK IVPLPGPPGA EGLPGSPGFP
       670        680        690        700        710        720
GPQGDRGFPG TPGRPGLPGE KGAVGQPGIG FPGPPGPKGV DGLPGDMGPP GTPGRPGFNG
       730        740        750        760        770        780
LPGNPGVQGQ KGEPGVGLPG LKGLPGLPGI PGTPGEKGSI GVPGVPGEHG AIGPPGLQGI
       790        800        810        820        830        840
RGEPGPPGLP GSVGSPGVPG IGPPGARGPP GGQGPPGLSG PPGIKGEKGF PGFPGLDMPG
       850        860        870        880        890        900
PKGDKGAQGL PGITGQSGLP GLPGQQGAPG IPGFPGSKGE MGVMGTPGQP GSPGPVGAPG
       910        920        930        940        950        960
LPGEKGDHGF PGSSGPRGDP GLKGDKGDVG LPGKPGSMDK VDMGSMKGQK GDQGEKGQIG
       970        980        990       1000       1010       1020
PIGEKGSRGD PGTPGVPGKD GQAGQPGQPG PKGDPGISGT PGAPGLPGPK GSVGGMGLPG
      1030       1040       1050       1060       1070       1080
TPGEKGVPGI PGPQGSPGLP GDKGAKGEKG QAGPPGIGIP GLRGEKGDQG IAGFPGSPGE
      1090       1100       1110       1120       1130       1140
KGEKGSIGIP GMPGSPGLKG SPGSVGYPGS PGLPGEKGDK GLPGLDGIPG VKGEAGLPGT
      1150       1160       1170       1180       1190       1200
PGPTGPAGQK GEPGSDGIPG SAGEKGEPGL PGRGFPGFPG AKGDKGSKGE VGFPGLAGSP
      1210       1220       1230       1240       1250       1260
GIPGSKGEQG FMGPPGPQGQ PGLPGSPGHA TEGPKGDRGP QGQPGLPGLP GPMGPPGLPG
      1270       1280       1290       1300       1310       1320
IDGVKGDKGN PGWPGAPGVP GPKGDPGFQG MPGIGGSPGI TGSKGDMGPP GVPGFQGPKG
      1330       1340       1350       1360       1370       1380
LPGLQGIKGD QGDQGVPGAK GLPGPPGPPG PYDIIKGEPG LPGPEGPPGL KGLQGLPGPK
      1390       1400       1410       1420       1430       1440
GQQGVTGLVG IPGPPGIPGF DGAPGQKGEM GPAGPTGPRG FPGPPGPDGL PGSMGPPGTP
      1450       1460       1470       1480       1490       1500
SVDHGFLVTR HSQTIDDPQC PSGTKILYHG YSLLYVQGNE RAHGQDLGTA GSCLRKFSTM
      1510       1520       1530       1540       1550       1560
PFLFCNINNV CNFASRNDYS YWLSTPEPMP MSMAPITGEN IRPFISRCAV CEAPAMVMAV
      1570       1580       1590       1600       1610       1620
HSQTIQIPPC PSGWSSLWIG YSFVMHTSAG AEGSGQALAS PGSCLEEFRS APFIECHGRG
      1630       1640       1650       1660
TCNYYANAYS FWLATIERSE MFKKPTPSTL KAGELRTHVS RCQVCMRRT

Isoforms

- Isoform 2 of Collagen alpha-1(IV) chain - Isoform 2 of Collagen alpha-1(IV) chain

Sequence View

        10         20         30         40         50         60
MGPRLSVWLL LLPAALLLHE EHSRAAAKGG CAGSGCGKCD CHGVKGQKGE RGLPGLQGVI
        70         80         90        100        110        120
GFPGMQGPEG PQGPPGQKGD TGEPGLPGTK GTRGPPGASG YPGNPGLPGI PGQDGPPGPP
       130        140        150        160        170        180
GIPGCNGTKG ERGPLGPPGL PGFAGNPGPP GLPGMKGDPG EILGHVPGML LKGERGFPGI
       190        200        210        220        230        240
PGTPGPPGLP GLQGPVGPPG FTGPPGPPGP PGPPGEKGQM GLSFQGPKGD KGDQGVSGPP
       250        260        270        280        290        300
GVPGQAQVQE KGDFATKGEK GQKGEPGFQG MPGVGEKGEP GKPGPRGKPG KDGDKGEKGS
       310        320        330        340        350        360
PGFPGEPGYP GLIGRQGPQG EKGEAGPPGP PGIVIGTGPL GEKGERGYPG TPGPRGEPGP
       370        380        390        400        410        420
KGFPGLPGQP GPPGLPVPGQ AGAPGFPGER GEKGDRGFPG TSLPGPSGRD GLPGPPGSPG
       430        440        450        460        470        480
PPGQPGYTNG IVECQPGPPG DQGPPGIPGQ PGFIGEIGEK GQKGESCLIC DIDGYRGPPG
       490        500        510        520        530        540
PQGPPGEIGF PGQPGAKGDR GLPGRDGVAG VPGPQGTPGL IGQPGAKGEP GEFYFDLRLK
       550        560        570        580        590        600
GDKGDPGFPG QPGMPGRAGS PGRDGHPGLP GPKGSPGSVG LKGERGPPGG VGFPGSRGDT
       610        620        630        640        650        660
GPPGPPGYGP AGPIGDKGQA GFPGGPGSPG LPGPKGEPGK IVPLPGPPGA EGLPGSPGFP
       670        680        690        700        710        720
GPQGDRGFPG TPGRPGLPGE KGAVGQPGIG FPGPPGPKGV DGLPGDMGPP GTPGRPGFNG
       730        740        750        760        770        780
LPGNPGVQGQ KGEPGVGLPG LKGLPGLPGI PGTPGEKGSI GVPGVPGEHG AIGPPGLQGI
       790        800        810        820        830        840
RGEPGPPGLP GSVGSPGVPG IGPPGARGPP GGQGPPGLSG PPGIKGEKGF PGFPGLDMPG
       850        860        870        880        890        900
PKGDKGAQGL PGITGQSGLP GLPGQQGAPG IPGFPGSKGE MGVMGTPGQP GSPGPVGAPG
       910        920        930        940        950        960
LPGEKGDHGF PGSSGPRGDP GLKGDKGDVG LPGKPGSMDK VDMGSMKGQK GDQGEKGQIG
       970        980        990       1000       1010       1020
PIGEKGSRGD PGTPGVPGKD GQAGQPGQPG PKGDPGISGT PGAPGLPGPK GSVGGMGLPG
      1030       1040       1050       1060       1070       1080
TPGEKGVPGI PGPQGSPGLP GDKGAKGEKG QAGPPGIGIP GLRGEKGDQG IAGFPGSPGE
      1090       1100       1110       1120       1130       1140
KGEKGSIGIP GMPGSPGLKG SPGSVGYPGS PGLPGEKGDK GLPGLDGIPG VKGEAGLPGT
      1150       1160       1170       1180       1190       1200
PGPTGPAGQK GEPGSDGIPG SAGEKGEPGL PGRGFPGFPG AKGDKGSKGE VGFPGLAGSP
      1210       1220       1230       1240       1250       1260
GIPGSKGEQG FMGPPGPQGQ PGLPGSPGHA TEGPKGDRGP QGQPGLPGLP GPMGPPGLPG
      1270       1280       1290       1300       1310       1320
IDGVKGDKGN PGWPGAPGVP GPKGDPGFQG MPGIGGSPGI TGSKGDMGPP GVPGFQGPKG
      1330       1340       1350       1360       1370       1380
LPGLQGIKGD QGDQGVPGAK GLPGPPGPPG PYDIIKGEPG LPGPEGPPGL KGLQGLPGPK
      1390       1400       1410       1420       1430       1440
GQQGVTGLVG IPGPPGIPGF DGAPGQKGEM GPAGPTGPRG FPGPPGPDGL PGSMGPPGTP
      1450       1460       1470       1480       1490       1500
SVDHGFLVTR HSQTIDDPQC PSGTKILYHG YSLLYVQGNE RAHGQDLGTA GSCLRKFSTM
      1510       1520       1530       1540       1550       1560
PFLFCNINNV CNFASRNDYS YWLSTPEPMP MSMAPITGEN IRPFISRCAV CEAPAMVMAV
      1570       1580       1590       1600       1610       1620
HSQTIQIPPC PSGWSSLWIG YSFVMHTSAG AEGSGQALAS PGSCLEEFRS APFIECHGRG
      1630       1640       1650       1660
TCNYYANAYS FWLATIERSE MFKKPTPSTL KAGELRTHVS RCQVCMRRT         10         20         30         40         50         60
MGPRLSVWLL LLPAALLLHE EHSRAAAKGG CAGSGCGKCD CHGVKGQKGE RGLPGLQGVI
        70         80         90        100        110        120
GFPGMQGPEG PQGPPGQKGD TGEPGLPGTK GTRGPPGASG YPGNPGLPGI PGQDGPPGPP
       130        140        150        160        170        180
GIPGCNGTKG ERGPLGPPGL PGFAGNPGPP GLPGMKGDPG EILGHVPGML LKGERGFPGI
       190        200        210        220        230        240
PGTPGPPGLP GLQGPVGPPG FTGPPGPPGP PGPPGEKGQM GLSFQGPKGD KGDQGVSGPP
       250        260        270        280        290        300
GVPGQAQVQE KGDFATKGEK GQKGEPGFQG MPGVGEKGEP GKPGPRGKPG KDGDKGEKGS
       310        320        330        340        350        360
PGFPGEPGYP GLIGRQGPQG EKGEAGPPGP PGIVIGTGPL GEKGERGYPG TPGPRGEPGP
       370        380        390        400        410        420
KGFPGLPGQP GPPGLPVPGQ AGAPGFPGER GEKGDRGFPG TSLPGPSGRD GLPGPPGSPG
       430        440        450        460        470        480
PPGQPGYTNG IVECQPGPPG DQGPPGIPGQ PGFIGEIGEK GQKGESCLIC DIDGYRGPPG
       490        500        510        520        530        540
PQGPPGEIGF PGQPGAKGDR GLPGRDGVAG VPGPQGTPGL IGQPGAKGEP GEFYFDLRLK
       550        560        570        580        590        600
GDKGDPGFPG QPGMPGRAGS PGRDGHPGLP GPKGSPGSVG LKGERGPPGG VGFPGSRGDT
       610        620        630        640        650        660
GPPGPPGYGP AGPIGDKGQA GFPGGPGSPG LPGPKGEPGK IVPLPGPPGA EGLPGSPGFP
       670        680        690        700        710        720
GPQGDRGFPG TPGRPGLPGE KGAVGQPGIG FPGPPGPKGV DGLPGDMGPP GTPGRPGFNG
       730        740        750        760        770        780
LPGNPGVQGQ KGEPGVGLPG LKGLPGLPGI PGTPGEKGSI GVPGVPGEHG AIGPPGLQGI
       790        800        810        820        830        840
RGEPGPPGLP GSVGSPGVPG IGPPGARGPP GGQGPPGLSG PPGIKGEKGF PGFPGLDMPG
       850        860        870        880        890        900
PKGDKGAQGL PGITGQSGLP GLPGQQGAPG IPGFPGSKGE MGVMGTPGQP GSPGPVGAPG
       910        920        930        940        950        960
LPGEKGDHGF PGSSGPRGDP GLKGDKGDVG LPGKPGSMDK VDMGSMKGQK GDQGEKGQIG
       970        980        990       1000       1010       1020
PIGEKGSRGD PGTPGVPGKD GQAGQPGQPG PKGDPGISGT PGAPGLPGPK GSVGGMGLPG
      1030       1040       1050       1060       1070       1080
TPGEKGVPGI PGPQGSPGLP GDKGAKGEKG QAGPPGIGIP GLRGEKGDQG IAGFPGSPGE
      1090       1100       1110       1120       1130       1140
KGEKGSIGIP GMPGSPGLKG SPGSVGYPGS PGLPGEKGDK GLPGLDGIPG VKGEAGLPGT
      1150       1160       1170       1180       1190       1200
PGPTGPAGQK GEPGSDGIPG SAGEKGEPGL PGRGFPGFPG AKGDKGSKGE VGFPGLAGSP
      1210       1220       1230       1240       1250       1260
GIPGSKGEQG FMGPPGPQGQ PGLPGSPGHA TEGPKGDRGP QGQPGLPGLP GPMGPPGLPG
      1270       1280       1290       1300       1310       1320
IDGVKGDKGN PGWPGAPGVP GPKGDPGFQG MPGIGGSPGI TGSKGDMGPP GVPGFQGPKG
      1330       1340       1350       1360       1370       1380
LPGLQGIKGD QGDQGVPGAK GLPGPPGPPG PYDIIKGEPG LPGPEGPPGL KGLQGLPGPK
      1390       1400       1410       1420       1430       1440
GQQGVTGLVG IPGPPGIPGF DGAPGQKGEM GPAGPTGPRG FPGPPGPDGL PGSMGPPGTP
      1450       1460       1470       1480       1490       1500
SVDHGFLVTR HSQTIDDPQC PSGTKILYHG YSLLYVQGNE RAHGQDLGTA GSCLRKFSTM
      1510       1520       1530       1540       1550       1560
PFLFCNINNV CNFASRNDYS YWLSTPEPMP MSMAPITGEN IRPFISRCAV CEAPAMVMAV
      1570       1580       1590       1600       1610       1620
HSQTIQIPPC PSGWSSLWIG YSFVMHTSAG AEGSGQALAS PGSCLEEFRS APFIECHGRG
      1630       1640       1650       1660
TCNYYANAYS FWLATIERSE MFKKPTPSTL KAGELRTHVS RCQVCMRRT

Name	Sequence	Position	Evidence type	Method	Source (database)	Evidence name
P02462-1-unknown	MGPRLS...	1	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt71271
P02462-173-unknown	GERGFP...	173	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
P02462-173-unknown	GERGFP...	173	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt115987
P02462-333-unknown	IVIGTG...	333	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC25243
P02462-333-unknown	IVIGTG...	333	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt150587
P02462-409-unknown	RDGLPG...	409	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC25245
P02462-409-unknown	RDGLPG...	409	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt152151
P02462-1445-unknown	GFLVTR...	1445	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
P02462-1445-unknown	GFLVTR...	1445	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt116494

Sequence	Position	Evidence type	Method	Source (database)	Evidence name
...PGPPGI	332	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC25243
...PGPPGI	332	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt133984
...PGPSGR	408	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC25245
...PGPSGR	408	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt135561
...CMRRT	1669	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
...CMRRT	1669	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt66889

Protease	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)
MMP9_HUMAN	332	PPGI.\|.IVIG	inferred from experiment	unknown	MEROPS	Smith JW	Kridel SJ et al.:Substrate hydrolysis by matrix ... (M10.004)	11279151,
MMP9_HUMAN	408	PSGR.\|.RDGL	inferred from experiment	unknown	MEROPS	Smith JW	Kridel SJ et al.:Substrate hydrolysis by matrix ... (M10.004)	11279151,

TopFIND

P02462: Collagen alpha-1(IV) chain

General Information

5

N-termini

3

C-termini

2

Cleavages

0

Substrates

Sequence

Isoforms

Filter Information:

Directness:

Physiological Relevance:

Evidence Codes:

Methodology:

Perturbation of System:

Biological System:

Protease Assignment Confidence:

Evidence Names:

Database:

Lab:

Protein Neighborhood

Domains & Features

5 N-termini - 3 C-termini - 2 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

Substrates