P11087: Collagen alpha-1(I) chain

General Information

Protein names	- Collagen alpha-1(I) chain - Alpha-1 type I collagen
Gene names	Col1a1
Organism	Mus musculus
Protease Family
Protease ID
Chromosome location
UniProt ID	P11087

10 N-termini

7 C-termini

6 Cleavages

0 Substrates

Sequence

        10         20         30         40         50         60
MFSFVDLRLL LLLGATALLT HGQEDIPEVS CIHNGLRVPN GETWKPEVCL ICICHNGTAV
        70         80         90        100        110        120
CDDVQCNEEL DCPNPQRREG ECCAFCPEEY VSPNSEDVGV EGPKGDPGPQ GPRGPVGPPG
       130        140        150        160        170        180
RDGIPGQPGL PGPPGPPGPP GPPGLGGNFA SQMSYGYDEK SAGVSVPGPM GPSGPRGLPG
       190        200        210        220        230        240
PPGAPGPQGF QGPPGEPGEP GGSGPMGPRG PPGPPGKNGD DGEAGKPGRP GERGPPGPQG
       250        260        270        280        290        300
ARGLPGTAGL PGMKGHRGFS GLDGAKGDAG PAGPKGEPGS PGENGAPGQM GPRGLPGERG
       310        320        330        340        350        360
RPGPPGTAGA RGNDGAVGAA GPPGPTGPTG PPGFPGAVGA KGEAGPQGAR GSEGPQGVRG
       370        380        390        400        410        420
EPGPPGPAGA AGPAGNPGAD GQPGAKGANG APGIAGAPGF PGARGPSGPQ GPSGPPGPKG
       430        440        450        460        470        480
NSGEPGAPGN KGDTGAKGEP GATGVQGPPG PAGEEGKRGA RGEPGPSGLP GPPGERGGPG
       490        500        510        520        530        540
SRGFPGADGV AGPKGPSGER GAPGPAGPKG SPGEAGRPGE AGLPGAKGLT GSPGSPGPDG
       550        560        570        580        590        600
KTGPPGPAGQ DGRPGPAGPP GARGQAGVMG FPGPKGTAGE PGKAGERGLP GPPGAVGPAG
       610        620        630        640        650        660
KDGEAGAQGA PGPAGPAGER GEQGPAGSPG FQGLPGPAGP PGEAGKPGEQ GVPGDLGAPG
       670        680        690        700        710        720
PSGARGERGF PGERGVQGPP GPAGPRGNNG APGNDGAKGD TGAPGAPGSQ GAPGLQGMPG
       730        740        750        760        770        780
ERGAAGLPGP KGDRGDAGPK GADGSPGKDG ARGLTGPIGP PGPAGAPGDK GEAGPSGPPG
       790        800        810        820        830        840
PTGARGAPGD RGEAGPPGPA GFAGPPGADG QPGAKGEPGD TGVKGDAGPP GPAGPAGPPG
       850        860        870        880        890        900
PIGNVGAPGP KGPRGAAGPP GATGFPGAAG RVGPPGPSGN AGPPGPPGPV GKEGGKGPRG
       910        920        930        940        950        960
ETGPAGRPGE VGPPGPPGPA GEKGSPGADG PAGSPGTPGP QGIAGQRGVV GLPGQRGERG
       970        980        990       1000       1010       1020
FPGLPGPSGE PGKQGPSGSS GERGPPGPMG PPGLAGPPGE SGREGSPGAE GSPGRDGAPG
      1030       1040       1050       1060       1070       1080
AKGDRGETGP AGPPGAPGAP GAPGPVGPAG KNGDRGETGP AGPAGPIGPA GARGPAGPQG
      1090       1100       1110       1120       1130       1140
PRGDKGETGE QGDRGIKGHR GFSGLQGPPG SPGSPGEQGP SGASGPAGPR GPPGSAGSPG
      1150       1160       1170       1180       1190       1200
KDGLNGLPGP IGPPGPRGRT GDSGPAGPPG PPGPPGPPGP PSGGYDFSFL PQPPQEKSQD
      1210       1220       1230       1240       1250       1260
GGRYYRADDA NVVRDRDLEV DTTLKSLSQQ IENIRSPEGS RKNPARTCRD LKMCHSDWKS
      1270       1280       1290       1300       1310       1320
GEYWIDPNQG CNLDAIKVYC NMETGQTCVF PTQPSVPQKN WYISPNPKEK KHVWFGESMT
      1330       1340       1350       1360       1370       1380
DGFPFEYGSE GSDPADVAIQ LTFLRLMSTE ASQNITYHCK NSVAYMDQQT GNLKKALLLQ
      1390       1400       1410       1420       1430       1440
GSNEIELRGE GNSRFTYSTL VDGCTSHTGT WGKTVIEYKT TKTSRLPIID VAPLDIGAPD
      1450
QEFGLDIGPA CFV

Isoforms

- Isoform 2 of Collagen alpha-1(I) chain

Sequence View

Filter Information:

(REFRESH)

Directness:

Physiological Relevance:

Evidence Codes:

Methodology:

Perturbation of System:

Biological System:

Protease Assignment Confidence:

Evidence Names:

Database:

Lab:

Protein Neighborhood

Domains & Features

10 N-termini - 7 C-termini - 6 Cleavages - 0 Substrates

N-termini

Name	Sequence	Position	Evidence type	Method	Source (database)	Evidence name
P11087-1-unknown	MFSFVD...	1	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt71257
P11087-98-unknown	VGVEGP...	98	inferred from electronic annotation	unknown	TISdb	inferred from TISdb
P11087-98-unknown	VGVEGP...	98	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt196913
P11087-152-unknown	QMSYGY...	152	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
P11087-152-unknown	QMSYGY...	152	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt115964
P11087-164-unknown	VSVPGP...	164	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC32749
P11087-164-unknown	VSVPGP...	164	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt145325
P11087-190-unknown	FQGPPG...	190	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33328
P11087-190-unknown	FQGPPG...	190	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt146237
P11087-330-unknown	GPPGFP...	330	inferred from electronic annotation	unknown	TISdb	inferred from TISdb
P11087-330-unknown	GPPGFP...	330	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt199011
P11087-438-unknown	GEPGAT...	438	inferred from electronic annotation	unknown	TISdb	inferred from TISdb
P11087-438-unknown	GEPGAT...	438	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt199493
P11087-529-unknown	LTGSPG...	529	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33330
P11087-529-unknown	LTGSPG...	529	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt153736
P11087-949-unknown	VVGLPG...	949	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33332
P11087-994-unknown	LAGPPG...	994	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33333
P11087-994-unknown	LAGPPG...	994	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC34620

C-termini

Sequence	Position	Evidence type	Method	Source (database)	Evidence name
...EKSAGV	163	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC32749
...EKSAGV	163	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt128616
...PGPQGF	189	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33328
...PGPQGF	189	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt129541
...PGAKGL	528	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33330
...PGAKGL	528	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt137159
...AGQRGV	948	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33332
...MGPPGL	993	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC33333
...MGPPGL	993	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC34620
...RYYRAD	1207	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
...RYYRAD	1207	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt93699
...PACFV	1453	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt66875

Cleavages

Protease	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)
MMP13_MOUSE	163	SAGV.\|.VSVP	inferred from experiment	unknown	MEROPS	Jaenisch R	Liu X et al.:A targeted mutation at the know... (M10.013)	7790374,
MMP2_MOUSE	189	PQGF.\|.FQGP	inferred from experiment	unknown	MEROPS		Merops MMP2_MOUSE -> CO1A1_MOUSE @189
MMP2_MOUSE	528	AKGL.\|.LTGS	inferred from experiment	unknown	MEROPS		Merops MMP2_MOUSE -> CO1A1_MOUSE @528
MMP2_MOUSE	948	QRGV.\|.VVGL	inferred from experiment	unknown	MEROPS		Merops MMP2_MOUSE -> CO1A1_MOUSE @948
MMP2_MOUSE	993	PPGL.\|.LAGP	inferred from experiment	unknown	MEROPS	Overall CM	Prudova A et al.:Multiplex N-terminome analysis ... (M10.004)	20305284,
MMP9_MOUSE	993	PPGL.\|.LAGP	inferred from experiment	unknown	MEROPS	Overall CM	Prudova A et al.:Multiplex N-terminome analysis ... (M10.004)	20305284,

Substrates

Substrate	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)