TopFIND 4.0

P11087: Collagen alpha-1(I) chain

General Information

Protein names
- Collagen alpha-1(I) chain
- Alpha-1 type I collagen

Gene names Col1a1
Organism Mus musculus
Protease Family
Protease ID
Chromosome location
UniProt ID P11087

10

N-termini

7

C-termini

6

Cleavages

0

Substrates

Sequence

        10         20         30         40         50         60 
MFSFVDLRLL LLLGATALLT HGQEDIPEVS CIHNGLRVPN GETWKPEVCL ICICHNGTAV 
        70         80         90        100        110        120 
CDDVQCNEEL DCPNPQRREG ECCAFCPEEY VSPNSEDVGV EGPKGDPGPQ GPRGPVGPPG 
       130        140        150        160        170        180 
RDGIPGQPGL PGPPGPPGPP GPPGLGGNFA SQMSYGYDEK SAGVSVPGPM GPSGPRGLPG 
       190        200        210        220        230        240 
PPGAPGPQGF QGPPGEPGEP GGSGPMGPRG PPGPPGKNGD DGEAGKPGRP GERGPPGPQG 
       250        260        270        280        290        300 
ARGLPGTAGL PGMKGHRGFS GLDGAKGDAG PAGPKGEPGS PGENGAPGQM GPRGLPGERG 
       310        320        330        340        350        360 
RPGPPGTAGA RGNDGAVGAA GPPGPTGPTG PPGFPGAVGA KGEAGPQGAR GSEGPQGVRG 
       370        380        390        400        410        420 
EPGPPGPAGA AGPAGNPGAD GQPGAKGANG APGIAGAPGF PGARGPSGPQ GPSGPPGPKG 
       430        440        450        460        470        480 
NSGEPGAPGN KGDTGAKGEP GATGVQGPPG PAGEEGKRGA RGEPGPSGLP GPPGERGGPG 
       490        500        510        520        530        540 
SRGFPGADGV AGPKGPSGER GAPGPAGPKG SPGEAGRPGE AGLPGAKGLT GSPGSPGPDG 
       550        560        570        580        590        600 
KTGPPGPAGQ DGRPGPAGPP GARGQAGVMG FPGPKGTAGE PGKAGERGLP GPPGAVGPAG 
       610        620        630        640        650        660 
KDGEAGAQGA PGPAGPAGER GEQGPAGSPG FQGLPGPAGP PGEAGKPGEQ GVPGDLGAPG 
       670        680        690        700        710        720 
PSGARGERGF PGERGVQGPP GPAGPRGNNG APGNDGAKGD TGAPGAPGSQ GAPGLQGMPG 
       730        740        750        760        770        780 
ERGAAGLPGP KGDRGDAGPK GADGSPGKDG ARGLTGPIGP PGPAGAPGDK GEAGPSGPPG 
       790        800        810        820        830        840 
PTGARGAPGD RGEAGPPGPA GFAGPPGADG QPGAKGEPGD TGVKGDAGPP GPAGPAGPPG 
       850        860        870        880        890        900 
PIGNVGAPGP KGPRGAAGPP GATGFPGAAG RVGPPGPSGN AGPPGPPGPV GKEGGKGPRG 
       910        920        930        940        950        960 
ETGPAGRPGE VGPPGPPGPA GEKGSPGADG PAGSPGTPGP QGIAGQRGVV GLPGQRGERG 
       970        980        990       1000       1010       1020 
FPGLPGPSGE PGKQGPSGSS GERGPPGPMG PPGLAGPPGE SGREGSPGAE GSPGRDGAPG 
      1030       1040       1050       1060       1070       1080 
AKGDRGETGP AGPPGAPGAP GAPGPVGPAG KNGDRGETGP AGPAGPIGPA GARGPAGPQG 
      1090       1100       1110       1120       1130       1140 
PRGDKGETGE QGDRGIKGHR GFSGLQGPPG SPGSPGEQGP SGASGPAGPR GPPGSAGSPG 
      1150       1160       1170       1180       1190       1200 
KDGLNGLPGP IGPPGPRGRT GDSGPAGPPG PPGPPGPPGP PSGGYDFSFL PQPPQEKSQD 
      1210       1220       1230       1240       1250       1260 
GGRYYRADDA NVVRDRDLEV DTTLKSLSQQ IENIRSPEGS RKNPARTCRD LKMCHSDWKS 
      1270       1280       1290       1300       1310       1320 
GEYWIDPNQG CNLDAIKVYC NMETGQTCVF PTQPSVPQKN WYISPNPKEK KHVWFGESMT 
      1330       1340       1350       1360       1370       1380 
DGFPFEYGSE GSDPADVAIQ LTFLRLMSTE ASQNITYHCK NSVAYMDQQT GNLKKALLLQ 
      1390       1400       1410       1420       1430       1440 
GSNEIELRGE GNSRFTYSTL VDGCTSHTGT WGKTVIEYKT TKTSRLPIID VAPLDIGAPD 
      1450    
QEFGLDIGPA CFV

Isoforms

- Isoform 2 of Collagen alpha-1(I) chain

Sequence View

        10         20         30         40         50         60 
MFSFVDLRLL LLLGATALLT HGQEDIPEVS CIHNGLRVPN GETWKPEVCL ICICHNGTAV 
        70         80         90        100        110        120 
CDDVQCNEEL DCPNPQRREG ECCAFCPEEY VSPNSEDVGV EGPKGDPGPQ GPRGPVGPPG 
       130        140        150        160        170        180 
RDGIPGQPGL PGPPGPPGPP GPPGLGGNFA SQMSYGYDEK SAGVSVPGPM GPSGPRGLPG 
       190        200        210        220        230        240 
PPGAPGPQGF QGPPGEPGEP GGSGPMGPRG PPGPPGKNGD DGEAGKPGRP GERGPPGPQG 
       250        260        270        280        290        300 
ARGLPGTAGL PGMKGHRGFS GLDGAKGDAG PAGPKGEPGS PGENGAPGQM GPRGLPGERG 
       310        320        330        340        350        360 
RPGPPGTAGA RGNDGAVGAA GPPGPTGPTG PPGFPGAVGA KGEAGPQGAR GSEGPQGVRG 
       370        380        390        400        410        420 
EPGPPGPAGA AGPAGNPGAD GQPGAKGANG APGIAGAPGF PGARGPSGPQ GPSGPPGPKG 
       430        440        450        460        470        480 
NSGEPGAPGN KGDTGAKGEP GATGVQGPPG PAGEEGKRGA RGEPGPSGLP GPPGERGGPG 
       490        500        510        520        530        540 
SRGFPGADGV AGPKGPSGER GAPGPAGPKG SPGEAGRPGE AGLPGAKGLT GSPGSPGPDG 
       550        560        570        580        590        600 
KTGPPGPAGQ DGRPGPAGPP GARGQAGVMG FPGPKGTAGE PGKAGERGLP GPPGAVGPAG 
       610        620        630        640        650        660 
KDGEAGAQGA PGPAGPAGER GEQGPAGSPG FQGLPGPAGP PGEAGKPGEQ GVPGDLGAPG 
       670        680        690        700        710        720 
PSGARGERGF PGERGVQGPP GPAGPRGNNG APGNDGAKGD TGAPGAPGSQ GAPGLQGMPG 
       730        740        750        760        770        780 
ERGAAGLPGP KGDRGDAGPK GADGSPGKDG ARGLTGPIGP PGPAGAPGDK GEAGPSGPPG 
       790        800        810        820        830        840 
PTGARGAPGD RGEAGPPGPA GFAGPPGADG QPGAKGEPGD TGVKGDAGPP GPAGPAGPPG 
       850        860        870        880        890        900 
PIGNVGAPGP KGPRGAAGPP GATGFPGAAG RVGPPGPSGN AGPPGPPGPV GKEGGKGPRG 
       910        920        930        940        950        960 
ETGPAGRPGE VGPPGPPGPA GEKGSPGADG PAGSPGTPGP QGIAGQRGVV GLPGQRGERG 
       970        980        990       1000       1010       1020 
FPGLPGPSGE PGKQGPSGSS GERGPPGPMG PPGLAGPPGE SGREGSPGAE GSPGRDGAPG 
      1030       1040       1050       1060       1070       1080 
AKGDRGETGP AGPPGAPGAP GAPGPVGPAG KNGDRGETGP AGPAGPIGPA GARGPAGPQG 
      1090       1100       1110       1120       1130       1140 
PRGDKGETGE QGDRGIKGHR GFSGLQGPPG SPGSPGEQGP SGASGPAGPR GPPGSAGSPG 
      1150       1160       1170       1180       1190       1200 
KDGLNGLPGP IGPPGPRGRT GDSGPAGPPG PPGPPGPPGP PSGGYDFSFL PQPPQEKSQD 
      1210       1220       1230       1240       1250       1260 
GGRYYRADDA NVVRDRDLEV DTTLKSLSQQ IENIRSPEGS RKNPARTCRD LKMCHSDWKS 
      1270       1280       1290       1300       1310       1320 
GEYWIDPNQG CNLDAIKVYC NMETGQTCVF PTQPSVPQKN WYISPNPKEK KHVWFGESMT 
      1330       1340       1350       1360       1370       1380 
DGFPFEYGSE GSDPADVAIQ LTFLRLMSTE ASQNITYHCK NSVAYMDQQT GNLKKALLLQ 
      1390       1400       1410       1420       1430       1440 
GSNEIELRGE GNSRFTYSTL VDGCTSHTGT WGKTVIEYKT TKTSRLPIID VAPLDIGAPD 
      1450    
QEFGLDIGPA CFV



Filter Information:


(REFRESH)

Directness:


Physiological Relevance:


Evidence Codes:


Methodology:


Perturbation of System:


Biological System:


Protease Assignment Confidence:


Evidence Names:


Database:


Lab:



Protein Neighborhood

Domains & Features

10 N-termini - 7 C-termini - 6 Cleavages - 0 Substrates

N-termini

C-termini

Cleavages

Substrates

    Substrate Position Sequence Evidence type Method Source (database) Source (Lab) Evidence name Publications (PMIDs)