P01266: Thyroglobulin {ECO:0000305}

General Information

Protein names	- Thyroglobulin {ECO:0000305} - Tg
Gene names	TG
Organism	Homo sapiens
Protease Family
Protease ID	I31.950
Chromosome location
UniProt ID	P01266

14 N-termini

13 C-termini

12 Cleavages

0 Substrates

Sequence

        10         20         30         40         50         60
MALVLEIFTL LASICWVSAN IFEYQVDAQP LRPCELQRET AFLKQADYVP QCAEDGSFQT
        70         80         90        100        110        120
VQCQNDGRSC WCVGANGSEV LGSRQPGRPV ACLSFCQLQK QQILLSGYIN STDTSYLPQC
       130        140        150        160        170        180
QDSGDYAPVQ CDVQQVQCWC VDAEGMEVYG TRQLGRPKRC PRSCEIRNRR LLHGVGDKSP
       190        200        210        220        230        240
PQCSAEGEFM PVQCKFVNTT DMMIFDLVHS YNRFPDAFVT FSSFQRRFPE VSGYCHCADS
       250        260        270        280        290        300
QGRELAETGL ELLLDEIYDT IFAGLDLPST FTETTLYRIL QRRFLAVQSV ISGRFRCPTK
       310        320        330        340        350        360
CEVERFTATS FGHPYVPSCR RNGDYQAVQC QTEGPCWCVD AQGKEMHGTR QQGEPPSCAE
       370        380        390        400        410        420
GQSCASERQQ ALSRLYFGTS GYFSQHDLFS SPEKRWASPR VARFATSCPP TIKELFVDSG
       430        440        450        460        470        480
LLRPMVEGQS QQFSVSENLL KEAIRAIFPS RGLARLALQF TTNPKRLQQN LFGGKFLVNV
       490        500        510        520        530        540
GQFNLSGALG TRGTFNFSQF FQQLGLASFL NGGRQEDLAK PLSVGLDSNS STGTPEAAKK
       550        560        570        580        590        600
DGTMNKPTVG SFGFEINLQE NQNALKFLAS LLELPEFLLF LQHAISVPED VARDLGDVME
       610        620        630        640        650        660
TVLSSQTCEQ TPERLFVPSC TTEGSYEDVQ CFSGECWCVN SWGKELPGSR VRGGQPRCPT
       670        680        690        700        710        720
DCEKQRARMQ SLMGSQPAGS TLFVPACTSE GHFLPVQCFN SECYCVDAEG QAIPGTRSAI
       730        740        750        760        770        780
GKPKKCPTPC QLQSEQAFLR TVQALLSNSS MLPTLSDTYI PQCSTDGQWR QVQCNGPPEQ
       790        800        810        820        830        840
VFELYQRWEA QNKGQDLTPA KLLVKIMSYR EAASGNFSLF IQSLYEAGQQ DVFPVLSQYP
       850        860        870        880        890        900
SLQDVPLAAL EGKRPQPREN ILLEPYLFWQ ILNGQLSQYP GSYSDFSTPL AHFDLRNCWC
       910        920        930        940        950        960
VDEAGQELEG MRSEPSKLPT CPGSCEEAKL RVLQFIRETE EIVSASNSSR FPLGESFLVA
       970        980        990       1000       1010       1020
KGIRLRNEDL GLPPLFPPRE AFAEQFLRGS DYAIRLAAQS TLSFYQRRRF SPDDSAGASA
      1030       1040       1050       1060       1070       1080
LLRSGPYMPQ CDAFGSWEPV QCHAGTGHCW CVDEKGGFIP GSLTARSLQI PQCPTTCEKS
      1090       1100       1110       1120       1130       1140
RTSGLLSSWK QARSQENPSP KDLFVPACLE TGEYARLQAS GAGTWCVDPA SGEELRPGSS
      1150       1160       1170       1180       1190       1200
SSAQCPSLCN VLKSGVLSRR VSPGYVPACR AEDGGFSPVQ CDQAQGSCWC VMDSGEEVPG
      1210       1220       1230       1240       1250       1260
TRVTGGQPAC ESPRCPLPFN ASEVVGGTIL CETISGPTGS AMQQCQLLCR QGSWSVFPPG
      1270       1280       1290       1300       1310       1320
PLICSLESGR WESQLPQPRA CQRPQLWQTI QTQGHFQLQL PPGKMCSADY ADLLQTFQVF
      1330       1340       1350       1360       1370       1380
ILDELTARGF CQIQVKTFGT LVSIPVCNNS SVQVGCLTRE RLGVNVTWKS RLEDIPVASL
      1390       1400       1410       1420       1430       1440
PDLHDIERAL VGKDLLGRFT DLIQSGSFQL HLDSKTFPAE TIRFLQGDHF GTSPRTWFGC
      1450       1460       1470       1480       1490       1500
SEGFYQVLTS EASQDGLGCV KCPEGSYSQD EECIPCPVGF YQEQAGSLAC VPCPVGRTTI
      1510       1520       1530       1540       1550       1560
SAGAFSQTHC VTDCQRNEAG LQCDQNGQYR ASQKDRGSGK AFCVDGEGRR LPWWETEAPL
      1570       1580       1590       1600       1610       1620
EDSQCLMMQK FEKVPESKVI FDANAPVAVR SKVPDSEFPV MQCLTDCTED EACSFFTVST
      1630       1640       1650       1660       1670       1680
TEPEISCDFY AWTSDNVACM TSDQKRDALG NSKATSFGSL RCQVKVRSHG QDSPAVYLKK
      1690       1700       1710       1720       1730       1740
GQGSTTTLQK RFEPTGFQNM LSGLYNPIVF SASGANLTDA HLFCLLACDR DLCCDGFVLT
      1750       1760       1770       1780       1790       1800
QVQGGAIICG LLSSPSVLLC NVKDWMDPSE AWANATCPGV TYDQESHQVI LRLGDQEFIK
      1810       1820       1830       1840       1850       1860
SLTPLEGTQD TFTNFQQVYL WKDSDMGSRP ESMGCRKDTV PRPASPTEAG LTTELFSPVD
      1870       1880       1890       1900       1910       1920
LNQVIVNGNQ SLSSQKHWLF KHLFSAQQAN LWCLSRCVQE HSFCQLAEIT ESASLYFTCT
      1930       1940       1950       1960       1970       1980
LYPEAQVCDD IMESNAQGCR LILPQMPKAL FRKKVILEDK VKNFYTRLPF QKLMGISIRN
      1990       2000       2010       2020       2030       2040
KVPMSEKSIS NGFFECERRC DADPCCTGFG FLNVSQLKGG EVTCLTLNSL GIQMCSEENG
      2050       2060       2070       2080       2090       2100
GAWRILDCGS PDIEVHTYPF GWYQKPIAQN NAPSFCPLVV LPSLTEKVSL DSWQSLALSS
      2110       2120       2130       2140       2150       2160
VVVDPSIRHF DVAHVSTAAT SNFSAVRDLC LSECSQHEAC LITTLQTQPG AVRCMFYADT
      2170       2180       2190       2200       2210       2220
QSCTHSLQGQ NCRLLLREEA THIYRKPGIS LLSYEASVPS VPISTHGRLL GRSQAIQVGT
      2230       2240       2250       2260       2270       2280
SWKQVDQFLG VPYAAPPLAE RRFQAPEPLN WTGSWDASKP RASCWQPGTR TSTSPGVSED
      2290       2300       2310       2320       2330       2340
CLYLNVFIPQ NVAPNASVLV FFHNTMDREE SEGWPAIDGS FLAAVGNLIV VTASYRVGVF
      2350       2360       2370       2380       2390       2400
GFLSSGSGEV SGNWGLLDQV AALTWVQTHI RGFGGDPRRV SLAADRGGAD VASIHLLTAR
      2410       2420       2430       2440       2450       2460
ATNSQLFRRA VLMGGSALSP AAVISHERAQ QQAIALAKEV SCPMSSSQEV VSCLRQKPAN
      2470       2480       2490       2500       2510       2520
VLNDAQTKLL AVSGPFHYWG PVIDGHFLRE PPARALKRSL WVEVDLLIGS SQDDGLINRA
      2530       2540       2550       2560       2570       2580
KAVKQFEESR GRTSSKTAFY QALQNSLGGE DSDARVEAAA TWYYSLEHST DDYASFSRAL
      2590       2600       2610       2620       2630       2640
ENATRDYFII CPIIDMASAW AKRARGNVFM YHAPENYGHG SLELLADVQF ALGLPFYPAY
      2650       2660       2670       2680       2690       2700
EGQFSLEEKS LSLKIMQYFS HFIRSGNPNY PYEFSRKVPT FATPWPDFVP RAGGENYKEF
      2710       2720       2730       2740       2750       2760
SELLPNRQGL KKADCSFWSK YISSLKTSAD GAKGGQSAES EEEELTAGSG LREDLLSLQE

PGSKTYSK

Isoforms

- Isoform 2 of Thyroglobulin

Sequence View

Filter Information:

(REFRESH)

Directness:

Physiological Relevance:

Evidence Codes:

Methodology:

Perturbation of System:

Biological System:

Protease Assignment Confidence:

Evidence Names:

Database:

Lab:

Protein Neighborhood

Domains & Features

14 N-termini - 13 C-termini - 12 Cleavages - 0 Substrates

N-termini

Name	Sequence	Position	Evidence type	Method	Source (database)	Evidence name
P01266-1-unknown	MALVLE...	1	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt92130
P01266-20-unknown	NIFEYQ...	20	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
P01266-20-unknown	NIFEYQ...	20	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt112338
P01266-297-unknown	CPTKCE...	297	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC15865
P01266-297-unknown	CPTKCE...	297	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt149805
P01266-551-unknown	SFGFEI...	551	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3336
P01266-551-unknown	SFGFEI...	551	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt153995
P01266-570-unknown	SLLELP...	570	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4342
P01266-570-unknown	SLLELP...	570	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt154221
P01266-814-unknown	SGNFSL...	814	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3338
P01266-814-unknown	SGNFSL...	814	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt156549
P01266-1856-unknown	FSPVDL...	1856	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4344
P01266-1856-unknown	FSPVDL...	1856	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt158538
P01266-2409-unknown	RAVLMG...	2409	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5349
P01266-2409-unknown	RAVLMG...	2409	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159149
P01266-2472-unknown	VSGPFH...	2472	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5351
P01266-2472-unknown	VSGPFH...	2472	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159187
P01266-2488-unknown	LREPPA...	2488	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4346
P01266-2488-unknown	LREPPA...	2488	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159191
P01266-2507-unknown	LIGSSQ...	2507	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3340
P01266-2507-unknown	LIGSSQ...	2507	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159194
P01266-2510-unknown	SSQDDG...	2510	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5353
P01266-2510-unknown	SSQDDG...	2510	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159195
P01266-2663-unknown	IRSGNP...	2663	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4348
P01266-2663-unknown	IRSGNP...	2663	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159223
P01266-2677-unknown	KVPTFA...	2677	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5355
P01266-2677-unknown	KVPTFA...	2677	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TNt159229

C-termini

Sequence	Position	Evidence type	Method	Source (database)	Evidence name
...SGRFRC	296	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC15865
...SGRFRC	296	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt133197
...KPTVGS	550	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3336
...KPTVGS	550	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt137415
...LKFLAS	569	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4342
...LKFLAS	569	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt137642
...YREAAS	813	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3338
...YREAAS	813	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt140033
...LTTELF	1855	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4344
...LTTELF	1855	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142042
...SQLFRR	2408	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5349
...SQLFRR	2408	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142653
...TKLLAV	2471	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5351
...TKLLAV	2471	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142691
...IDGHFL	2487	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4346
...IDGHFL	2487	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142695
...VEVDLL	2506	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC3340
...VEVDLL	2506	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142698
...DLLIGS	2509	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5353
...DLLIGS	2509	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142699
...YFSHFI	2662	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC4348
...YFSHFI	2662	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142727
...YEFSRK	2676	inferred from cleavage	unknown	TopFIND	Inferred from cleavage TC5355
...YEFSRK	2676	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt142733
...KTYSK	2768	inferred from electronic annotation	electronic annotation	UniProtKB	inferred from uniprot
...KTYSK	2768	inferred from isoform by sequence similarity	unknown	TopFIND	inferred from TCt87748

Cleavages

Protease	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)
KLK13_HUMAN	296	RFRC.\|.CPTK	inferred from experiment	unknown	MEROPS	Diamandis EP	Borgono CA et al.:Defining the extended substrate... (S01.306)	17976015,
CATB_HUMAN	550	TVGS.\|.SFGF	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATD_HUMAN	569	FLAS.\|.SLLE	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATB_HUMAN	813	EAAS.\|.SGNF	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATD_HUMAN	1855	TELF.\|.FSPV	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATL1_HUMAN	2408	LFRR.\|.RAVL	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATL1_HUMAN	2471	LLAV.\|.VSGP	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATD_HUMAN	2487	GHFL.\|.LREP	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATB_HUMAN	2506	VDLL.\|.LIGS	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATL1_HUMAN	2509	LIGS.\|.SSQD	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATD_HUMAN	2662	SHFI.\|.IRSG	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,
CATL1_HUMAN	2676	FSRK.\|.KVPT	inferred from experiment	unknown	MEROPS	Dunn JT	Dunn AD et al.:Thyroglobulin processing by thy... (C01.060)	1939080,

Substrates

Substrate	Position	Sequence	Evidence type	Method	Source (database)	Source (Lab)	Evidence name	Publications (PMIDs)