MonarchBase - Protein-coding gene

DPOGS211181
Transcript	DPOGS211181-TA	2904 bp
Protein	DPOGS211181-PA	967 aa
Genomic position	DPSCF300007 + 466032-470295
RNAseq coverage	31x (Rank: top 75%)

Annotation
*Heliconius*	HMEL012424	0.0	82.57%
*Bombyx*	BGIBMGA003170-TA	0.0	78.29%
*Drosophila*	Tg-PA	2e-102	34.14%
EBI UniRef50	UniRef50_D6WL52	0.0	55.75%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WL52_TRICA
NCBI RefSeq	XP_972752.1	0.0	55.75%	PREDICTED: similar to transglutaminase [Tribolium castaneum]
NCBI nr blastp	gi\|91082923	0.0	55.75%	PREDICTED: similar to transglutaminase [Tribolium castaneum]
NCBI nr blastx	gi\|91082923	0.0	55.75%	PREDICTED: similar to transglutaminase [Tribolium castaneum]

Group
Gene Ontology	GO:0018149	4.4e-28	peptide cross-linking
	GO:0003810	4.4e-28	protein-glutamine gamma-glutamyltransferase activity
KEGG pathway
InterPro domain	[352-965] IPR023608	4.3e-201	Protein-glutamine gamma-glutamyltransferase, eukaryota
	[533-630] IPR002931	7e-34	Transglutaminase-like
	[757-870] IPR013783	1e-28	Immunoglobulin-like fold
	[868-966] IPR008958	4.4e-28	Transglutaminase, C-terminal
	[100-235] IPR014756	2.4e-17	Immunoglobulin E-set
	[146-231] IPR001102	4.2e-15	Transglutaminase, N-terminal
Orthology group	MCL15537		Patchy

Nucleotide sequence:

>DPOGS211181-TA
ATGGAGACGTCAGTGGTACAAAAATCAACAGCGGCCGCTGACAAAATGACTACCAGCATGACTTCGAGCGTGACTGGAATGGGACTTGGCGGGATTACTGGGTTAACAGCTGGAATAAGTACTCTGACATGCATGAGGGAACAGCAAGTAACAATCGGAGGAATGCCGACTAATTATGTGCCCGGGTTATCTGCTAATTATAATATTTCAAGTTTCTCCCAACGGCCAGGAGAGAGCCGTCGCTGTCCGCCTGCGAAGGCTGGACCAACAGCACGATTGCAGACTGTTGGAACAAGACTAAGTCATTCTTCGAGAAACAGTCCCAATACGCAATACGCTCATAATCTCATATGTAAACTGGCCGACCAAAATGAACGTCGACGCCGTCAAGATACTATTGAGTTAATTCCTCAAAGCTATTATGCGCAACATCCGCTTAAAGTTGAACTTACAGAATTTTATTCACGTGATAATGCGAAGGATCACCACACGGATCAATATGATTTAGTTAACGATACCGTTTTACCTAATCCAGTTATTAGAAGAGGACAGAATTTCTTTTTTGCTGTTCGTTTTGATAGGACTTACGATAAACAACAAGACGTTATACGTGTTGTGTTTTGTTTTGGACCTAAGCCAGGCGTTACTAAGGGAACCCGTGTAGTATTGCAAGTTAACTGGAATACCCAACAAGGAGTTTTCCAACATCCGCGTGATGTTATTGGAATGGGCATGGGAATGGCTCGTTCTCTTCCCCAAGAACCAACTACTACTGTTGCCCCTACAGGACCAGTTAGTACTATTTGCACTGTGGGGGCAATTAGTTGTATCCGCGAGACAACAAATTATGGTGTGCGTCGCAGTTCCGTTAGTAATGATCCCTTAACAGTGTCTTCCCAAAACAGTCCCCTAAGCCCCCATTCGTCTGAGACATATACAACTCGTCCAATTATCGAACGCTATAGTGGAACATCCCAACATCCATCATTTGGACGTAGCTATGGTTCAAGACATGGATCTTCACAAAATTTGGCATCTATTGTACAGGAGACGGACAAATGGGACATAAGTATTCAACGTCAAGATGGAAACACTATTACATTCCAAGTGCACGTACCAGCTTCCGCTCCAGTTGGTATATGGAATTGTTGGATTCAAACCAATCGTTTGGGACAGCGTGATAACCGCAACGATTACAAATGCGATGAGGATATTTATGTATTATTTAATCCCTGGTGCCGTGAGGACGCGGTTTATATGGATAATGATTCGCTAAGGAAGGAATATATCTTAAATGACCAAGGAAAACTGTGGTGTGGCACTTGGCGGCAGCCTATAGGCCGCAAATGGATTTTCGGTCAATTTGATGATGTAGTTTTACCTGCTTGTATGTATTTATTGGAAAGCAGTGGACTTGAACATTCAGAACGTGGAAACCCCGTTCGTGTAGTGAGGGCGATTTCAGCAATGATAAACGCTACAAATGAAACCGATGGCTTGATTGTTGGTCGTTACGACGGCGTGTATAAAGATGGAGTAGCTCCTCACGCTTGGACAGGTTCAGTGGCTATTCTTGAACGATATCTCACCAGTGGTGGGAAGTCTGTTGAATACGGTCAATGCTGGGTATTTTCAGGTTTAGTCGTAACCATTTGTAGAGCATTGGGAATACCGTGTCGATCTGTAACAAATTACGTGTCGGCTCTCGATACGAATCGCACTTTTACTGTGGATAAATTTTTTGATCGCGATGGCAACGAGGTACCCAACGGTCCTGATGAGGACTGTTATGATTCTTGCTGGAACTTCCACGCATGGAATGACGTTTGGATGCAAAGGCCTGATTTACCACAAGGTTATGGTGGATGGCAGATAATAGATTCGACACCTCAAGAAGAAGCCGAGTCTGTCAACCAATGTGGCCCGGCGAGTGTGGAGGCTGTTCGACGCGGTGAAGTCGGTTTCCAGTTCGACACACCATTCGTTTTCTCGCAGCTCAACTCCGAGCTTTGTCATTTCCAAGAGGAAGAAAATTCCGACTGGGGCTTCGTTAGAATGGCGTCCAATCAAAACACTGTTGGACGAAAAATTATCACCAAGAATCCTAATCGCGAGGACGATGAGGGTGACGGTGATTTGTTAGAAATAACCCACGAGTATAAAACTATTGAGAGCACGTCGCCTGAACGCCTCGCCGTGATCGCTTCGTGTCGTGGCTTCCAGCGTCTGCAGCAGTACTATGAACTGCCAGATAGAAATAACGAAGACGTCCATTTTGATCTAATGGATATTGAAATCGTTCCGTACGGTCAACCTTTCGATTGTACTATGAATATTCAGAACAAGTCCAATGAGGACCGTACGATTTGGTGCGTACTCACAGCCTCATCATGCTATTACACTGGAGCTGTATCATCAAGATTGCGTCGAGCTCAAGGCGAATTCATAGTTCGTGCGGGACAGAAGGAAGTCCTCAAATTGCACGTCACAGCTCAGGAATACATGGACAAACTAGTTGACCACGCGATGGTGAAGGTGTGTGCTATGGCTTACGTGAAGCAGACGCGTCAAACTTGGTCCGATGAGGATGACTTCTCATTACACAAACCAAAACTGCAAATTCAGGTACGCGGAACACCTGCAGTGGAGCAAGAGTGTTCTGCGACGTTAAGCTTTCAGAATCCTTTAAGCGTTCACTTAACTGATTGCTATTTCAGTGTCGAAGGTCCCGGATTGCAAAGACCACGTCAGGTAAAGTTCCGAGATGTAAAACCAGGAGAGCTGGTTAGCTACCAGGAGAAGTTCGTCCCGACACGTCAGGGAGAGAGCCGTATTGTAGTGACTTTCTCATCACGAGAGATCGATGACATCATCGGCTGTACGGCGGTGACGGTGCGTGGCTAG

Protein sequence:

>DPOGS211181-PA
METSVVQKSTAAADKMTTSMTSSVTGMGLGGITGLTAGISTLTCMREQQVTIGGMPTNYVPGLSANYNISSFSQRPGESRRCPPAKAGPTARLQTVGTRLSHSSRNSPNTQYAHNLICKLADQNERRRRQDTIELIPQSYYAQHPLKVELTEFYSRDNAKDHHTDQYDLVNDTVLPNPVIRRGQNFFFAVRFDRTYDKQQDVIRVVFCFGPKPGVTKGTRVVLQVNWNTQQGVFQHPRDVIGMGMGMARSLPQEPTTTVAPTGPVSTICTVGAISCIRETTNYGVRRSSVSNDPLTVSSQNSPLSPHSSETYTTRPIIERYSGTSQHPSFGRSYGSRHGSSQNLASIVQETDKWDISIQRQDGNTITFQVHVPASAPVGIWNCWIQTNRLGQRDNRNDYKCDEDIYVLFNPWCREDAVYMDNDSLRKEYILNDQGKLWCGTWRQPIGRKWIFGQFDDVVLPACMYLLESSGLEHSERGNPVRVVRAISAMINATNETDGLIVGRYDGVYKDGVAPHAWTGSVAILERYLTSGGKSVEYGQCWVFSGLVVTICRALGIPCRSVTNYVSALDTNRTFTVDKFFDRDGNEVPNGPDEDCYDSCWNFHAWNDVWMQRPDLPQGYGGWQIIDSTPQEEAESVNQCGPASVEAVRRGEVGFQFDTPFVFSQLNSELCHFQEEENSDWGFVRMASNQNTVGRKIITKNPNREDDEGDGDLLEITHEYKTIESTSPERLAVIASCRGFQRLQQYYELPDRNNEDVHFDLMDIEIVPYGQPFDCTMNIQNKSNEDRTIWCVLTASSCYYTGAVSSRLRRAQGEFIVRAGQKEVLKLHVTAQEYMDKLVDHAMVKVCAMAYVKQTRQTWSDEDDFSLHKPKLQIQVRGTPAVEQECSATLSFQNPLSVHLTDCYFSVEGPGLQRPRQVKFRDVKPGELVSYQEKFVPTRQGESRIVVTFSSREIDDIIGCTAVTVRG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: