MonarchBase - Protein-coding gene

DPOGS215049
Transcript	DPOGS215049-TA	4422 bp
Protein	DPOGS215049-PA	1473 aa
Genomic position	DPSCF300208 - 50432-71234
RNAseq coverage	205x (Rank: top 47%)

Annotation
*Heliconius*	HMEL002000	62.12%
*Bombyx*	BGIBMGA005680-TA	61.73%
*Drosophila*	CG42331-PD	53.34%
EBI UniRef50	UniRef50_E2BAM2	58.49%	Peroxidasin-like protein n=1 Tax=Harpegnathos saltator RepID=E2BAM2_HARSA
NCBI RefSeq	XP_001607719.1	58.97%	PREDICTED: similar to oxidase/peroxidase [Nasonia vitripennis]
NCBI nr blastp	gi\|383865743	52.93%	PREDICTED: uncharacterized protein LOC100875470 [Megachile rotundata]
NCBI nr blastx	gi\|383865743	48.06%	PREDICTED: uncharacterized protein LOC100875470 [Megachile rotundata]

Group
Gene Ontology	GO:0006979	5.2e-186	response to oxidative stress
	GO:0020037	5.2e-186	heme binding
	GO:0004601	5.2e-186	peroxidase activity
	GO:0055114	5.2e-186	oxidation-reduction process
KEGG pathway	tgu:100218312	9e-96
	K00431 (TPO)	maps->	Cytokine-cytokine receptor interaction
			Autoimmune thyroid disease
			Tyrosine metabolism
			Hematopoietic cell lineage
			Jak-STAT signaling pathway
InterPro domain	[408-986] IPR010255	5.2e-186	Haem peroxidase
	[562-957] IPR002007	8.4e-179	Haem peroxidase, animal
	[438-449] IPR019791	1.5e-39	Haem peroxidase, animal, subgroup
Orthology group	MCL15629		Insect specific

Nucleotide sequence:

>DPOGS215049-TA
ATGACACGCCGTAGCCTTATGGTGTCCACGAGGCATAAAAACATAATCATCGTCTTGTTTATATTAATCACCGCTGATTGCAAGACAACCAACAGCAAATCGGATGTTGAAAACACAACACACAACTGTCCCTTCACGAGAATCATCGAAGACATTTTCAACACTAAAAGAACGCCATCAAATGCACCGTACTGGAAGGAGAGAGACGCCGAGCTGTTCGTTAACGCGACCAGCTTCTTTGAAACGAACCAAAATATAAGCAAATCCATTCAAGAGGAGCTAGTCAATGACATAATAGCTTCTATCAAACGAATCAAAGCAAATCTGTCAACATCTGACGACAATAATAAACTCAACGAAGCGATAATTATAGCACCCGAACATAACGAAGACAATCATCATACGGACAAAAAAGTGACTCAAATAAAGAGTGGTATAGAGGACAAAACTGATATTCAAATGTCCGAACCAAAACAAAATAAAGAACAAAGGATCACGAAACAAACAGAGAAGCCTGACAGAAATACCTTTGTTGAAGTATTGACTATAGAACCTAACAACACGAAGTCTAATACGTATTCAATTTTAGATGTCCTAAAAAATCTAATGCCCAAACTGAACGCATCGATATCGAAGGATCTTCAGAGCATCACCATCATAGAGAAAAATCAAAATAAAAACCTCTCCGTGTCCGAAACGAAAAACGTGTCGACAATAGTTATTAAGTACTGCGATAAAGATAACTTGACGGAGACCATTAACACGGGGGACGATGAAAACAAAGGCGACGTTAAAACATTGATTGGACATGATGATAGTGACGATGAAGAGGATTATGGAGAAATAGCCGATGATAAGAGCTATAACAGAAGTCTCACAGAGAGCAGGAAAGATATATTGGAAGCTGCGAAATATGGAATGGAGAAAATGCATGAACTGTATGGTGTGTTAGAGCCAAAACTCTATTCTATGGGTCTCGTATTGGACGAAAAGGACCCAGCACGTTACGTGGCTGCCTTTAATGCACCATCAGAGAACGCTGACACATACGCCAAGTATGGATACGCGTCTCTCCAGGCATCAGCGAGGTTCAGGGAACTAGCCAGCGTTGACAGTGACAATCTTGAGAGTCGATCGGAAGAAAACCAGTTTCCTGATGCGAGCTCCCTGCGCCAGTCCCCACTAGTTCAACAATGTCCCCTTCGAGGCGCTCCCAAATGTCCGCCAGCATCCAAAAGATATCGCACTCACGATGGTACTTGCAACAACCTGAGTCGGCCTCGCTGGGGTGCCACCATGACCCCGGTACAGCGGTTCCTTCCACCAGTTTACTCCGATGGTATTCAAGCACCAAGGAAATCAATTTTCGGCTCTACCTTACCTTCAGCCAGAGAAATCAGCGCGCTAGTACACGAGGACAAGGATTCTGAAAATTCTGGAATAACGCATTTGCTCATGCAGTGGGGTCAATTTCTGGACCACGACATAACGTCTTCCTCCCAGTCCCGAGGGTTCAACGGTTCAGTGCCGCGGTGCTGCAAGGACGGAGGAAGAGACTTCATACCTCAAGAGTTCATGCACCCGGAATGTCTTCCGATCGCCGTCCCACCCTCGGATCCCTTCTACGGTCCCCGCGGTGTTCGTTGCCTGGACTTCGTTCGATCGTCTCCGGCGCCGCGGGAGGACTGCGCCCTCGGCTGGAGGGAACAGTTCAACCACGTGTCCTCGTACATCGACGGATCACCACTTTACGCCAGCTCCGCGAGACAGTCGGACAGGTTGAGACTGTTCAGGAATGGTATGCTGCAGTATGGGCGGGTGCAGCAGCGCCGTCCTCTGCTGCCGGCTGAACGTGATGAGTTGTGCCGCGGGGGCGCTCTATCCACGGACTGCTTCAAGTCGGGGGACGCGCGGGTCAATGAACACCCCGGTCTCGTCGCCAAACACATCGTCTGGCTCAGACAACATAACCGAATGGCCCAGGAACTGGCGCACCTTAACCCTCACTGGAGCGATGAAAAAATTTATCAGGAAACTCGAAAAATAGTGGGAGCTATGATACAACACATTACTTACAGGGAATTCCTACCGATCGTTTTGGGTCCTGAAGTGATGCGTCTTTTTGAGCTGGAGCTTCTTCCGAAGGGCTATTTCAAGGGCTACAGCGCCAAGACCAATCCGAACCCAGCCAGTTCTTTCGGTACAGCCGCTTTCCGCTTCGGACACAGTCTGGTTCAGTCGTCGATGATGCGCTTTGATAAGTTCCACAGACCGATCAATAACAACGTTTCCCTCCACGCGGAGCTTACAAACCCGTCCAACATCTGGAGCGTGGGTGCCGTGGACCGACTGCTGCTGGGGATGCTGAACCAGCACATACAGAAGAGGGACGAATTCATTACGGAAGAACTCACCAACCACTTGTTTCAAACCAATCACTTCAACTTTGGGATGGATTTGGCTGCTATTAACATCCAGCGAGGAAGAGACCACGGGGTGCCGCCGTATACCGCGTGGAGGGAGCCCTGCGGACTGACGCCCATCACGGACTTCGATGACTTAGTGAGGGTGATGCCGGCACGGGTCGTGAGGAAGTTGAAGGTGTTATACAGACACGTGGATGACCTGGACCTGTTCACGGGCGGCGTGTCCGAGCGCCCCGTGGCAGGCGCCCTCGTCGGGCCGGTGTTTGCATGCATCATAGCTCAACAGTTCGCAAACTTACGGAAAGGGGATCGCTTCTGGTACGAAAATGGTGGTTTCGATTCATCTTTCACTCCGGCTCAATTGCAACAGATAAGACGAATATCTCTGTCACAGGTCCTTTGTAGTACTCTGGACTCAATAGATAACATACAACCTTTCGCTTTCCTCTCACATGAAAATCCAAAAAATGACAGGATATCATGCCGTAATGGCTTACTTAACAATTTTGACCTATCCGCTTGGATCGAATTACATTCAGACTCAAATAATATTAAGAAATCTGACGAAAATCAACAGAGTTCTAAGACGAAAACCAAGCGAACAACCGTGAGACCGACCACGACAACTAAACATCCCCAAAAACTATCTCAAACTTTGACTCAACAAAAATCTGAAAAATTTAGACTTAATAATATGACAGAGACCGATGACACTGATAAAGACAAAGACAAAAACGCAGACGATGAACCGACTGGGATCAAACCTAACGCTACAGTAGTTATAGACGATAAACTAGACTTTAGAAACAAATCACGACGCTTTACCGACTTCGACGACGAGAGAAACCCCCCGACTAGACAATACAATGACTATTATGATGACGTACAAAGCGTACAATCAGTTGTTATCAACAACATACCAAATAACAGACCAAACAGACGACCTTACATATCCGTTACTGAGAATATTGCTGACAAATACACGTATCTTATTAACTATGTTCCCCGACCGACTCACTCCTGGCGGCAGACCACTAGACGTTCTCACGATCGTGACGTTGTTAAAGTCACATATCAGACTTACGAAGACACTTACGGCCGTCCAAACAGACCTTACTTCAACAGAGACGAACTTGACAATGACTTTGAATCGCGGCAACAGAAGCCTGTGACGGAAAGCTTCCAGTCATCAGCCAGATCGATTGACAACGAAGCACCGACTCCACAGTTGAAGTTATCAACTGAGAGCTCAGTGCAGACTGAAAAAAACAGACCAATAGATACACAGACAGACAAAACTGACTCAACAACAGAAAATTTGTACAAACTTTTAACTTTTGGTTATGTAGGAACTTATAAACGAGACAAGATTGTAAATGATGACACTAAAGACTCGAAAGACAATACGAACAAACATGACTCTGGCGACCATAACGTCAGTTTAGACTTCTCGACCGTAGTAAACAATGAGACGGACGATGATGACAAACAAAACGTAAAACTTTCAACTTTCATAGTTTACGATACAGCCACTAAACCTTACCTGACCAGCTCACAGAGACCGACGAGACGTAACGATGACGAGACCACGGAAAAGAAAGACAAATATTATTTCATTCAAAACGTCTTACATAAATACTCTGAAACAAAGAGCGACGACCTCAAGAAAACGAGCAGCGGAAAAGATAAAAACAACACTGACCAATACATAGGAATCGAGGAGAGGTTAGGCAACGACAGCTTGGACGATGACGAGAGACCAGTGAATGTGAGAGCGAAAATAAAATCAAGAAAACCATCGAGTTCAGCGAAAACTCCATCGGTCGCTTTTCAAATTATTCCTAGCGAAAACAATCCATCACAATGGGCGGTTTATGAGGAGAAAGAAGATCTTTCGGGGCAAATACCACAGATGCCAAGCATTAAGATCGACCCACACGCTCTACGGGAAGTGCCAAGACCTATGAATTTCGGTTTTAGAAAACGACACGGATAA

Protein sequence:

>DPOGS215049-PA
MTRRSLMVSTRHKNIIIVLFILITADCKTTNSKSDVENTTHNCPFTRIIEDIFNTKRTPSNAPYWKERDAELFVNATSFFETNQNISKSIQEELVNDIIASIKRIKANLSTSDDNNKLNEAIIIAPEHNEDNHHTDKKVTQIKSGIEDKTDIQMSEPKQNKEQRITKQTEKPDRNTFVEVLTIEPNNTKSNTYSILDVLKNLMPKLNASISKDLQSITIIEKNQNKNLSVSETKNVSTIVIKYCDKDNLTETINTGDDENKGDVKTLIGHDDSDDEEDYGEIADDKSYNRSLTESRKDILEAAKYGMEKMHELYGVLEPKLYSMGLVLDEKDPARYVAAFNAPSENADTYAKYGYASLQASARFRELASVDSDNLESRSEENQFPDASSLRQSPLVQQCPLRGAPKCPPASKRYRTHDGTCNNLSRPRWGATMTPVQRFLPPVYSDGIQAPRKSIFGSTLPSAREISALVHEDKDSENSGITHLLMQWGQFLDHDITSSSQSRGFNGSVPRCCKDGGRDFIPQEFMHPECLPIAVPPSDPFYGPRGVRCLDFVRSSPAPREDCALGWREQFNHVSSYIDGSPLYASSARQSDRLRLFRNGMLQYGRVQQRRPLLPAERDELCRGGALSTDCFKSGDARVNEHPGLVAKHIVWLRQHNRMAQELAHLNPHWSDEKIYQETRKIVGAMIQHITYREFLPIVLGPEVMRLFELELLPKGYFKGYSAKTNPNPASSFGTAAFRFGHSLVQSSMMRFDKFHRPINNNVSLHAELTNPSNIWSVGAVDRLLLGMLNQHIQKRDEFITEELTNHLFQTNHFNFGMDLAAINIQRGRDHGVPPYTAWREPCGLTPITDFDDLVRVMPARVVRKLKVLYRHVDDLDLFTGGVSERPVAGALVGPVFACIIAQQFANLRKGDRFWYENGGFDSSFTPAQLQQIRRISLSQVLCSTLDSIDNIQPFAFLSHENPKNDRISCRNGLLNNFDLSAWIELHSDSNNIKKSDENQQSSKTKTKRTTVRPTTTTKHPQKLSQTLTQQKSEKFRLNNMTETDDTDKDKDKNADDEPTGIKPNATVVIDDKLDFRNKSRRFTDFDDERNPPTRQYNDYYDDVQSVQSVVINNIPNNRPNRRPYISVTENIADKYTYLINYVPRPTHSWRQTTRRSHDRDVVKVTYQTYEDTYGRPNRPYFNRDELDNDFESRQQKPVTESFQSSARSIDNEAPTPQLKLSTESSVQTEKNRPIDTQTDKTDSTTENLYKLLTFGYVGTYKRDKIVNDDTKDSKDNTNKHDSGDHNVSLDFSTVVNNETDDDDKQNVKLSTFIVYDTATKPYLTSSQRPTRRNDDETTEKKDKYYFIQNVLHKYSETKSDDLKKTSSGKDKNNTDQYIGIEERLGNDSLDDDERPVNVRAKIKSRKPSSSAKTPSVAFQIIPSENNPSQWAVYEEKEDLSGQIPQMPSIKIDPHALREVPRPMNFGFRKRHG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: