MonarchBase - Protein-coding gene

DPOGS209367
Transcript	DPOGS209367-TA	1044 bp
Protein	DPOGS209367-PA	347 aa
Genomic position	DPSCF300118 - 234438-235481
RNAseq coverage	170x (Rank: top 51%)

Annotation
*Heliconius*	HMEL013116	1e-77	62.93%
*Bombyx*	BGIBMGA005692-TA	6e-55	48.28%
*Drosophila*	CG9519-PA	1e-26	39.38%
EBI UniRef50	UniRef50_Q95NZ0	2e-51	48.47%	Ecdysone oxidase n=1 Tax=Spodoptera littoralis RepID=Q95NZ0_SPOLI
NCBI RefSeq	XP_972484.1	7e-29	33.65%	PREDICTED: similar to CG9518 CG9518-PA [Tribolium castaneum]
NCBI nr blastp	gi\|379699044	3e-52	48.28%	ecdysone oxidase [Bombyx mori]
NCBI nr blastx	gi\|379699044	1e-49	47.80%	ecdysone oxidase [Bombyx mori]

Group
Gene Ontology	GO:0016614	3.5e-34	oxidoreductase activity, acting on CH-OH group of donors
	GO:0055114	3.5e-34	oxidation-reduction process
KEGG pathway	hse:Hsero_4768	3e-26
	K00119 (E1.1.99.-)	maps->	Benzoate degradation via hydroxylation
			Limonene and pinene degradation
			Phosphonate and phosphinate metabolism
InterPro domain	[63-199] IPR007867	3.5e-34	Glucose-methanol-choline oxidoreductase, C-terminal
Orthology group	MCL30361		Lepidoptera specific

Nucleotide sequence:

>DPOGS209367-TA
ATGTCATTCAACGCGTCGAACAAAAATGTTCCCGATTTCGCCATTTACACCAGCTGCATGCCGGTGGACACGCGGTACTACGAAAGTTGTAGGAGCGTTTTAAATTTAAGTCCACATATGTGCTCGAAAATTCAAGAAGTGAATAAAAGATATGAGGTTTTCACTTTGAGCGTCGTGAATCTGAAGCCAAACTCACGAGGAAGGGTTCAACTGAAGTCAGCGGATCCTTTGGAGCCGCCTCGCATCTATTCGGGGACGTTTAGTGACCCCAGTGACTTGACGTACTATCCGGACGCGATTCGCAAAGCTTTATCTATAATCAGAACTTCATATTTCCGATCTAAGAACGCTTTCCCGTTAGACTTCAACTTGAAGAATTGTGTTTCACTATCCGACGACGAACGTTTCAAGTGCATAGCAAAGAATTTGGCCATGACGGCTTGGCATTCCGTCGGAACGGCGCCGATGGGAACAGTTTTGGATTCAAAATTAAGAGTCAAAGGTGTTTCCGGTTTAAGGGTGGCCGACGCTAGCTCGATGCCCAAAGTGATTCGAGGGAATACGAATTCCCCCGTGGTTATGATAGCCGAGAGAGCAGCAGATTTTATCAAAGAAGCTGTTGGAAAACCATACCACATGCCGACATCCGACAGCAAGCCGACGAGCTGGAAATATAAATACCCTAAACCGAACCAGAACACGCGGCCGAACATCAACAATCATCCCGAAGCAGACACCGTCGTGTACAACGACCAGAACTCATATACAAACTCCTTAAACAGTCCCAACCAATACAACAACTACCCGAACAGGTATCCCGCCTCCGGCACGAATCCCAACGGCTTGACGGGCTGGGCGGCGGTCGCTACCACGGCCATCGAGACGGTCGGGTCTGTTGTAGATTCATTCATCAAAGTGAGAATACCACAACTGGGCGGACTCATAGCGGGCAGCTACAGCAACAATCCCAAGGACGCCGGAAACATATCAAGTACTGAGAAGTACGATAGGGCGGAAACGACGACACCATCAGGGCAGCCTTAA

Protein sequence:

>DPOGS209367-PA
MSFNASNKNVPDFAIYTSCMPVDTRYYESCRSVLNLSPHMCSKIQEVNKRYEVFTLSVVNLKPNSRGRVQLKSADPLEPPRIYSGTFSDPSDLTYYPDAIRKALSIIRTSYFRSKNAFPLDFNLKNCVSLSDDERFKCIAKNLAMTAWHSVGTAPMGTVLDSKLRVKGVSGLRVADASSMPKVIRGNTNSPVVMIAERAADFIKEAVGKPYHMPTSDSKPTSWKYKYPKPNQNTRPNINNHPEADTVVYNDQNSYTNSLNSPNQYNNYPNRYPASGTNPNGLTGWAAVATTAIETVGSVVDSFIKVRIPQLGGLIAGSYSNNPKDAGNISSTEKYDRAETTTPSGQP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: