MonarchBase - Protein-coding gene

DPOGS202039
Transcript	DPOGS202039-TA	1533 bp
Protein	DPOGS202039-PA	510 aa
Genomic position	DPSCF300053 - 71549-74892
RNAseq coverage	18x (Rank: top 80%)

Annotation
*Heliconius*	HMEL011721	1e-149	51.14%
*Bombyx*	BGIBMGA001276-TA	1e-146	50.87%
*Drosophila*	Cyp12a5-PA	2e-77	34.14%
EBI UniRef50	UniRef50_D5L0N6	2e-158	54.03%	Cytochrome P450 333B10 n=3 Tax=Obtectomera RepID=D5L0N6_MANSE
NCBI RefSeq	XP_001604810.1	2e-89	35.53%	PREDICTED: similar to cytochrome P450 [Nasonia vitripennis]
NCBI nr blastp	gi\|291464109	8e-166	55.60%	cytochrome P450 333B11 [Manduca sexta]
NCBI nr blastx	gi\|291464109	9e-162	55.60%	cytochrome P450 333B11 [Manduca sexta]

Group
Gene Ontology	GO:0009055	1.5e-82	electron carrier activity
	GO:0020037	1.5e-82	heme binding
	GO:0016705	1.5e-82	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.5e-82	iron ion binding
	GO:0055114	1.5e-82	oxidation-reduction process
KEGG pathway	dme:Dmel_CG6042	1e-74
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[39-507] IPR001128	1.5e-82	Cytochrome P450
	[316-333] IPR002401	1.4e-13	Cytochrome P450, E-class, group I
Orthology group	MCL10325		Insect specific

Nucleotide sequence:

>DPOGS202039-TA
ATGATCGCAATAAAGTATAACGGACCCATTATGAATAAATTATATATGAAGAATTTTATTTTTGCAACTGAAATAAATATAAGATTGGCTCATAGCTCATCGTGCAGAAAAATAAAATCATGGAAAGAAATACCAGGGCCGTCTTCATTGCCTATCATAGGACAGCTTCACCATTATTTTCCCGGCGGCTCGCTTTACCAATGCAATGGATTTGAATTTCAAGAAAAGTTATACAAAAACTACGGTCCTCTAGTAAGATTGAATACCGTATATGCTGGGAAACCCGCAATTTTTGTTTTTGATCCAGATAGCATGGCGCAGGTATTGCGTGGCGAAAATTGGCTGCCGATTCGTCCTGGTTTTGATGTATTGTATCACTATAGGAACTTTTATAACCAACCAAAAGGCGGTGCACCGGGACTCACTGGTTTAATAAGCGACCATGGTCAGAAATGGAAGCAACTGCGCTCTTTAGTTAACCCTATCATAATGCACCCAGATAACATTAAACTGTACGATACGCCCATAGGTGAAGTTGCTCAGGATGTAGTCCAAAGAATAAAGGATTTAAGGGATGAAGACGGAATGATTACAAAAAACTTCGATTATTTAATGTACCTTTGGGCTCTGGAATCTGTCGGTGTTGTGGCCTTAGGAAGTCGTTTGAATACCTTCAATGAAAACTTGGAATCGGATTCAGTTGTACGACGTCTGATAACACTTATTCATGAGTTTTTTGCAATATCTGAAAACTTAGATATCAAGCCAAGTCTATGGAGGTATTATCCAACTCCCGCATTTAAACGTGCTATGAAAGTATTTTGTGATATAGATAGTATTACAAGAAGTTTAGTACTGAAAGCAAAAGATGAATTAAGCCAAAGGGGTCATAGTGCCGATGATAAAAAGGGCGTCCTGGAAAAACTACTCGAAGTGGATGAAAAAATTGCCCTCATTATGGCCGGCGATTTACTGTTTACTGGCGTTGATACGGTTGGAAATACTATGAGTTGCACGTTGTACCTTCTTGCAAGCCATCCTGAAAAACAGAATACACTAAGACAGGAAGTTAATTCTGGAGACGAAAGGAAGTCTTATCTAAAGGCCTGCATAAAGGAGTCTTTAAGAGTAATGCCAGTTGCTGGTGGAAACATCAGACAGTGTACAAAGGAGTACAACCTTTTAGGATACGAAATACCGAAAGATATGTTTGTAGTATTTCCTCACCAGTACCTTTCGAAGATGGAAAGTCAGTATCCCAGAGCTAATGAATTTATTCCTGAAAGATGGTTGGTTGACAAGGATCACGCTCTGTATCACGGAAATGCACATCCGTTTGCATACAACCCTTTCGGATTTGGGGCAAGAATTTGTATAGGTCGTCGTATAGCGGAGTTAGAGTTAGAAAGCTTACTTTCAAAAATTATACAAAACTTCGAACTCGAATGGAGAGGTCCTCCACCGACCATGTACCAAAGTGCAATGAACTATTTCAAAGGACCCTTCAACTTTGTTTTTAAAGATATTAAATAA

Protein sequence:

>DPOGS202039-PA
MIAIKYNGPIMNKLYMKNFIFATEINIRLAHSSSCRKIKSWKEIPGPSSLPIIGQLHHYFPGGSLYQCNGFEFQEKLYKNYGPLVRLNTVYAGKPAIFVFDPDSMAQVLRGENWLPIRPGFDVLYHYRNFYNQPKGGAPGLTGLISDHGQKWKQLRSLVNPIIMHPDNIKLYDTPIGEVAQDVVQRIKDLRDEDGMITKNFDYLMYLWALESVGVVALGSRLNTFNENLESDSVVRRLITLIHEFFAISENLDIKPSLWRYYPTPAFKRAMKVFCDIDSITRSLVLKAKDELSQRGHSADDKKGVLEKLLEVDEKIALIMAGDLLFTGVDTVGNTMSCTLYLLASHPEKQNTLRQEVNSGDERKSYLKACIKESLRVMPVAGGNIRQCTKEYNLLGYEIPKDMFVVFPHQYLSKMESQYPRANEFIPERWLVDKDHALYHGNAHPFAYNPFGFGARICIGRRIAELELESLLSKIIQNFELEWRGPPPTMYQSAMNYFKGPFNFVFKDIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: