MonarchBase - Protein-coding gene

DPOGS211423
Transcript	DPOGS211423-TA	1527 bp
Protein	DPOGS211423-PA	508 aa
Genomic position	DPSCF300115 + 486406-488136
RNAseq coverage	2069x (Rank: top 6%)

Annotation
*Heliconius*	HMEL007568	0.0	63.71%
*Bombyx*	BGIBMGA010854-TA	1e-165	54.71%
*Drosophila*	Cyp6a2-PA	3e-79	33.27%
EBI UniRef50	UniRef50_D5L0N0	5e-165	52.45%	Cytochrome P450 6AN5 n=7 Tax=Obtectomera RepID=D5L0N0_MANSE
NCBI RefSeq	NP_001073135.1	2e-148	49.90%	cytochrome P450 6AB4 [Bombyx mori]
NCBI nr blastp	gi\|291464095	2e-164	52.45%	cytochrome P450 6AN5 [Manduca sexta]
NCBI nr blastx	gi\|291464095	7e-159	52.05%	cytochrome P450 6AN5 [Manduca sexta]

Group
Gene Ontology	GO:0009055	2.1e-104	electron carrier activity
	GO:0020037	2.1e-104	heme binding
	GO:0016705	2.1e-104	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	2.1e-104	iron ion binding
	GO:0055114	2.1e-104	oxidation-reduction process
KEGG pathway	nvi:100114023	8e-86
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[25-508] IPR001128	2.1e-104	Cytochrome P450
	[300-317] IPR002401	3.9e-24	Cytochrome P450, E-class, group I
Orthology group	MCL10682		Insect specific

Nucleotide sequence:

>DPOGS211423-TA
ATGTTTTTAATAATATTGGCCTGTCTTGTTGCGTTGTATTTCTACACAACTAGAAATCATAGGTACTGGGCTAAGAAAAACATAAAACATGAACGTCCAATACCTCTGTTCGGGACGCATTTCCGGAATATAGTGGCGTTGAAAAGTGCCAGTGAACTAATACATGAATTTTACGTCAAGTTTGGTGATGAAAAGGTTATAGGAGCTTACCGCGGTAACGACAAGGAGCTGATTGTCAAGGATCCAGACATAATAAGAGACATTTTAATGGTCGACTTCAACAGTTTTCACAATCGAGGCTTAGGCAGGGATCCGGAAAAGGAGCCTCTGCTGAAAAATCTCTTCCACGCCGAGGACGACTTATGGAAATTGTTGAGACATAAATTAACACCAGCATTCACAACAGCGAAACTAAAGTCTATGTTCCCTCTTATAGTCAATTGTGCGGAAAAGTTGGTTGGCCTGGGAGAGAATATCATCGCTAAAGGTGGAGATTGTGACATACGAGAAGTTATGGCGAAATTCACAACTGAGTTTATAGGCGCTTGCGGCTTGGGAATCGAAATGGACACCATCAATAATGAAAGCTCTATATTTAGACAAATAGGAAAGAAAATGTTTTCACGGTCAGACATGGAAGTGTTTCTGTTTGCCGTATGGGACGTCTTTCCGGAAATAAGAAACCTTATGAATCTCTCCAACAAAAAAGTTGAACAGGTTTTTTTTGATATGGTGACAAAAATCTTCGAGCAGCGAAATTATAAACCTATTGGCAGAAATGATTTTGTCGACCTGTTGTTAGACTATTTATCTCAAGGCAAAATACAGAGCGAATCTATTAAATACAAAAACCCGGACGGCACAGCGAAACAGGTCGAAATGGAAATGGATATCGAGGTCTTGGTCGCACAGGTGTTTGTTTTCTTTGCAGCTGGATTTGAAACATCCTCTTCTACGACCAGTTACACGTTACACGAATTAGCTTACCATCCCGAAACACAGAAGAAAATTCAAGACGAAATAGATCGAGTTTTATCAAAATACGACAACAAGTTGTGTTATGATGCTGTTAATGAAATGACGCTATTAGATATGGCCATGAAAGAGGCGTTGAGGATAATGCCGGCCGTGGGGATCCTCAACAGGCAATGCGTTAAGCCATACACCATAAAACAAGTAGGACTAACTATAGATCCCGATGTCAATATAGTTATTCCTGTACAATCGCTGCATTTAGATGAAAAGTATTTTGATGAACCTTATGAATTCAAACCAGAAAGATTTGCCGACGAGGATTTTAACCAACGGACCAAGAACGTATACTTGCCTTTTGGTGCCGGACCGCGTGCTTGTATTGGTGCTCGTTTAGGACAGATGCAATCTCTGGCTGGACTAGCTGTGATGCTTCACAACTTTTCTGTCGAACCTTCGGAAAACACAAAGAGAACTTTAGACATCAACCCACGTCTTAATGTCGTACAAGGAGTACTACACGGGGTGCCGATTAAACTAGTAAAGAGAAAATAA

Protein sequence:

>DPOGS211423-PA
MFLIILACLVALYFYTTRNHRYWAKKNIKHERPIPLFGTHFRNIVALKSASELIHEFYVKFGDEKVIGAYRGNDKELIVKDPDIIRDILMVDFNSFHNRGLGRDPEKEPLLKNLFHAEDDLWKLLRHKLTPAFTTAKLKSMFPLIVNCAEKLVGLGENIIAKGGDCDIREVMAKFTTEFIGACGLGIEMDTINNESSIFRQIGKKMFSRSDMEVFLFAVWDVFPEIRNLMNLSNKKVEQVFFDMVTKIFEQRNYKPIGRNDFVDLLLDYLSQGKIQSESIKYKNPDGTAKQVEMEMDIEVLVAQVFVFFAAGFETSSSTTSYTLHELAYHPETQKKIQDEIDRVLSKYDNKLCYDAVNEMTLLDMAMKEALRIMPAVGILNRQCVKPYTIKQVGLTIDPDVNIVIPVQSLHLDEKYFDEPYEFKPERFADEDFNQRTKNVYLPFGAGPRACIGARLGQMQSLAGLAVMLHNFSVEPSENTKRTLDINPRLNVVQGVLHGVPIKLVKRK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: