MonarchBase - Protein-coding gene

DPOGS205609
Transcript	DPOGS205609-TA	1320 bp
Protein	DPOGS205609-PA	439 aa
Genomic position	DPSCF300167 + 235541-237955
RNAseq coverage	24x (Rank: top 78%)

Annotation
*Heliconius*	HMEL017463	1e-129	50.91%
*Bombyx*	BGIBMGA003944-TA	9e-59	30.00%
*Drosophila*	Cyp6g2-PA	1e-66	32.80%
EBI UniRef50	UniRef50_D5L0N3	4e-81	39.09%	Cytochrome P450 332A5 n=4 Tax=Ditrysia RepID=D5L0N3_MANSE
NCBI RefSeq	NP_001108340.1	2e-77	37.56%	cytochrome P450 CYP332A1 [Bombyx mori]
NCBI nr blastp	gi\|291464101	1e-80	39.09%	cytochrome P450 332A5 [Manduca sexta]
NCBI nr blastx	gi\|291464101	3e-78	38.50%	cytochrome P450 332A5 [Manduca sexta]

Group
Gene Ontology	GO:0009055	8.7e-101	electron carrier activity
	GO:0020037	8.7e-101	heme binding
	GO:0016705	8.7e-101	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	8.7e-101	iron ion binding
	GO:0055114	8.7e-101	oxidation-reduction process
	GO:0004497	4.4e-07	monooxygenase activity
KEGG pathway	nvi:100118363	2e-68
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[7-436] IPR001128	8.7e-101	Cytochrome P450
	[62-82] IPR002402	4.4e-07	Cytochrome P450, E-class, group II
Orthology group	MCL10231		Insect specific

Nucleotide sequence:

>DPOGS205609-TA
ATGTATGAACATTTCAAATCTCCGTACATAGGGATCTGGTTAATATGGAAACCAGCTTTAATTATAAACGACCCAGAAATCGCTCGGCGAATATTAGTTAAAGATAGTTTGATTTTTAGAGACAGGTATTTGAGTTCTGGAAGCAGCGACCCTATCGGAGCACTTAATTTGTTTACTGTTAATGATCCTGTGTGGACCAGCATTCGTCGTAAATTATCTAATGTATTCACTGTAGCTAAGCTCAAGGCCCTCCACCATTATACTTTGAGTAAAGTTGAAGAGCTGATGAGAAGAATCGAAAGAGATCGTGAAAAAGGTTTAGAACTTAAGAGACTTTTCGTTGATTACACAACAGATGTTACTGGAACATTTTCTTTCGGTATTGAAAGTAATGCAACTCTTACATCTAAGGGCCCTTTGAGGGAAATCACCGCTGACTTTGGAAAATTCAGTATATATAGAGGAATATGTTGGTTCAGTATATTCTTTTGGCCAGACCTAGTTGACATATTTAGATTTACAATGTTCCCAAAGAAATCGATGCATAGCTTTAAAAGAATATTTGAAACCACTTTAAATCGGCATAGCAACGACATCGGAGGCAAAGATTTCAAAGATATAGTCGATGGTCTTATAGAGTTTAAAAAAGAAAAAGAACAGAAGCATCAAGAAGTGTCCGACGAATTTTTGATTGCACAAGCAGCAATCTTGTTATTTGGTGGTTTTGATACAACTGCAAGTAACTTAACGTATATGACGTATGAACTAGCTTTTAACAGCGAGTGCCAGGAAAAGTTATATAATGAACTCAAGGAAGCTGAAGAAAGAAATGGAGGAAATTTCGACGCTGACACCGTGTCTGAATTAACTTATCTGAATTGTGTTTTAAAAGAATGCCTCAGAAAATATCCGCCAATGGGCTGGCTCGATAGAATAGCCGCTACGGACTATAAGATTGACGATAAATTGACCATCAAAGCTGGTACAGTAGTTTATGTGAACTCTATTGGTTTTCATTATGATCCAAAATACTTCCCCGAGCCTACAAAATTTAATCCTGATAGATTTTTACCAGAAAATATCAACAAAATTAAGCCATATACGTTTTTACCGTTTGGAGACGGACCAAGAGTGTGCATAGGTCAAAGATTTGCCATAATGACTGCACGAACAGCTGCGTCACAGCTGTTTCTAAAATACAAGGTTCGACCGCTCCCCAATACTCCTGCACCTAATGACGCCAAAATCGACTGTAAAGGCCTTTTGTTGCATCCCGGAGAACCAATGCGTGTTGAGTTTATTCCGAGATCGATAAAGTAA

Protein sequence:

>DPOGS205609-PA
MYEHFKSPYIGIWLIWKPALIINDPEIARRILVKDSLIFRDRYLSSGSSDPIGALNLFTVNDPVWTSIRRKLSNVFTVAKLKALHHYTLSKVEELMRRIERDREKGLELKRLFVDYTTDVTGTFSFGIESNATLTSKGPLREITADFGKFSIYRGICWFSIFFWPDLVDIFRFTMFPKKSMHSFKRIFETTLNRHSNDIGGKDFKDIVDGLIEFKKEKEQKHQEVSDEFLIAQAAILLFGGFDTTASNLTYMTYELAFNSECQEKLYNELKEAEERNGGNFDADTVSELTYLNCVLKECLRKYPPMGWLDRIAATDYKIDDKLTIKAGTVVYVNSIGFHYDPKYFPEPTKFNPDRFLPENINKIKPYTFLPFGDGPRVCIGQRFAIMTARTAASQLFLKYKVRPLPNTPAPNDAKIDCKGLLLHPGEPMRVEFIPRSIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: