MonarchBase - Protein-coding gene

DPOGS207372
Transcript	DPOGS207372-TA	1155 bp
Protein	DPOGS207372-PA	384 aa
Genomic position	DPSCF300267 - 89950-96916
RNAseq coverage	27x (Rank: top 77%)

Annotation
*Heliconius*	HMEL012245	4e-86	50.33%
*Bombyx*	BGIBMGA009005-TA	1e-101	74.66%
*Drosophila*	Cyp4d1-PA	4e-37	30.15%
EBI UniRef50	UniRef50_Q7QEX2	4e-43	32.41%	AGAP000193-PA n=1 Tax=Anopheles gambiae RepID=Q7QEX2_ANOGA
NCBI RefSeq	XP_001602979.1	3e-47	34.96%	PREDICTED: similar to cytochrome P450 [Nasonia vitripennis]
NCBI nr blastp	gi\|56710314	5e-44	33.91%	cytochrome P450 CYP4G25 [Antheraea yamamai]
NCBI nr blastx	gi\|56710314	1e-43	33.45%	cytochrome P450 CYP4G25 [Antheraea yamamai]

Group
Gene Ontology	GO:0009055	2.4e-60	electron carrier activity
	GO:0020037	2.4e-60	heme binding
	GO:0016705	2.4e-60	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	2.4e-60	iron ion binding
	GO:0055114	2.4e-60	oxidation-reduction process
KEGG pathway	dme:Dmel_CG3656	3e-35
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[32-382] IPR001128	2.4e-60	Cytochrome P450
Orthology group	MCL30627		Lepidoptera specific

Nucleotide sequence:

>DPOGS207372-TA
ATGATCATCTTCCTGATGGTAGTATTCCTGTTTTGTATGTACTGGTTGTTCTGGATGTCAAATACACGGCGCATTGAGAAGTTCACGGCATCTCTCCCTATGCCCCCATCCTTACCTGTCATCGGCCATGCAGCCCTTTTCTTAGGGAACACCGAGAAAATCCTTAAAAATCTAGAAGACATAGCCTCTATCGCGCTTAAAAACAACGGAGCTGTGAAACTTTGGTTGGGCCCAAAATTATACATTGCAATCGGCAACCCTGAAGATGCCCAACTCATTTTGGAGAACTGTTTAGATAAAGATGTCGTTTATAGATTTCTGCGTCCTTGGCTAGGACAAGGCTTGTTCATTGCCCCGCTCAGACTGTGGAAGATGCACAGAAAGATTCTGTTGCCAGTGTTCCACAACAAAGTAATAGAAGAATATATCGGTGTTATATCGAAACAAGCAGACGTACTCACAGAAAGGCTGGAAGAGCAATCTGGGAAGGAGACATTCGATGTTTTAAGTTACATTTCAGCCTGCACTTTAGATATTGTTTTTGAAACGTCTATGGGTGAGAAAATGGATGTCCAACATTGGCCTGATACTCCATACCTGCGAGCTCGTCACACAGTTATGGAGATTCTTAATAAACGACTATTTAAGGTTTGGCTCCAGCCTGACTGCCTCTTCAAGCTAACCAGATACGCTAAAGAACAAAAGAAGAATATCGACCTCACTCATAAATTTACAGACGAGGTTGTTCAGAAAAGGCGTCTACAATTTGAGGCAAAGGAAGCGATTGGAATTAACAACACAAAAGATTCAGCGTACAGTAAAGTGACAATACCATCAGGCGTTGGAGCGGTTGTTGGAGCTTTTGCGATACACCGTTCAGTTGATTTGTGGGGATCAAATGCCAACGAGTTTGATCCTGACAGATTCCTTCCGGAACGTTCTAAGAATAGACACCCGTGTTCCTTTATACCTTTCAGTCATGGCTCACGGAATTGTATTGGAAGAAATTTCGGTATGATCATCATAAAAGGCATCATATCGAACGTGATCAGATCGTTTAGAATACAAGCGGATGAGGTGGGACCATTGAAAATCGAGATGCTTTTATTTCCCATTAGAGGCCATCAAATTAAGATAACTAAGAGAATGAACTAA

Protein sequence:

>DPOGS207372-PA
MIIFLMVVFLFCMYWLFWMSNTRRIEKFTASLPMPPSLPVIGHAALFLGNTEKILKNLEDIASIALKNNGAVKLWLGPKLYIAIGNPEDAQLILENCLDKDVVYRFLRPWLGQGLFIAPLRLWKMHRKILLPVFHNKVIEEYIGVISKQADVLTERLEEQSGKETFDVLSYISACTLDIVFETSMGEKMDVQHWPDTPYLRARHTVMEILNKRLFKVWLQPDCLFKLTRYAKEQKKNIDLTHKFTDEVVQKRRLQFEAKEAIGINNTKDSAYSKVTIPSGVGAVVGAFAIHRSVDLWGSNANEFDPDRFLPERSKNRHPCSFIPFSHGSRNCIGRNFGMIIIKGIISNVIRSFRIQADEVGPLKIEMLLFPIRGHQIKITKRMN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: