MonarchBase - Protein-coding gene

DPOGS211791
Transcript	DPOGS211791-TA	1452 bp
Protein	DPOGS211791-PA	483 aa
Genomic position	DPSCF300107 + 382751-386503
RNAseq coverage	7x (Rank: top 86%)

Annotation
*Heliconius*	HMEL007941	0.0	73.98%
*Bombyx*	BGIBMGA004097-TA	0.0	73.66%
*Drosophila*	Cyp49a1-PD	9e-125	44.42%
EBI UniRef50	UniRef50_Q9V5L3	1e-122	44.42%	Probable cytochrome P450 49a1 n=17 Tax=Endopterygota RepID=C49A1_DROME
NCBI RefSeq	XP_002068865.1	5e-125	44.72%	GK18006 [Drosophila willistoni]
NCBI nr blastp	gi\|195442238	1e-123	44.72%	GK18006 [Drosophila willistoni]
NCBI nr blastx	gi\|195442238	4e-118	44.81%	GK18006 [Drosophila willistoni]

Group
Gene Ontology	GO:0009055	2.9e-73	electron carrier activity
	GO:0020037	2.9e-73	heme binding
	GO:0016705	2.9e-73	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	2.9e-73	iron ion binding
	GO:0055114	2.9e-73	oxidation-reduction process
KEGG pathway	dme:Dmel_CG15077	6e-60
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[10-478] IPR001128	2.9e-73	Cytochrome P450
	[242-259] IPR002401	3.1e-11	Cytochrome P450, E-class, group I
Orthology group	MCL24985		Lepidoptera specific

Nucleotide sequence:

>DPOGS211791-TA
ATGGGTGTTGCGCGCAAGTTCGCTACTATACCGGGGCCCAGGCCCCTTCCTATACTTGGGAACTCATGGCGTTTTGCTATAGGACAGAGGCCATGGCGTACACGATCCTTGGACGCGACTTTGTGGAATCTGAGAGCCTTAGCCGGTATGGGGGGAGCAGCAAAAGTCGCCAAACTTTTCGGTCACCCTGACTTAATTTTTCCCTTTTGTGCTGATGAAACCGCCAAGATTTACAGACGTGAGGATACTATGCCACATAGAGCGGTTGCACCCTGCTTGAGACATTACAAGCAGGAATTAAGAAAAGAGTTTTTCGGAGATGAACCCGGTTTGATTGGAGTTCACGGCACTGCCTGGTCAACGTTCAGGTCTAAGGTTTCGAAGGCCCTTGCGGCACCTCAAGCGGCACAAGTCGCTGTACCATCGCTCGACTGCGTATCAAACGATTTTGTTCACAGAATGGAGAGTATTTTGGATCATAATAGAGAGCTGCCGTGTGATTTTTTAACTGAGCTTTATAAATGGGCACTCGAATCTGTCGGAGCTTGGGCTTTGGGAACAAGACTTGGATGTTTGAAAGATAATGATACTGATGCCATGGAAATTATAAACAATATCCACGGTTTTTTTCACAGCGTACCAGAATTGGAATTGAATCTCTGCTTGAAGAGATTGACGGATAAAGGGGTTTGTGCCCAAATTGCTTTGAATTCTGGTGAAAAGGTCGCCACTATTCTGGCTTTGGATTTGCTACTGGTTGGTGTGGATACAACAGCGGCAGCTGCGGCAAGTACTATGTACTTATTAGCGACTAATCCCAGGGCTCAAAGGAGATTACAAACTGAACTAGACATAAACATGCCGACTGATAGATCAATGAATCACAGGGATTTAAATAATCTACCATATTTAAAAGCTTGTATAAAGGAGGCTTTGCGTATAAAGCCTGTTATTCTTGGAAATGGACGCTGCATACAATCAGATGCTGTTATAGCTGGATATGAAGTTCCAAAAGGGTCCCATATAGTCTTCCCCCACTACGTCATGTCGAATGAGGAACGATATTTTCCGTCACCAAACGAATATATTCCCGAGCGTTGGTTACGAGATGACACCAATAAGGCAGGAACAGTTATACCAAATATTTCCAATGAGAAACACATAGAGGCAGCTAGATCGGTCTGTGAACACGCTGGAGTCGCATCTGTGGTGAAGAAACAAAGGGATATTGGGATACACCCGTTTGCTTCATTACCATTCGGTTTTGGAAGACGTATGTGTATCGGGAAGAGGTTCGCTGAAGCCGAACTACAGCTTCTAATCGCCAGGGCGTTCCAGAAGTATAATGTGTCCTGGTATCATGGTGAACTGACTTACAGTGTCACCCCCACGTATATACCGAACGAACCGCTGCGATTCAGATTGGATTCCAGGACAAAGAAATTAACATAG

Protein sequence:

>DPOGS211791-PA
MGVARKFATIPGPRPLPILGNSWRFAIGQRPWRTRSLDATLWNLRALAGMGGAAKVAKLFGHPDLIFPFCADETAKIYRREDTMPHRAVAPCLRHYKQELRKEFFGDEPGLIGVHGTAWSTFRSKVSKALAAPQAAQVAVPSLDCVSNDFVHRMESILDHNRELPCDFLTELYKWALESVGAWALGTRLGCLKDNDTDAMEIINNIHGFFHSVPELELNLCLKRLTDKGVCAQIALNSGEKVATILALDLLLVGVDTTAAAAASTMYLLATNPRAQRRLQTELDINMPTDRSMNHRDLNNLPYLKACIKEALRIKPVILGNGRCIQSDAVIAGYEVPKGSHIVFPHYVMSNEERYFPSPNEYIPERWLRDDTNKAGTVIPNISNEKHIEAARSVCEHAGVASVVKKQRDIGIHPFASLPFGFGRRMCIGKRFAEAELQLLIARAFQKYNVSWYHGELTYSVTPTYIPNEPLRFRLDSRTKKLT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: