MonarchBase - Protein-coding gene

DPOGS213243
Transcript	DPOGS213243-TA	1374 bp
Protein	DPOGS213243-PA	457 aa
Genomic position	DPSCF300124 - 323070-332918
RNAseq coverage	453x (Rank: top 27%)

Annotation
*Heliconius*	HMEL003058	94.31%
*Bombyx*	BGIBMGA009522-TA	91.09%
*Drosophila*	Cyp301a1-PA	68.11%
EBI UniRef50	UniRef50_Q9V6D6	68.11%	Probable cytochrome P450 301a1, mitochondrial n=32 Tax=Neoptera RepID=CP301_DROME
NCBI RefSeq	XP_001605672.1	68.82%	PREDICTED: similar to GA21183-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|383855736	70.43%	PREDICTED: probable cytochrome P450 301a1, mitochondrial-like [Megachile rotundata]
NCBI nr blastx	gi\|383855736	70.43%	PREDICTED: probable cytochrome P450 301a1, mitochondrial-like [Megachile rotundata]

Group
Gene Ontology	GO:0009055	1.4e-85	electron carrier activity
	GO:0020037	1.4e-85	heme binding
	GO:0016705	1.4e-85	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.4e-85	iron ion binding
	GO:0055114	1.4e-85	oxidation-reduction process
KEGG pathway	dme:Dmel_CG6042	6e-66
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[18-457] IPR001128	1.4e-85	Cytochrome P450
	[258-275] IPR002401	5.1e-10	Cytochrome P450, E-class, group I
Orthology group	MCL15916		Insect specific

Nucleotide sequence:

>DPOGS213243-TA
ATGGTACCGGTGATCGGACAGTACGATATATCGGAATTCGCGAAAGTAACTAAGCTGTTTTTGGAGAAATACGGTAGGATTGTACGTTTGGGTGGATTGATAGGAAGACCAGATCTTCTGTTTGTGTATGATGCTGATGAAATCGAGAGGATGTATAGAAGAGAAGGTCCTACTCCATTCAGGCCTGCTATGCCGTGTCTCGTTAAATATAAGTCAGAAGTGAGAAAGGATTTCTTCGGGGAGTTACCTGGTGTTGTTGGAGTTCACGGCGAACAATGGCGGCGATTCCGCTCTAAGGTTCAACGACCTATACTCCAGCCCCAAACAGTGAAGAAGTATGTGACACCCATCGAGATGGTAACTGAGGATTTTATAAAATATATGGAGAAAGCGAGAGACGATAACAAAGATCTGCCGCATGAGTTTGACAATGACATACATCGGTGGTCCTTGGAATGTATCGGACGCGTAGCGTTGGACGTGCGACTTGGTTGCCTGTCACCGGATGCATCCAGCGAGGAACCGCAGCGTATTATAGATGCAGCCAAGTTCGCGTTGCGCAATGTTGCTGTACTGGAATTAAAGGCGCCCTACTGGAGATACATCCCGACCCCGCTGTGGACCAAATATGTCAATAACATGAACTTCTTCGTTGAATTATGCTCAAAATATATTAACGAAGCTCTAGAGCGTCTGAAGAGCAAGCAGGTGACATCTGAGAACGATCTGTCATTATTGGAGCGAGTGTTGCAAAGCGAAGGGGACCCCAAGATTGCCACAATAATGGCACTTGACTTAATTCTTGTCGGCATTGACACGATCTCAATGGCGGTATGTTCAATATTATACCAAGCGGCGACGAGATTGAAACAACAAGAGAAGATGGCTGAAGAAATAAGAAGAGTGTTGCCTGATCCGGATAAACCTCTCACTTACTCTGACTTGGATAAACTACATTACACCAAGGCTTTCGTTAGAGAAGTATTTAGAATGTACTCGACTGTTATCGGCAATGGAAGAACATTGCAAGAAGATGACGTCATATGTGGATATCACATTCCCAAGGGGGTACAAGTTGTGTTTCCAACGATCGTGACTGGCAATATGGAGCAATTCGTTTCCAACCCTCAGGAGTTCAGACCTGAACGTTGGTTGGAGGCCGATGGTCGATTGCATTCATTCGCTTCACTGCCTTACGGCTTCGGAGCCAGGATATGTTTGGGCAGACGGTTCGCTGATTTGGAGATACAGGTCCTTTTGGCTAAGTTGCTTCGCCGTTACCGTCTTGAGTACCACCACGAGCCGTTAGAATACGCCGTGACCTTCATGTACGCGCCCGACGGACCCTTAAGACTGAGGATGATCGAACGATAG

Protein sequence:

>DPOGS213243-PA
MVPVIGQYDISEFAKVTKLFLEKYGRIVRLGGLIGRPDLLFVYDADEIERMYRREGPTPFRPAMPCLVKYKSEVRKDFFGELPGVVGVHGEQWRRFRSKVQRPILQPQTVKKYVTPIEMVTEDFIKYMEKARDDNKDLPHEFDNDIHRWSLECIGRVALDVRLGCLSPDASSEEPQRIIDAAKFALRNVAVLELKAPYWRYIPTPLWTKYVNNMNFFVELCSKYINEALERLKSKQVTSENDLSLLERVLQSEGDPKIATIMALDLILVGIDTISMAVCSILYQAATRLKQQEKMAEEIRRVLPDPDKPLTYSDLDKLHYTKAFVREVFRMYSTVIGNGRTLQEDDVICGYHIPKGVQVVFPTIVTGNMEQFVSNPQEFRPERWLEADGRLHSFASLPYGFGARICLGRRFADLEIQVLLAKLLRRYRLEYHHEPLEYAVTFMYAPDGPLRLRMIER-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: