MonarchBase - Protein-coding gene

DPOGS213244
Transcript	DPOGS213244-TA	1635 bp
Protein	DPOGS213244-PA	544 aa
Genomic position	DPSCF300124 - 304187-322649
RNAseq coverage	61x (Rank: top 68%)

Annotation
*Heliconius*	HMEL007856	0.0	76.29%
*Bombyx*	BGIBMGA009523-TA	0.0	82.05%
*Drosophila*	Cyp49a1-PD	2e-137	45.35%
EBI UniRef50	UniRef50_G6CJV5	0.0	100.00%	Cytochrome P450 301B1 n=2 Tax=Neoptera RepID=G6CJV5_DANPL
NCBI RefSeq	NP_001164234.1	5e-163	56.85%	cytochrome P450 301B1 [Tribolium castaneum]
NCBI nr blastp	gi\|383855734	3e-165	57.62%	PREDICTED: probable cytochrome P450 49a1-like [Megachile rotundata]
NCBI nr blastx	gi\|383855734	3e-159	57.83%	PREDICTED: probable cytochrome P450 49a1-like [Megachile rotundata]

Group
Gene Ontology	GO:0009055	1.2e-98	electron carrier activity
	GO:0020037	1.2e-98	heme binding
	GO:0016705	1.2e-98	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.2e-98	iron ion binding
	GO:0055114	1.2e-98	oxidation-reduction process
KEGG pathway	dme:Dmel_CG6042	2e-77
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[76-544] IPR001128	1.2e-98	Cytochrome P450
	[346-363] IPR002401	1.8e-16	Cytochrome P450, E-class, group I
Orthology group	MCL11627		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213244-TA
ATGGCAAGTTCACGAGTAACAATGAGACATAGTCTCAACATCGTGAGATGGCCTCTACGTGTCTGCAAACGGAGACTGGCGTCACAGCAGCGAGCTGTTGCTACCGATGGCGAAACTGGTAAAATATCACATTTGCAAATATGCCCGGCGAAAGGTCACAGGGCGAGATCAACTCAGGCTGTGGCGCCCCTCGAGTCAATCGCGTCAGTAAAACCCTGGGAAGAAGTTCCAGGGCCTAGACCACTGCCACTATTAGGAAACACTTGGAGATTCATACCATATATTGGTGGGTATTCAGTAGAGCATGTCGACAAAGTGTGTCTGTCTTTGCGTCAGGAATATGGAGATTGCGTCAAAATGGAAGGTCTGCTTGGTAGACCGGATATGCTGTTCGTTTTTGATGCGAGCGAAGTTGAACGAGTCTTTAGAGGAGAGGATTCGGCCCCTCATAGACCATCAATGCCCTCGTTGAACTATTACAAACACACATTGAGAAAAGACTTCTTTGGTGCCGAGAAGGACTGTGCCGGAGTTATTGCGGTTCATGGAGATTCCTGGTCAGCTTTTCGGACTAAAGTATCCCGTGTCGCTCTCAGCGCTGGCGCCGCAGCTCAATACACCGACCAAGTTGGGGAGGTAGCTGATGCTTTTGTTAAAAGGCTACGAAAAATAAGAAATGAAAGGAAAGAAACGCCGGACGACTTTCTAAATGAAGTTCATAAATGGTCATTAGAATCGTTAGGACTTATAGCGTTAGACACGAGGTTAGGCTGTTTGGAACAGCACGAGGGTTCGGAGACTCAGCAGCTTATAGATGCTGTGAATACTTTCTTCTTGTGTGTTGGCGAGTTGGAACTCAAGGCACCATGGTGGAGACTCTACCCCACGGCCATGTTCAAGAGATATGTAGCGGCCTTAGACACCATACTTAGTGTTACTCAGTCTCATGTCAGTCGTGCCTTAAAGGAATGTCAAGCTAACCCAAATGGCAGTAAATCTCTTCTCCAAGACCTAGTATCAGCAGCCGGACCTCGTGTTGCAGCAGTAGCAGCACTTGACATGTTCCTTGTGGGCATTGATACGACGTCGAATGCTGTAGCCTCAACTCTATATCAACTCTCTCTAAGGCCTGACGTACAAGAGAAGTTATATAAAGAAATTTCAGGTGTATTACAAGGACGCCCTATAAGACCTGGAGATGTTAATAAAATGCCATATCTAAAGGCGTGCATCAAAGAGGTTTTAAGAATGTATCCAGTTGTTATTGGTAATGGCCGGCAATTGAGCAAGGACACAGTTATATGTGGCTATAATATTCCGAAAGGGACGCAAGTGATATTCCAACACTACGTTATGGGAAACAGCGATGACTATTTCACAAACGCTTCACAGTTTTGTCCTGAAAGGTGGTTACAGCGTTCAATATATAAACACCATCCATTCGCGTCCTTGCCGTTTGGATTCGGCAAAAGGATGTGCCTCGGTAGGAGATTCGCTGAACTTGAAATTAATATCATCATTTGTAAAATGGTTCAATCGTTTCAAATGGAATACCACCACGAGCCCCTTGAATACCACGTTCATCCCATGTATACTCCCAATGGACCTATACGTTTAAAACTTATTGACCGTTAA

Protein sequence:

>DPOGS213244-PA
MASSRVTMRHSLNIVRWPLRVCKRRLASQQRAVATDGETGKISHLQICPAKGHRARSTQAVAPLESIASVKPWEEVPGPRPLPLLGNTWRFIPYIGGYSVEHVDKVCLSLRQEYGDCVKMEGLLGRPDMLFVFDASEVERVFRGEDSAPHRPSMPSLNYYKHTLRKDFFGAEKDCAGVIAVHGDSWSAFRTKVSRVALSAGAAAQYTDQVGEVADAFVKRLRKIRNERKETPDDFLNEVHKWSLESLGLIALDTRLGCLEQHEGSETQQLIDAVNTFFLCVGELELKAPWWRLYPTAMFKRYVAALDTILSVTQSHVSRALKECQANPNGSKSLLQDLVSAAGPRVAAVAALDMFLVGIDTTSNAVASTLYQLSLRPDVQEKLYKEISGVLQGRPIRPGDVNKMPYLKACIKEVLRMYPVVIGNGRQLSKDTVICGYNIPKGTQVIFQHYVMGNSDDYFTNASQFCPERWLQRSIYKHHPFASLPFGFGKRMCLGRRFAELEINIIICKMVQSFQMEYHHEPLEYHVHPMYTPNGPIRLKLIDR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: