MonarchBase - Protein-coding gene

DPOGS205654
Transcript	DPOGS205654-TA	1551 bp
Protein	DPOGS205654-PA	516 aa
Genomic position	DPSCF300023 + 316318-321220
RNAseq coverage	2233x (Rank: top 5%)

Annotation
*Heliconius*	HMEL006588	0.0	74.67%
*Bombyx*	BGIBMGA001004-TA	0.0	69.29%
*Drosophila*	Cyp4g15-PA	2e-150	49.46%
EBI UniRef50	UniRef50_E2AH96	2e-161	56.89%	Cytochrome P450 4g1 n=2 Tax=Camponotus floridanus RepID=E2AH96_CAMFO
NCBI RefSeq	NP_001106221.1	0.0	66.73%	cytochrome P450 [Bombyx mori]
NCBI nr blastp	gi\|291464091	0.0	71.20%	cytochrome P450 4G49 [Manduca sexta]
NCBI nr blastx	gi\|272979578	0.0	68.74%	cytochrome P450 CYP4G48 [Zygaena filipendulae]

Group
Gene Ontology	GO:0009055	1.4e-113	electron carrier activity
	GO:0020037	1.4e-113	heme binding
	GO:0016705	1.4e-113	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.4e-113	iron ion binding
	GO:0055114	1.4e-113	oxidation-reduction process
KEGG pathway	dme:Dmel_CG1438	6e-91
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[26-510] IPR001128	1.4e-113	Cytochrome P450
	[79-98] IPR002401	8.1e-21	Cytochrome P450, E-class, group I
Orthology group	MCL10223		Insect specific

Nucleotide sequence:

>DPOGS205654-TA
ATGACGGTGGTCGAAGATATCCAGCCGCACCAATGGAACTCCACGCGTCTTTACTTCTATCCGTTGGTCATCCTCGCGACTAGTCTTTGGCTTCTATACAGATGGCAGCAGCAAACTAAAATGTATAAGCTGGGGAACAAGATCCCCGGTCCCATGGCCTTGCCGATTTTTGGAAACGCACTTTTGGCCGTAAATAAAAAACCAGAGCAACTTTTAAGCATTGCCCTTGAATATTATGCATATTATGGCTCTGTGGTGAGAGGATGGCTGGGAAATAACTTGATAATATTTTTGGCGGACCCAAATGATGTTGAAGTCATTTTAAACAGCAATGTCCATATTGACAAGGCATCCGAATATAAATTCTTCCAACCGTGGCTAGGAGAAGGGCTGCTCATAAGCTCAGGAGAAAAATGGAGGTCCCATCGCAAAATGATAGCCCCAACCTTCCACATTAATATCCTCAAATCTTTCGTGGGAGTTTTTAATCAAAACAGCAAGAACGTTGTGGATAAAATGCGAGGTGAAATGGGAAAAGTGTTCGATGTTCACGATTATATGAGCGGCGTCACTGTGGATATTCTTCTAGAAACCGCAATGGGAATCACCAAGGAAACTCAAGATCAATCTGGTTTTGACTACGCTATGGCAGTGATGAAGCAAGTCATCAAAAATAAAAAAGAACGTTATCTCCAAAATAAAGCCAAAGGCATCATACCACCAACGATCGACGAAATTTCCAAATCGGCTCCTAAAACTGAAAATTATAATGTATTAGCCAACGAAAAAACGCTCGCTGATACAGTGTTCAAGGGCTACAGAGATGATTTAGATTTCAATGACGAAAATGATGTCGGTGAGAAAAAACGTCTGGCTTTCCTGGACCTCATGATTGAATCAGCACAGAACGGTTCAAACAAGATCACAGATTTTGAAATCAAAGAGGAAGGCCATGACACCACCGCAGCTGGATCCAGTTTCGTGCTTTGTCTCCTGGGAATTCACCAGGACATCCAAGCCAGGGTTTACGACGAGTTGTATTCAATCTTTGGAGATTCTGACCGCCCCGCCACTTTCGAAGACACCCTCCAAATGAAATACTTGGAGCGCGTCATCTTTGAATCGTTGAGAATGTACCCACCTGTACCCATTATTGCCAGGAAAATTAACCGTGATGTTAAGATAGCAACAAATGACTACGTATTGCCAGCTGGATGCACTGTGGTCATCGGAACATATGGAATCCACAGGAACCCTAAATATTATGAAAACCCCGACGTTTTCAACCCCGATAACTTCCTTCCTGAGAAGACACAGAACAGACACTATTACAGCTATATACCATTCAGTGCTGGGCCCAGGAGTTGTGTTGGACGTAAGTACGCCATTTTAAAATTGAAAATTTTACTATCGACAATCCTTCGCAATTACAAAATGGTGTCCGACATAACTGAGGATAAATTTGTCCTCCAAGCTGACATCATTCTGAAAAGACACGATGGCTTTAGGGTCCAGATTGAACCAAGGAAACGTGTTCCATCCACAGCATAA

Protein sequence:

>DPOGS205654-PA
MTVVEDIQPHQWNSTRLYFYPLVILATSLWLLYRWQQQTKMYKLGNKIPGPMALPIFGNALLAVNKKPEQLLSIALEYYAYYGSVVRGWLGNNLIIFLADPNDVEVILNSNVHIDKASEYKFFQPWLGEGLLISSGEKWRSHRKMIAPTFHINILKSFVGVFNQNSKNVVDKMRGEMGKVFDVHDYMSGVTVDILLETAMGITKETQDQSGFDYAMAVMKQVIKNKKERYLQNKAKGIIPPTIDEISKSAPKTENYNVLANEKTLADTVFKGYRDDLDFNDENDVGEKKRLAFLDLMIESAQNGSNKITDFEIKEEGHDTTAAGSSFVLCLLGIHQDIQARVYDELYSIFGDSDRPATFEDTLQMKYLERVIFESLRMYPPVPIIARKINRDVKIATNDYVLPAGCTVVIGTYGIHRNPKYYENPDVFNPDNFLPEKTQNRHYYSYIPFSAGPRSCVGRKYAILKLKILLSTILRNYKMVSDITEDKFVLQADIILKRHDGFRVQIEPRKRVPSTA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: