MonarchBase - Protein-coding gene

DPOGS201061
Transcript	DPOGS201061-TA	1497 bp
Protein	DPOGS201061-PA	498 aa
Genomic position	DPSCF300497 + 28139-34711
RNAseq coverage	2019x (Rank: top 6%)

Annotation
*Heliconius*	HMEL008770	5e-172	57.78%
*Bombyx*	BGIBMGA014043-TA	4e-94	38.23%
*Drosophila*	Cyp4c3-PA	2e-110	41.67%
EBI UniRef50	UniRef50_D5L0M2	1e-162	53.83%	Cytochrome P450 4CG1 n=2 Tax=Obtectomera RepID=D5L0M2_MANSE
NCBI RefSeq	NP_001073134.1	1e-126	48.43%	cytochrome P450 CYP4M9 [Bombyx mori]
NCBI nr blastp	gi\|291464079	4e-162	53.83%	cytochrome P450 4CG1 [Manduca sexta]
NCBI nr blastx	gi\|291464079	4e-158	53.83%	cytochrome P450 4CG1 [Manduca sexta]

Group
Gene Ontology	GO:0009055	2.4e-129	electron carrier activity
	GO:0020037	2.4e-129	heme binding
	GO:0016705	2.4e-129	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	2.4e-129	iron ion binding
	GO:0055114	2.4e-129	oxidation-reduction process
KEGG pathway	dme:Dmel_CG1438	1e-108
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[12-497] IPR001128	2.4e-129	Cytochrome P450
	[295-312] IPR002401	4.5e-23	Cytochrome P450, E-class, group I
Orthology group	MCL10085		Insect specific

Nucleotide sequence:

>DPOGS201061-TA
ATGTTATTTTTGTCTTTAATATTAGCAACAATCATTTTATTAATAGTGCTGCACGATTACATAAGTAGATCAAAAAGACTTATTAGAAAGATTCCTGGACCTAAGAGTTACCCTATTATTGGAAACACTATTCCTTATATTTTGTCACCTGAAAATCTTTTTCATTATCTCCGAACATTACACAACACCTATGGAGAGCTTAATCAAGTGCACGCTTTGTCCGTGCAAGCGGTAAATGTTTTCAGCCCTGAAGATATGGAGGTCATACTGTCCTCGACCAAACATAACGATAAACAGTTACCCTATACTTTTCTTAAGCCATGGCTAGGGGAGGGACTTCTAACGAGCAATGGCCTGAAGTGGCACCAAAGAAGAAAGCTATTAACGAAAGCATTCCATTTTAATATATTAAAAAAATATTCCGCGACCTTTACTGAACAAACACAAGAATTTATCAAAAAGGTACATGAAGAGACGAAAAAATCTAAAACTGATGTCTTGCCATTGATATGTTCGGCCACATTACATATTATGTGTGAAACCGCTATACCCGCAACAAGGAATGAGGGTATTCAAACAATAACTCAAAAATATTTTAAATCCATACATACGGTCGGCGAAGCTGTTGTTGAAAGAATGTGCAGAGTGTGGCTTTATTTTGATCCTTTCTTTAAACTGACAAAAACTGCAAAAGAACAAGAAACAGCGTTAAAGGAATTGCATACGTTCACCAATAAAATAATAGCCGACAGGAAAGAATTTGTAAAAAATTTTGATGTCAGTAAGTATATTGATAGCGATGAGTATGATAATTCAAAGGGGAAATTGACGATGTTAGATCTTCTTCTCGAAAATGAAAAAACTGGAAATATAGATTTGGAAAGCATAAGGGAAGAAGTGGACACGTTTATGTTTGAGGGCCACGACACTACAGCCATGGCGTTGTCCTACTTTATTATGGCAATAGCGAATGAACCAGCAATTCAACGGAAAATATATGAAGAAATGGAGCAAATATTTGGTGATTCTAAACGTTTAGCAACTATGGCCGATTTACATGAGATGAGATATTTGGAATGCTGTATAAAGGAATCACTACGACTGTATCCTAGTGTGCCATTCATAGCTCGAAACTTGACTCAGGAGACTGTATTAAGTGGATATACAGTCCCAGCAAATACTTTTGTGCATTTATTTATATACGATTTACATAGACGTCCCGATCTCTTCCCTGATCCTGAGAGATTTATTCCGGAAAGATTCTTGCCACAGAACTGTTTGAACAGGCATCCATACGCATACATCCCTTTTAGTGCTGGTTCCAGAAATTGTATAGGACAAAAGTTTGCGATGCTCGAAATGAAAACGGTTTTATCAAGTTTGATAAGACAATTCCACATAGAGCCTGTGACAAAACCTTCAGAACTTCGATTCAGGACAGACCTGGTGCTGCGCACAACCCATCCTATTTATGTGAAGTTTAAAAACAGGGAATAG

Protein sequence:

>DPOGS201061-PA
MLFLSLILATIILLIVLHDYISRSKRLIRKIPGPKSYPIIGNTIPYILSPENLFHYLRTLHNTYGELNQVHALSVQAVNVFSPEDMEVILSSTKHNDKQLPYTFLKPWLGEGLLTSNGLKWHQRRKLLTKAFHFNILKKYSATFTEQTQEFIKKVHEETKKSKTDVLPLICSATLHIMCETAIPATRNEGIQTITQKYFKSIHTVGEAVVERMCRVWLYFDPFFKLTKTAKEQETALKELHTFTNKIIADRKEFVKNFDVSKYIDSDEYDNSKGKLTMLDLLLENEKTGNIDLESIREEVDTFMFEGHDTTAMALSYFIMAIANEPAIQRKIYEEMEQIFGDSKRLATMADLHEMRYLECCIKESLRLYPSVPFIARNLTQETVLSGYTVPANTFVHLFIYDLHRRPDLFPDPERFIPERFLPQNCLNRHPYAYIPFSAGSRNCIGQKFAMLEMKTVLSSLIRQFHIEPVTKPSELRFRTDLVLRTTHPIYVKFKNRE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: