MonarchBase - Protein-coding gene

DPOGS202332
Transcript	DPOGS202332-TA	1551 bp
Protein	DPOGS202332-PA	516 aa
Genomic position	DPSCF300032 + 633718-639544
RNAseq coverage	110x (Rank: top 59%)

Annotation
*Heliconius*	HMEL006595	0.0	68.88%
*Bombyx*	BGIBMGA003944-TA	8e-69	29.66%
*Drosophila*	Cyp6a2-PA	7e-92	33.99%
EBI UniRef50	UniRef50_D2JLK0	1e-174	54.74%	Cytochrome P450 CYP6CT1 n=2 Tax=Ditrysia RepID=D2JLK0_9NEOP
NCBI RefSeq	XP_975562.1	3e-104	38.89%	PREDICTED: similar to cytochrome P450 [Tribolium castaneum]
NCBI nr blastp	gi\|308316628	4e-174	54.74%	cytochrome P450 CYP6CT1 [Zygaena filipendulae]
NCBI nr blastx	gi\|308316628	3e-170	54.74%	cytochrome P450 CYP6CT1 [Zygaena filipendulae]

Group
Gene Ontology	GO:0009055	3.5e-103	electron carrier activity
	GO:0020037	3.5e-103	heme binding
	GO:0016705	3.5e-103	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	3.5e-103	iron ion binding
	GO:0055114	3.5e-103	oxidation-reduction process
KEGG pathway	dme:Dmel_CG9438	5e-90
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[37-510] IPR001128	3.5e-103	Cytochrome P450
	[305-322] IPR002401	1.6e-15	Cytochrome P450, E-class, group I
Orthology group	MCL10169		Insect specific

Nucleotide sequence:

>DPOGS202332-TA
ATGGCGATTATAAAAATTCAGGATTATGCTTACGAACTGTTAATATTACTATTGATGGCATTCACTGTGTTGTACGTGTGGTTCCAATATAAATTTACGTATTGGAGCAGTAAAGGAGTGTTCAGTCCTACCCCGGTATTCCTTTTCGGAAATATACAGGATGTTATAAAAAGGAAGACGCAGTTTTTCCAGCCGTACTGCGATAATTATTTCAAATATAAACATTTGCCATACATAGGGATGTATTGTTTTAATAAGCCCGTACTGAGTATACACGACGCCGAGTTGGCTAAGCACATACTGATAAAGGATTTCGAACATTTCCAATCACATGGAATATTTTCTGGTGGTGTCGGGGATCCTTTGGCTGGACATCTTTTCAATTTACACGGATCAGCGTGGAAGCTTCTGAGGAACAAAATAACATCTGCATTCTCGTCATGTAAATTGAAATGTATGTATCCGCTGGTGGAGAAAATATCTAAGGAGGCGCTCGGGTACGGCGACCTGCTGCACGCGAGGAGCGAATCCATAAATTTCTCGGAATTTTACGAAAAGTACACTATGGAAATTATCGGTAATGTCGGCTTCGGGGTGGAGTGTAACGGTTTTAAAAATTCAAATTCAGAATTTTATTTGCGCGGACACGAGTATTTCAATCCTAATTCGATGTATTGGACACTAATAAGGGCTTTGGCGTTCTTTATGCCAAACTTCTTTGATAAGCTGAAGATAAGACGAATCAACCCGGACATTATAAACTTTTTCGATAATTTAGTCAGAGAGACCGTCGAGTATAGACGCAAACATAGCTACAAACGGAACGACTTTCTCCAGACTCTGATAGATTTAAATAACGATTCCAGTAAATGTGAAGAACGCGAATCCCAAAAGGGAGTTTTTACATTAACAGACGTCACATCAAACACTATGTTGTATATGTTTGCGGGTTACGAGACCTCGGCCACAACTGGGCAGTTTGCGGCGTACGAACTGGCAAAAAACCCCCACATTCAGACTAAGGCTAGGGAAGAAATAAGAAGGGTCCTCGCCAAATATGACGGCGAATGCAGTTACGAGGCCCAGGGTGAAATGACTTATATGAATATGATTTTAGATGAGACGATGCGAATGTACCCGCCACTTCGATCGCTTTACCGTGGCTGTACTAAGGAATATAGAATACCCGACAGTGACGTCACAATCGAGGAAGGCACCCTAGTGCTTATACCGATACATGCAATCCAGATGGATCCAGAAATATTCCAAGATCCGGAGACCTTCGATCCGGAAAGATTCTCCCCCGACAGAAAGAAACTTATCCATCCCTGTCATTGGATGCCGTTTGGCGAAGGTCCCCGGAAATGTCTAGGTCTCCGTCAAGGATACATTCAGTCGAAACTGGCTCTAGTCAAGTTATTACACAAGTATGAACTCTTGTTGGATGACCGCACTGCCGTTCCTATGAAGATTAAGGCCACATCACTAGCTTGCGCCGCTGACGGCGGTGTGTGGATACGGCTTAAGAAATTAACGGACGCTGTAAACTAG

Protein sequence:

>DPOGS202332-PA
MAIIKIQDYAYELLILLLMAFTVLYVWFQYKFTYWSSKGVFSPTPVFLFGNIQDVIKRKTQFFQPYCDNYFKYKHLPYIGMYCFNKPVLSIHDAELAKHILIKDFEHFQSHGIFSGGVGDPLAGHLFNLHGSAWKLLRNKITSAFSSCKLKCMYPLVEKISKEALGYGDLLHARSESINFSEFYEKYTMEIIGNVGFGVECNGFKNSNSEFYLRGHEYFNPNSMYWTLIRALAFFMPNFFDKLKIRRINPDIINFFDNLVRETVEYRRKHSYKRNDFLQTLIDLNNDSSKCEERESQKGVFTLTDVTSNTMLYMFAGYETSATTGQFAAYELAKNPHIQTKAREEIRRVLAKYDGECSYEAQGEMTYMNMILDETMRMYPPLRSLYRGCTKEYRIPDSDVTIEEGTLVLIPIHAIQMDPEIFQDPETFDPERFSPDRKKLIHPCHWMPFGEGPRKCLGLRQGYIQSKLALVKLLHKYELLLDDRTAVPMKIKATSLACAADGGVWIRLKKLTDAVN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: