MonarchBase - Protein-coding gene

DPOGS206994
Transcript	DPOGS206994-TA	1404 bp
Protein	DPOGS206994-PA	467 aa
Genomic position	DPSCF300001 + 858554-864022
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL002116	4e-141	53.15%
*Bombyx*	BGIBMGA009949-TA	4e-105	66.30%
*Drosophila*	Cyp4d1-PA	9e-51	29.30%
EBI UniRef50	UniRef50_UPI00022467C5	6e-69	32.28%	UPI00022467C5 related cluster n=1 Tax=unknown RepID=UPI00022467C5
NCBI RefSeq	XP_001602395.1	1e-71	34.81%	PREDICTED: similar to cytochrome P450 [Nasonia vitripennis]
NCBI nr blastp	gi\|333037173	7e-174	63.71%	cytochrome P450 [Bombyx mori]
NCBI nr blastx	gi\|333037173	1e-168	63.71%	cytochrome P450 [Bombyx mori]

Group
Gene Ontology	GO:0009055	1.2e-91	electron carrier activity
	GO:0020037	1.2e-91	heme binding
	GO:0016705	1.2e-91	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.2e-91	iron ion binding
	GO:0055114	1.2e-91	oxidation-reduction process
KEGG pathway
InterPro domain	[6-462] IPR001128	1.2e-91	Cytochrome P450
	[38-57] IPR002401	1.2e-15	Cytochrome P450, E-class, group I
Orthology group	MCL25672		Lepidoptera specific

Nucleotide sequence:

>DPOGS206994-TA
ATGTTGGATCTGGCAAAATCAGTTCCGGGACCCCCAGCTCTGCCTCTTGTAGGAAATGCCCTACTCTTCATGGTCAACCCTAAAGAACAATTAAAAATTGTAAACCAGTTATTAAATAAATACGGAGATTATGTGAAGTTTTGGTTGGGCCCAGACTTGAATATTTGCGTCAAAAATCCGGCGGATATAAGGTTCCTGTTGACAAGTAACAAAGTTACTCAAAAAGGTCCGGTGTATGAATTCTTCAAGAGCTTCGTAGGGCATGGTATTTTATCTGGCGGTAAGCATTGGAAGGCACATCGGAAAATTGTTATGCCATCGTACAACAAGAAAGCAGTAAATCTATTCAGTACAGTGTTCAATAAAGAGGCTGAAGATTTAGCGAAAGTTTTAAGTCAAAAAGACCCGCATCAGACATTCAACGTTTACTTTGACGTTGTTCATTGCACCACCCAAAGCGTGTGTCAAACACTAATGGGACTTACGAAGGAAGAATCCTTAAATGTTGCCCGTTTGAGAGAAGTGATGTTGGAGACACATAATATGTATCAATTAATTCATTTAAAAATGACAAGATGGTGGTTACACATACCTATTATTTACTATCTGTCCGGAAGAAAACGAATAGAAAATAAATATATTAAAATGACTGAAGATCTGTCATCGGATATACTACAGAAAAGAAAAAACGCACTGAAACATGAAGTCACAGATGAAAATAGTATGAATGCAGTTGATAGACTAATTTTAGAAGGTTTAGATGAAAAAGAAATAAAATTAGAGGTTTTCACTCTATTTACAACAAGTCAAGAGGCATCGGCTAAAATAGTCGCTGGTGTACTTCTATTTCTTGCGCATCTTCCCGAATGGCAGGAGAAAGTCTACGACGAAATCCTGGCTACGGTTGGCTTTACAGCTGAGGTTACTGATGAACACCTGAAGAACCTTCACTACTTGGATATGGTGTACAAGGAAGTTCTGCGCTATTTGGCCATAGGGGCCATGATACAGAGATCTGTCGAAAAAGAGATAACTATTAACAACGGTAAAATAACCCTTCCGGTCAAAACGTCATTGGTAATACCGATACACGAATTGCATCGCGATTCTCGGTACTGGGACGAACCGAATAAAGTGAAACCGGAGAGATTCATGCCGGAAAATGTAAAGAAACGCGACCCAAATGCCTTCGTACCATTCAGTTTGGGGCCCATGGATTGTCTGGGTAGAGTTTATGCGACAAAATTAATCAAAACAATTGTTGTCCAAGTCATCCGACAACTGAAGCTAGAAGCTGACGGAACGTTGGAAGAGCTGGAACTAGACATCGCGATATCGGTGAAGTTTGCAAAAGGATACAACATTAGGGCGAAAAAACGAAACAATGACGCAACAAGCGCGTGA

Protein sequence:

>DPOGS206994-PA
MLDLAKSVPGPPALPLVGNALLFMVNPKEQLKIVNQLLNKYGDYVKFWLGPDLNICVKNPADIRFLLTSNKVTQKGPVYEFFKSFVGHGILSGGKHWKAHRKIVMPSYNKKAVNLFSTVFNKEAEDLAKVLSQKDPHQTFNVYFDVVHCTTQSVCQTLMGLTKEESLNVARLREVMLETHNMYQLIHLKMTRWWLHIPIIYYLSGRKRIENKYIKMTEDLSSDILQKRKNALKHEVTDENSMNAVDRLILEGLDEKEIKLEVFTLFTTSQEASAKIVAGVLLFLAHLPEWQEKVYDEILATVGFTAEVTDEHLKNLHYLDMVYKEVLRYLAIGAMIQRSVEKEITINNGKITLPVKTSLVIPIHELHRDSRYWDEPNKVKPERFMPENVKKRDPNAFVPFSLGPMDCLGRVYATKLIKTIVVQVIRQLKLEADGTLEELELDIAISVKFAKGYNIRAKKRNNDATSA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: