MonarchBase - Protein-coding gene

DPOGS210281
Transcript	DPOGS210281-TA	1077 bp
Protein	DPOGS210281-PA	358 aa
Genomic position	DPSCF300216 + 196416-203516
RNAseq coverage	173x (Rank: top 50%)

Annotation
*Heliconius*	HMEL010939	4e-127	63.91%
*Bombyx*	BGIBMGA000004-TA	3e-79	43.31%
*Drosophila*	Cyp4d2-PA	1e-41	30.06%
EBI UniRef50	UniRef50_Q4R1I7	6e-51	33.24%	Cytochrome P450 n=4 Tax=Papilionoidea RepID=Q4R1I7_9NEOP
NCBI RefSeq	NP_001108341.1	3e-50	33.42%	cytochrome P450 CYP366A1 [Bombyx mori]
NCBI nr blastp	gi\|321476772	7e-51	35.46%	hypothetical protein DAPPUDRAFT_192258 [Daphnia pulex]
NCBI nr blastx	gi\|67513958	7e-50	33.33%	cytochrome P450 [Papilio xuthus]

Group
Gene Ontology	GO:0009055	7.4e-75	electron carrier activity
	GO:0020037	7.4e-75	heme binding
	GO:0016705	7.4e-75	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	7.4e-75	iron ion binding
	GO:0055114	7.4e-75	oxidation-reduction process
KEGG pathway
InterPro domain	[17-357] IPR001128	7.4e-75	Cytochrome P450
	[157-174] IPR002401	3.2e-20	Cytochrome P450, E-class, group I
Orthology group	MCL26720		Lepidoptera specific

Nucleotide sequence:

>DPOGS210281-TA
ATGACAACTTCTAATCCAAGCAAACTTGAGGAAGGCATCGAGAATTTTGAAGAGGGACGTAAGCTTGTTGATGGCATGCAAGCAGAAGTCGGGAGAGGGTGGTTCGACCAATCAAAGTACGTGAAACAGAACTTCATGGAAACTATTTGTCTAACGGCGTTAGACGACTGCGTTACACCAGAGGAGGCGAATGAGTATGTCGAGGCTTTCGAAAATTACCTTAACGGTAACATTCTTAGGTTCCAGACGTTTTGGCTTCATCCCGATATAACTTTCAAGTTCAGTAAATTGAAGAAAAAACTTGATGCAAGCATAAAAGTCCTTCACGAAATGTCGGATAAGGTACTCAAAAACAAAAGAGCTCTTAGAAAACTTAATGAAACGGAAAGTAGTGCAGAAAACAGTCCAAAGCTGAAGGTATTTATGGATTTACTTATGGACTTGGATGGTGGTGTGCTAACTGATCAGGAGATAAGAGACGAAATGAACACAATCATCATGGCGGGCCACGAGACATCAGCTAACGTTATAGTTTTCGCTCTCATATTAATTGGATCTTATCCAGAAGTTCAGGAGAAGCTTCATGAGGAATTACAAAGAGTGTTTGGTGATAGTGATAGGGATATAGAAAAACAGGATCTTTCACAGCTCATTTATATGGAAGCTGTTTTGAAAGAGACTATGCGTTTCTTCGTAATGGCGCCATTTGTTGGAAGACATATCGATCGGGAGGTCAAATTAAAAAACTGTACTCTTAAACCTGGTAACAATTGCCTGATCCTGTACTATGGGCTTCATCGTCACCCTATTTGGGGTCCAGATGTTAACGAATTCAAGCCCGAACGGTGGTTAGATCCAGCCACGCTACCGAAGAATCCAAATGCGTTTGGCGGATTTAGCATCGGGAAGAGAAATTGTATAGGTAAAACATACGCTATGATGTCCATGAAGTCGACACTATCCTACGTATTTCGACGGTTCAAAATGCAAGCCGACCACACGAAGCTCAAGTTCAAACTGGACGTTTTACTTAAACCGATAACCGGACACTACGTCACTATACAGAATAGATTATAA

Protein sequence:

>DPOGS210281-PA
MTTSNPSKLEEGIENFEEGRKLVDGMQAEVGRGWFDQSKYVKQNFMETICLTALDDCVTPEEANEYVEAFENYLNGNILRFQTFWLHPDITFKFSKLKKKLDASIKVLHEMSDKVLKNKRALRKLNETESSAENSPKLKVFMDLLMDLDGGVLTDQEIRDEMNTIIMAGHETSANVIVFALILIGSYPEVQEKLHEELQRVFGDSDRDIEKQDLSQLIYMEAVLKETMRFFVMAPFVGRHIDREVKLKNCTLKPGNNCLILYYGLHRHPIWGPDVNEFKPERWLDPATLPKNPNAFGGFSIGKRNCIGKTYAMMSMKSTLSYVFRRFKMQADHTKLKFKLDVLLKPITGHYVTIQNRL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: