MonarchBase - Protein-coding gene

DPOGS207804
Transcript	DPOGS207804-TA	1119 bp
Protein	DPOGS207804-PA	372 aa
Genomic position	DPSCF300042 + 328440-332315
RNAseq coverage	285x (Rank: top 39%)

Annotation
*Heliconius*	HMEL017551	2e-49	57.63%
*Bombyx*	BGIBMGA005496-TA	2e-61	54.90%
*Drosophila*	sad-PA	6e-52	33.33%
EBI UniRef50	UniRef50_Q2HZZ4	6e-110	59.43%	Cytochrome P450 CYP315A1 n=4 Tax=Obtectomera RepID=Q2HZZ4_MANSE
NCBI RefSeq	NP_001106224.1	5e-106	59.02%	cytochrome P450, family 315, subfamily a, polypeptide 1 [Bombyx mori]
NCBI nr blastp	gi\|86440315	2e-109	59.43%	cytochrome P450 CYP315A1 [Manduca sexta]
NCBI nr blastx	gi\|86440315	9e-107	59.43%	cytochrome P450 CYP315A1 [Manduca sexta]

Group
Gene Ontology	GO:0009055	3.4e-53	electron carrier activity
	GO:0020037	3.4e-53	heme binding
	GO:0016705	3.4e-53	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	3.4e-53	iron ion binding
	GO:0055114	3.4e-53	oxidation-reduction process
KEGG pathway	tca:658665	8e-54
	K10722 (SAD)	maps->	Insect hormone biosynthesis
InterPro domain	[31-372] IPR001128	3.4e-53	Cytochrome P450
	[182-199] IPR002401	4.9e-14	Cytochrome P450, E-class, group I
Orthology group	MCL16945		Insect specific

Nucleotide sequence:

>DPOGS207804-TA
ATGTTCCGTCTGAAAAAAATCTCTCAAATGAAAATTGTGAAACAAAAAAGCTACATCTTGCCCGTTAAAAATTATTTAACTATTTCTGATATGCCCAAACCAAAATCTCTGCCAATTATAGGAACAAAATTGGAATTCTTGGCTGCAGGAGGCGCGAACAAAGATACTATGCAAACGTGGAAATTAAATTTGGAAAAAGGATGTCGATTTCCAAATATTGAATCTGAACTGTATAGGCTGTCGTCTAATGTTATTATTAATATTTTACTCGGTACCCACTCTTTAGAGCTAAGCGATCATTATAATGAAATGTTGTCATTGTTTTCGGATTCTATGAAGAAAATCTTCCAGACCACCACAAAATTGTATAGTATTCCTGTAAATTGGTGTCAAAAGCTAAATCTGAAAGTGTGGAGGGATTTCAAAGAATCCGTTGACCTTACACTGTTTTTAGGAAGAAAAATTACTCGTGAAATGATGTTTAATAAAAACAAAAGCGATGGTTTATTAAAAAGAATGACTGAAGAAAATATGTCACCTGAAATAATTACAAGAATTGTATCAGACTTGATCATTGCTGCGGGAGATACGACAACATATACCGCGTTATGGACTTTATTGTTACTGACAAGAAATGAAGATACATTGAAGGAAAGCAGGAAAGGAGATCAAAAATATATTAAATACATTGTCAAGGAATCAATGCGATTGTACCCTGTAGCTCCATTTCTGACGAGAATACTTCCACAAGAGACGATTTTAGGTGACTACAAACTGAGTAAAGGGACACCAATTATCGCTTCCATCTATACAACGGGAAGGGATAAGCAAAATTTTTCGGAACCAAACTCTTTTCTTCCTTACCGTTGGGACAAAACAGATCCACGCAAAAAAGATCTCATTAACCATGTTCCCCCAGCGACACTGCCTTTTGCATTGGGATCCCGTTCATGTATAGGCAAAAAAATTGCCATGAAACAATTATCGGAATTCATTAGTCAGATCACCTACAACTTTGACCTTAAATGTAATAACAATCAGCAAATAAAATCTGTGACATCTCAAATATTGATACCAGATCAGAACATAGATTTTTCATTATCTGTTAGGAAGCAATGA

Protein sequence:

>DPOGS207804-PA
MFRLKKISQMKIVKQKSYILPVKNYLTISDMPKPKSLPIIGTKLEFLAAGGANKDTMQTWKLNLEKGCRFPNIESELYRLSSNVIINILLGTHSLELSDHYNEMLSLFSDSMKKIFQTTTKLYSIPVNWCQKLNLKVWRDFKESVDLTLFLGRKITREMMFNKNKSDGLLKRMTEENMSPEIITRIVSDLIIAAGDTTTYTALWTLLLLTRNEDTLKESRKGDQKYIKYIVKESMRLYPVAPFLTRILPQETILGDYKLSKGTPIIASIYTTGRDKQNFSEPNSFLPYRWDKTDPRKKDLINHVPPATLPFALGSRSCIGKKIAMKQLSEFISQITYNFDLKCNNNQQIKSVTSQILIPDQNIDFSLSVRKQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: