MonarchBase - Protein-coding gene

DPOGS205608
Transcript	DPOGS205608-TA	1506 bp
Protein	DPOGS205608-PA	501 aa
Genomic position	DPSCF300167 + 220801-223020
RNAseq coverage	2557x (Rank: top 5%)

Annotation
*Heliconius*	HMEL017463	1e-150	51.31%
*Bombyx*	BGIBMGA003945-TA	3e-63	28.93%
*Drosophila*	Cyp6g2-PA	2e-74	32.42%
EBI UniRef50	UniRef50_D5L0N3	8e-89	35.93%	Cytochrome P450 332A5 n=4 Tax=Ditrysia RepID=D5L0N3_MANSE
NCBI RefSeq	NP_001108340.1	2e-88	36.07%	cytochrome P450 CYP332A1 [Bombyx mori]
NCBI nr blastp	gi\|291464101	3e-88	35.93%	cytochrome P450 332A5 [Manduca sexta]
NCBI nr blastx	gi\|168823413	2e-88	35.67%	cytochrome P450 CYP332A1 [Bombyx mori]

Group
Gene Ontology	GO:0009055	6.3e-107	electron carrier activity
	GO:0020037	6.3e-107	heme binding
	GO:0016705	6.3e-107	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	6.3e-107	iron ion binding
	GO:0055114	6.3e-107	oxidation-reduction process
	GO:0004497	3.3e-14	monooxygenase activity
KEGG pathway	nvi:100118363	4e-76
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[34-495] IPR001128	6.3e-107	Cytochrome P450
	[348-364] IPR002403	3.3e-14	Cytochrome P450, E-class, group IV
Orthology group	MCL10231		Insect specific

Nucleotide sequence:

>DPOGS205608-TA
ATGTCGGTTCTGTTTTTGTTATTTTCTTTAATGACATGTTTTTTGGCGTATCTTACTTTGAGATGGAATAAAGTAAAGAATTATTGGGCCCAGCGCGGAGTACCACACTCCCCACCAAACCCATTCCTCGGCAGCCTTACCTTCATTCAAAGAAAAAATGTGGGTGTATGGATACGTGACATGTATGAACACTTCAAATCTCCGTACATAGGGATCTGGTTAATATGGAAACCAGCTTTAATTATAAACGACCCAGAAATCGCTCGGCGAATATTAGTTAAAGATAGTTCGATTTTTAGAGACAGGTATTTGAGTTCTGGGAGCAGCGATCCTATCGGAGCACTAAATATATTTACCATGAATGACCCCGATTGGTCAAATATACGACGTAAACTGACCAATCTGTTCACTGCAGCTAAACTTAGATTTGTTCAAAGTTTTGCTTTAGTAAAAGCTAAAGAACTCGTGCAGAGAGTGGATAGAGATCGCAATAAAGGTCTAGAACTCAAGACTCTCTTTGTTGATTACACGACAGATGTGATTGGAACGTTTGCCTTCGGACTTGAGAGTAACGCAACGCTCACTTCCGAGGGTCCCCTAAGAAAAGTTACAGATGATTTCATGAGGTTTAGCGTATATAGAGGGCTTTGTTGGTTTAGTATTTTTTTTTGGCCGGGTTTGGTCGATATATTTAGGTTTAGCCTCTTTCCAAGGGACACAACTGATTTCTTTAAAAAGATTTACCTAAATATAATGGACCAACGTCACAAACATCCAGACGGCAAACAATACAAGGATTTAGTAGATGCTCTTATAGAAATTAAAAAAGAGAGCGAAGAAAAAAATCAAAACTACCCCGATGACCTTTATCTAGCCCAAGCGGCCATTGTCCTCCTTGGAGGTTTTGACTCTACTGCCTCAGCGCTAACGTACATGACATATGAACTTGCCCATGATAGCGAGAGTCAGGAAAAATTATACAGAGAATTGAAGGAAGCCGAAAGAAATGGAGCAAATTTCGATGCGCAGACCTTGACAGAGTTGACATATCTCAACTGTGTCTTCAAAGAGGTTCTGCGAAAATATGCACCAATGGGTTGGCTTGACCGAATAGCAGCTACCGATTATAATATTGATGAGAACCTGACTATCGCAGCAGGAACAGTGATTTATGTGAATGCTATCGGTATGCACTATGATCCCAAATACTTTCCTGAACCTTACAAATTTAATCCTGATAGGTTTTTACCAGAAAACGAAAGTAACATTGAACCGTATACATTTATGCCGTTCGGAGATGGTCCGAGAGTATGCATAGGTCAAAGATTTGCTTATATGTCCGCCCGAACGGCTGCATCTCAGTTGTTCCTAAAATACAAGGTCCAACCTATTCCTGGTTCACCAAAACCTAAAGACGTGAAGATTGAATCGAAAGGATTGTTTTTAGGACCAGGAGAGCCAGTGCACGTTGAATTCATCCCGAGAACGGAGAACGGGCATGATTAA

Protein sequence:

>DPOGS205608-PA
MSVLFLLFSLMTCFLAYLTLRWNKVKNYWAQRGVPHSPPNPFLGSLTFIQRKNVGVWIRDMYEHFKSPYIGIWLIWKPALIINDPEIARRILVKDSSIFRDRYLSSGSSDPIGALNIFTMNDPDWSNIRRKLTNLFTAAKLRFVQSFALVKAKELVQRVDRDRNKGLELKTLFVDYTTDVIGTFAFGLESNATLTSEGPLRKVTDDFMRFSVYRGLCWFSIFFWPGLVDIFRFSLFPRDTTDFFKKIYLNIMDQRHKHPDGKQYKDLVDALIEIKKESEEKNQNYPDDLYLAQAAIVLLGGFDSTASALTYMTYELAHDSESQEKLYRELKEAERNGANFDAQTLTELTYLNCVFKEVLRKYAPMGWLDRIAATDYNIDENLTIAAGTVIYVNAIGMHYDPKYFPEPYKFNPDRFLPENESNIEPYTFMPFGDGPRVCIGQRFAYMSARTAASQLFLKYKVQPIPGSPKPKDVKIESKGLFLGPGEPVHVEFIPRTENGHD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: