MonarchBase - Protein-coding gene

DPOGS214903
Transcript	DPOGS214903-TA	1074 bp
Protein	DPOGS214903-PA	357 aa
Genomic position	DPSCF300135 - 120731-121888
RNAseq coverage	34x (Rank: top 74%)

Annotation
*Heliconius*	HMEL004530	4e-113	52.84%
*Bombyx*	BGIBMGA003293-TA	4e-88	42.49%
*Drosophila*	Cyp6g1-PA	6e-40	31.31%
EBI UniRef50	UniRef50_B2BNZ4	2e-88	44.32%	Cytochrome p450 CYP337B1 n=3 Tax=Obtectomera RepID=B2BNZ4_HELAM
NCBI RefSeq	NP_001104827.1	3e-85	44.66%	cytochrome P450, family 337, subfamily a, polypeptide 1 [Bombyx mori]
NCBI nr blastp	gi\|156619508	6e-88	44.32%	cytochrome p450 CYP337B1 [Helicoverpa armigera]
NCBI nr blastx	gi\|156619508	1e-90	44.32%	cytochrome p450 CYP337B1 [Helicoverpa armigera]

Group
Gene Ontology	GO:0009055	9.1e-78	electron carrier activity
	GO:0020037	9.1e-78	heme binding
	GO:0016705	9.1e-78	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	9.1e-78	iron ion binding
	GO:0055114	9.1e-78	oxidation-reduction process
KEGG pathway	nvi:100114023	2e-46
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[3-350] IPR001128	9.1e-78	Cytochrome P450
	[149-166] IPR002401	1.2e-20	Cytochrome P450, E-class, group I
Orthology group	MCL18573		Lepidoptera specific

Nucleotide sequence:

>DPOGS214903-TA
ATGTACAATATCTTAGAACGATCTTCATCAGATTTCGTCAAATATATTGAAAAGAATCCTCACATGAAAGATAACCCTTATAAAGCATTACATAAATTCACGTCGGCCTCGATCAGTGCATCAGTGTTTGGAATCAATCCGAATACCAAAAACCTCATAGATTCGCCATTGGTAGATATTATTTGGAATGTTGCAGATTCGTTTGCGTCATTCAATTTTAAATTAGCACTTGCAAATATATTTCCTAAGCTACACAACTTTTTAAATCTTAAAGTCTTCGGTGCCCAAAAAGACGTTGTAGTTGATGCGATCAAAAATATTTTGAAGTATCGGAGAAATACGAAGGAAAGATGCCATGATTTTATCGATGCATGCATGGAGATGGAAAACGAAGGCGTTATAAAAGACAACGTTACCCAATACAAGTTAAAAGTTACTCCGGAATTTTTAGGAGCTCAAGCATACTCTCTCTTTTTTGCCGGAGTTGACACAGTTGCAAACTCAATGCACTTTACATTATTAGAGTTGTCAAATAACTCTGAAATATTAAAAAAGGTCCATGACGAAATTGACAATGTATTCGATAATTGTGAAGGAAGCATTTCATTGAAAGATATTATGAATCTGAAATATTTGGATATGGTTATTAGCGAATCTTTAAGAAAATATCCTCCAATTGGATTAATGCAACGAATATGTGCTAATGAAACTTTTTTATCCAGTAATGTTAAAGTAGATAAAGGTTGCGTAGTAATTGTTCCTATTTATGGAATACATAGAGATCCAAGACATTTCCCTAATCCAGACAAGTTCGATCCCGAAAGATTCTCACCCCAAAATCGTATGAATATCTCAAAATTTTGTTATATTCCATTTGGTGAAGGAAATCGGATGTGTCTAGGAGCAAGATTCGCAATGATTCAAATGAAAAGTGGACTTGCATGGCTTCTTAAACATTATACTTTAAGGGGATATAACTACATGCCAAATTGTTTCGAGCCAAGTCTCTTTGTTATTCGAGATCCAAAAGCACGATACGATTTAATTGTTAGAAACGAAACTGTAATTAGTTAA

Protein sequence:

>DPOGS214903-PA
MYNILERSSSDFVKYIEKNPHMKDNPYKALHKFTSASISASVFGINPNTKNLIDSPLVDIIWNVADSFASFNFKLALANIFPKLHNFLNLKVFGAQKDVVVDAIKNILKYRRNTKERCHDFIDACMEMENEGVIKDNVTQYKLKVTPEFLGAQAYSLFFAGVDTVANSMHFTLLELSNNSEILKKVHDEIDNVFDNCEGSISLKDIMNLKYLDMVISESLRKYPPIGLMQRICANETFLSSNVKVDKGCVVIVPIYGIHRDPRHFPNPDKFDPERFSPQNRMNISKFCYIPFGEGNRMCLGARFAMIQMKSGLAWLLKHYTLRGYNYMPNCFEPSLFVIRDPKARYDLIVRNETVIS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: