MonarchBase - Protein-coding gene

DPOGS201160
Transcript	DPOGS201160-TA	3213 bp
Protein	DPOGS201160-PA	1070 aa
Genomic position	DPSCF300065 + 539853-551370
RNAseq coverage	1292x (Rank: top 10%)

Annotation
*Heliconius*	HMEL013739	0.0	65.83%
*Bombyx*	BGIBMGA003945-TA	0.0	60.80%
*Drosophila*	Cyp9f2-PA	8e-113	41.54%
EBI UniRef50	UniRef50_Q7YZX4	0.0	62.43%	Cytochrome P450 n=18 Tax=Ditrysia RepID=Q7YZX4_SPOLT
NCBI RefSeq	NP_001077079.1	0.0	60.80%	cytochrome P450 9a20 [Bombyx mori]
NCBI nr blastp	gi\|270011345	0.0	41.12%	hypothetical protein TcasGA2_TC005353 [Tribolium castaneum]
NCBI nr blastx	gi\|62912508	0.0	63.74%	cytochrome P450 [Helicoverpa armigera]

Group
Gene Ontology	GO:0009055	1.9e-105	electron carrier activity
	GO:0020037	1.9e-105	heme binding
	GO:0016705	1.9e-105	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.9e-105	iron ion binding
	GO:0055114	1.9e-105	oxidation-reduction process
KEGG pathway	aag:AaeL_AAEL006815	1e-119
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[564-1065] IPR001128	1.9e-105	Cytochrome P450
	[718-736] IPR002401	4.7e-16	Cytochrome P450, E-class, group I
Orthology group	MCL10032		Patchy

Nucleotide sequence:

>DPOGS201160-TA
ATGATAGTATTTCTATTATGGGTCGTCGTTCTGGTGGCCGCCCTGGCACTATACTACCGCCAGATATACTCGAGATTCTCTAAGTTTGGAGTTAAGCAGAATAATATTGTTCCTTTTTTTGGCAATATGTTGAAGATTACACTTGGCATGGAACATTTCGCCGAAAATATTGACTCAATGTATAAGAACTTTCCAGAAGAAAGGTTCATCGGCCGGTTTGAATTTTCAAAACCTGGTGTTTTAATTAGAGATTTGGAATTGATAAAGAAAGTAACTGTCAAGGACTTCGAACACTTTCTAGATCATCGAGGCTTCGTTGATGATAAAGTCGAGCCACTTTTTGCAAGAAACTTATTCTCCTTAAAAGGTCAAGAATGGAAAGACATGAGGTCGACATTGAGTCCGGCTTTCACGAGCTCCAAGATCAAGCAGATGGTGCCATTTATGGAAGAAGTGGGAGAGATGATGGTTAGAGCAGTCAAGAAAAATATTGAGAATTCTAAAGTCGGACAGATTGAAATCGACGTGAAAGACCTGACCTCTAGATATTCTAACGATGTGATCGCTTCCTGCGCCTTCGGACTCAAAGTGGACTCCCATACTACAGAAGATAATGAATTCTATGAGATGGGCAAAAAAGCCTCGACTTTTAAGTTTAAGCAAATGCTCCTCTTCTTTATGAATTCTGCTTTACCTTTTGTTGCTAGGCTTTTTAAACTAAAACTCTTCTCAAGAGAAACAACAGATTTTTTTGTGGATCTAGTACAAGATACAATGAAGGAAAGGGAAGACAAAAAAATCATTAGACCAGACATGATTCATCTGCTGATGGAAGCTAAGAAAGGTAAACTGACATACGATGTCGCTAATGGAAAAGCTGACTCCAATGTTGGATTTTCCACAGTTGAAGAATCAGACTTAGGCCAAAAACCTGTTACTAGAGTGTGGTCTGATAGCGACTTGATCGCTCAAGCAGTAATGTTCTTCATAACTGCATTTGAAACCATATCTACTGTGGCATCTTTCACGCTTTATGAGCTAGCCGTGAACCCAGACGTACAGGACAAACTTTTTCAGGAGATTAAGGAACATAATGCTAAATTTGGAGGAAAATTGGACTTCAATTCCATTCAGAACTTGACTTATTTGGATATGGTGGTCTCAGAAGTTTTAAGACTGTGGCCACCCGCCATCGTCTTGGACAGAGTATGTAACAAAGACTACAACTTGGGAAAACCGAACAGTAAAGCCACTGAAGACTTTATTGTTCGTAAAGGAGAGCTGGTAGGAGTTCCAGTAATGAGCATACATCGTGATCCACAATATTTCCAAAATCCTAATAAATTTGATCCTGAACGCTTTTCTGAAGAAAATAGACACCTTATTGATTTAATGACTTATATGCCGTTTGGATATGGTCCCAGGAATTGTATCGGTTCACGATTCGCGCTCTGCGAAGTGAAGGTACTCACCTATCAGATTATTTTAAACTTCGAGATATCGCCAGCCGAGAAGACTTGCATTCCGGCGAAGTCAAGAATGGAAAGACATGAGGTTGACCCTAAGTCCGGCTTCCACGAGCTCCAAGATCAAGCAGATGGTACCGTTTATATGATTCTTGAAATATGGATTGTCGTTTTATTTGTGGCCGCAGTGTTGTACTATCGTCAGGTGTACTCAAGATTTACTAAATATGGTGTCAAACAACAGACACCGTTCCCTTTATTTGGCAATATGTGGAGAGTGACCCTTCGACTGGAACATTTTACTGATACAATGAATTCAATGTATAAAGAATTTCCAGAAGAAAGGTTCATTGGACGATTCGAATTCATCAAACCCTGTCTGTTTGTAACAGACATTGAATTAATAAAAAAAATAACGGTTAAAGATTTTGAACATTTTCTGGATAGAAGCGGCTTCTCTGTTGAAGTAGACCCGTTGTTTTCAAGAAATTTATTCTCTTTGAAAGGTCAAGAATGGAAAGACATGAGGTCGACCCTGAGTCCGGCTTTCACGAGCTCCAAGATCAAACAGATGGTGCCGTTTATGGAAGAAGTGGGAGAGATGATGATACAAGCAGTGAAAAATAAAATTAAAAATTCAGGAAGTGAATGGATTGAAATCGACTGCAAGGACTTAACAACACGCTATACCAATGATGTGATCGCTTCTTGCGCTTTTGGCATAAAAGTGGACTCACATACTAACGTTGACAACGACTTCTATAAAATTGGAAAAATAGCTAGCACGTTCAAAACTAGAGATGTCATTTTGTTCCAATTGTACTCCGCAGCACCTTTCCTTGGAAAGTTCTTTAAACTGGAACTGCTCTCGACAAAAACAAGAAACTTTTTCATCGATCTTGTTTTAAGCACCATGAAGGAAAGGGAGACCCACAACATTATACGACCGGATATGATTCACTTACTAATGGAAGCCAAGAAAGGCAGACTGCATCATGAAAAAGATGTGATTAACGCTGACGATGGCTTTGCTACGGTGGAAGAATCCGAAGTAGGAAAGAACAATAAACATAAAAGTTGGTCGGACACCGACCTCATCGCCCAGGCAGTTCTTTTCTTCATCGCAGCCTTCGAAGTAGTTTCAACGGCGATGACCTTCACACTTACTGAACTAGCACTGCATCCTGACGTGAAAGAGAGGCTTGCGCTTGAGATAAAGGAACACAATGAGAAATATGGTGGCAAGATAGACCTACATTCTATACAAACATTAACTTATTTGGATATGGTTATCTCAGAAGTATTGAGGTTGTGGGTACCTACCATACTCATAGAAAGGATGTGCGTTAAAGACTATAACATGGGGAAATCTAACGGTGAAGCTAAGGAAGATTTTATTCTCCGCAAAGGTGAATCACTACATATTCCAACTTGGTGCATTCATCGTGATCCACAATTCTTTCCTAATCCTAATAAGTTCGACCCTGAACGGTTCTCTAAAGAAAATCGACATCTAATCCATCCCATTGCCTACATGCCTTTCGGACTTGGACCAAGAAACTGCATCGGTTCGCGCTTCGCTCTCTGCGAGCTAAAGCTTTTAGTGTATCAGATTCTTCTTAATTTTGATTTGTCACCAACCAAAAAGACATGTATTCCAGCAAGATTGAACAAGAGCTCTTTCCATCTTCAACTTGAGGGCGGACATGCGCTGAAATTCAGATCACGTTATAATTTAATATTGTGA

Protein sequence:

>DPOGS201160-PA
MIVFLLWVVVLVAALALYYRQIYSRFSKFGVKQNNIVPFFGNMLKITLGMEHFAENIDSMYKNFPEERFIGRFEFSKPGVLIRDLELIKKVTVKDFEHFLDHRGFVDDKVEPLFARNLFSLKGQEWKDMRSTLSPAFTSSKIKQMVPFMEEVGEMMVRAVKKNIENSKVGQIEIDVKDLTSRYSNDVIASCAFGLKVDSHTTEDNEFYEMGKKASTFKFKQMLLFFMNSALPFVARLFKLKLFSRETTDFFVDLVQDTMKEREDKKIIRPDMIHLLMEAKKGKLTYDVANGKADSNVGFSTVEESDLGQKPVTRVWSDSDLIAQAVMFFITAFETISTVASFTLYELAVNPDVQDKLFQEIKEHNAKFGGKLDFNSIQNLTYLDMVVSEVLRLWPPAIVLDRVCNKDYNLGKPNSKATEDFIVRKGELVGVPVMSIHRDPQYFQNPNKFDPERFSEENRHLIDLMTYMPFGYGPRNCIGSRFALCEVKVLTYQIILNFEISPAEKTCIPAKSRMERHEVDPKSGFHELQDQADGTVYMILEIWIVVLFVAAVLYYRQVYSRFTKYGVKQQTPFPLFGNMWRVTLRLEHFTDTMNSMYKEFPEERFIGRFEFIKPCLFVTDIELIKKITVKDFEHFLDRSGFSVEVDPLFSRNLFSLKGQEWKDMRSTLSPAFTSSKIKQMVPFMEEVGEMMIQAVKNKIKNSGSEWIEIDCKDLTTRYTNDVIASCAFGIKVDSHTNVDNDFYKIGKIASTFKTRDVILFQLYSAAPFLGKFFKLELLSTKTRNFFIDLVLSTMKERETHNIIRPDMIHLLMEAKKGRLHHEKDVINADDGFATVEESEVGKNNKHKSWSDTDLIAQAVLFFIAAFEVVSTAMTFTLTELALHPDVKERLALEIKEHNEKYGGKIDLHSIQTLTYLDMVISEVLRLWVPTILIERMCVKDYNMGKSNGEAKEDFILRKGESLHIPTWCIHRDPQFFPNPNKFDPERFSKENRHLIHPIAYMPFGLGPRNCIGSRFALCELKLLVYQILLNFDLSPTKKTCIPARLNKSSFHLQLEGGHALKFRSRYNLIL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: