MonarchBase - Protein-coding gene

DPOGS213800
Transcript	DPOGS213800-TA	3102 bp
Protein	DPOGS213800-PA	1033 aa
Genomic position	DPSCF300106 - 97352-110422
RNAseq coverage	75x (Rank: top 65%)

Annotation
*Heliconius*	HMEL022119	0.0	67.81%
*Bombyx*	BGIBMGA006785-TA	3e-174	70.50%
*Drosophila*	Cyp6a13-PA	4e-71	35.73%
EBI UniRef50	UniRef50_Q1KHF5	5e-140	67.61%	Cytochrome P450 (Fragment) n=3 Tax=Bombyx RepID=Q1KHF5_BOMMO
NCBI RefSeq	XP_001944599.1	2e-85	39.68%	PREDICTED: similar to cytochrome P450 CYP6AY1 protein [Acyrthosiphon pisum]
NCBI nr blastp	gi\|305671408	6e-171	70.26%	cyp6u1 [Bombyx mori]
NCBI nr blastx	gi\|305671408	5e-168	70.26%	cyp6u1 [Bombyx mori]

Group
Gene Ontology	GO:0009055	1.2e-91	electron carrier activity
	GO:0020037	1.2e-91	heme binding
	GO:0016705	1.2e-91	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	1.2e-91	iron ion binding
	GO:0055114	1.2e-91	oxidation-reduction process
KEGG pathway	nvi:100114023	6e-78
	K07424 (CYP3A)	maps->	Drug metabolism - cytochrome P450
			Drug metabolism - other enzymes
			Linoleic acid metabolism
			Steroid hormone biosynthesis
			Metabolism of xenobiotics by cytochrome P450
			gamma-Hexachlorocyclohexane degradation
			Retinol metabolism
InterPro domain	[12-412] IPR001128	1.2e-91	Cytochrome P450
	[231-248] IPR002401	4.8e-13	Cytochrome P450, E-class, group I
	[833-884] IPR005062	4e-06	SAC3/GANP/Nin1/mts3/eIF-3 p25
Orthology group	MCL22141		Insect specific

Nucleotide sequence:

>DPOGS213800-TA
ATGCTACAATTCTTCTACGACAAATACAGAGATGAGAGATATGTTGGAATTTTTCAAGCTAGGAGACCGGCTTTGATGCTGATAGATTTAGAATTGATAAAATTTGTATTGTCCAAAGATTTCCAACATTTCACTGATCGTATATCTGTTTCGACGGATACGCAACGGGAACCGCTTTTGAGGAATCTAGCAAATATGAGCGGCACGGAATGGCAGAAAATGAGGCACATAGTTACACCGACATTCTCCTCGGCTAAAATGAAAGCCATGTTCCCTTTAGTCGTCGATTGTGCAAGAACATTACAAACAACTCTAGAAAACGAGTCCATTGAGGATATCGAGGTGCCGAAGTTAATGTGCCGGTTTACAACTGACGTTTTAGGAAGCTGCGCCTTCGGCGTCGATCCTGGATCATTAAAAGATAAAATGTCACCATTTTTTATTATGTCGCAGAAAATGTTCAAAACCGATCGCAGCACTATATTAAAGAGATATTGTCGTTCTTTTTCGCCGCGACTGTTTAAATTTTTAAACCTAAGAACGTACTCGCTGGATGTGGAAGTATTTTTTACTAATATCATCAATCAAGTATTAAACGAGAGGCGAACGACCGGCAAGCAGCGAAGTGATTTCCTACAGCTTATGTTGAATGTCCAAAAAACTGAGATCGGTTTTACGATGACGGATGAATTAATTATATCAAATTCATTTATATTCATGCTCGCCGGTCTAGAGACATCAGCTACAACGCTATCGTTCTGTTTGTATCAGCTCGCCAAAGATATAGATTTACAGAACAGATTAAGAGATGAAGTTAGAGAGTGTATAGAAAATCACGGCGGTTTTAATTACGACGCGATAGGTGCGATGCGTTTGGCGACTCAGACATATTTAGAGACGCTGAGATTACATCCTCCGACGCCTCTTACGACGAGGCTGTGCACATCACCATGCACATTACCTGGTACAGGTCTCAATATGAAAGTCAGAGACGCAGTTCTAGTGCCGATACACCAGATCCACAAAGATCCGAGGCATTTTCCCGATCCGGAGAAATTTGATCCTGAACGTTTCGGTGGTGCCATGAATGTTAACGGTTTTATTGCATTCGGTGACGGACCCAGGAGTTGTCCAGGAGGTCGTTTCGCTCAGATGATGGTGGTAGCTGGTTTGGCTACGATTCTTCAGAATTTCTCAGTGGAGCCATGCTCTAAAACAACACCAACTATACAATACGAAACACGAAGCGTTACAGACATCGAGGTACTCCAAGCCATCAACCAAGGAGACTTCATAGAAGACTGTCTCAATATATTCGTAGAGTTCTCCAACAATAAGCATTACGAACACAATATAGAACCGAATATCCCACTATCCGTCCTAGACCGTGGTTCAGAACTAGAAGTACGTGCACAGAAGAGCGAGTTCAATTTGTCTCCAACATTAGCGTACACACGGCCACCGCCGACAGCCAACCTGGTGGCGGCAGTCGCTGACGTCATCAATAATATCACATTATACAAGAGAGCCCCTGTGCAGCTTTGGAATGAAAAGGGATTGTACAGAGTTTTGTTTAGGTGTATATCTCAGCCTAACGTCTCACAGCGCTCCTTCGCACACACGGCCGTCTGTCGAGCGCTCGCTGCGTCCTCTACACATAAATGCGTGAGGGTCGCGCTCGCCAATACAAAAGACTGTGTGTATCACTTGCTACTAACACTCACTCCTATTGAGTCAGATCCTAGTTGGGTTCTCATAGCGTCTTGCCTCAGTTCTGTGCTATGTTCGAGTGTTCGCGCCCGTTCCTTCGTGGTCCATCGACAGCTTTTCCGCGATATATCTGGTGTACTTCACACCATGAGAGATCACCTCACACTGATGGGGAAACCCATAGACGTTATACGGAACGCTAACCATGAGCCGACCTTGAACACACTGAACTGGGTTCTCATCCTAGCGAGCAGCATGATGGTGGATAATCCCCCAGCCAAGGACCGTCTCTCGGAAGACATAGCCGCCTCCCTGACGCGGCTGTGGCCCTGGTGTATGATGACGGAGGAGTTACGAAACAGTGTCATGCAATTTCTTTTGATATTCACCAATGATTGCCCTAAAGACAACTCTTCTGAGGAATTCACTGCAGCTCAAATAATGACTATCATGTCGATGTCACAAAGTCATATTACGGAGGAAGTACTTGATTTTGAGCAGTATGAAAATATAGCACCCGGCCGAGTTTCATACTTAGACAGGACTGACTCAAGTTTTGGATTAGAACTTCTACACTTTTATATTTTTCTCCAGTTAATTATGGACAGTAGGAACTTAAACAAGGACGGTGAAACGTGTATTCACGGAACATGTTTAGATATGTGCCCACCACAGGAGATGAACTTGAGGAAAAGGGAGAAATTGGTTCATAAATTAGAAGTTACAACGGAAGGTTACAAATTAGTTAAATGCTATAGTCGCTCAGCGGCAGATTCGAACATGGCTGTACCCAGCCAACTTCGACCCTTCCCCACACTTATGACAACAACACAATATTTGTTATTAAATGTTTCAAAAAGGAAAGATGTCAAAATGTCAGTCATATACAATTTCTTGGATGACCGTCTCAGATCTGTGAGGCAGGATATGACGATACAGAGTGACGTGTTATCCGTGTGGTGCAAGCTCCGCGGGAGGTGTCCGTCCTCGCTGTCGTGCTGGTGGTCGCTGTGTGCGAATGTTTGTCGTCACCCGGACGGAGCGGCCGCGGTGTTAGGTTCGATACAGGCGAAGCCAGCGCCAGCCGCGTTACTGCCGGCCCTCGCTAACGCTGCACATCACTGCAGACATGCGTTCTTGCAGTCGTCGGACCTATTGGAGTTGTTGTCTAGCTGCCTGCTGACAGGAGACACGGCCGAGATTGTGTCGTCAGCACGAGCGGTGTGGGCGCTGGCCGCTAACAATCATAGGGCTAAGCTGGTACTCCGTAGTGCAGGGCTCCAAACAGCAGTACAAACTACTTTGCAGCGTTTGCAAAAAAACAAAGATGTCGCCACTCAACGAGCTGTCGAGTTACTGACCTACACCAACACCGTACTTCAAGCTATATGA

Protein sequence:

>DPOGS213800-PA
MLQFFYDKYRDERYVGIFQARRPALMLIDLELIKFVLSKDFQHFTDRISVSTDTQREPLLRNLANMSGTEWQKMRHIVTPTFSSAKMKAMFPLVVDCARTLQTTLENESIEDIEVPKLMCRFTTDVLGSCAFGVDPGSLKDKMSPFFIMSQKMFKTDRSTILKRYCRSFSPRLFKFLNLRTYSLDVEVFFTNIINQVLNERRTTGKQRSDFLQLMLNVQKTEIGFTMTDELIISNSFIFMLAGLETSATTLSFCLYQLAKDIDLQNRLRDEVRECIENHGGFNYDAIGAMRLATQTYLETLRLHPPTPLTTRLCTSPCTLPGTGLNMKVRDAVLVPIHQIHKDPRHFPDPEKFDPERFGGAMNVNGFIAFGDGPRSCPGGRFAQMMVVAGLATILQNFSVEPCSKTTPTIQYETRSVTDIEVLQAINQGDFIEDCLNIFVEFSNNKHYEHNIEPNIPLSVLDRGSELEVRAQKSEFNLSPTLAYTRPPPTANLVAAVADVINNITLYKRAPVQLWNEKGLYRVLFRCISQPNVSQRSFAHTAVCRALAASSTHKCVRVALANTKDCVYHLLLTLTPIESDPSWVLIASCLSSVLCSSVRARSFVVHRQLFRDISGVLHTMRDHLTLMGKPIDVIRNANHEPTLNTLNWVLILASSMMVDNPPAKDRLSEDIAASLTRLWPWCMMTEELRNSVMQFLLIFTNDCPKDNSSEEFTAAQIMTIMSMSQSHITEEVLDFEQYENIAPGRVSYLDRTDSSFGLELLHFYIFLQLIMDSRNLNKDGETCIHGTCLDMCPPQEMNLRKREKLVHKLEVTTEGYKLVKCYSRSAADSNMAVPSQLRPFPTLMTTTQYLLLNVSKRKDVKMSVIYNFLDDRLRSVRQDMTIQSDVLSVWCKLRGRCPSSLSCWWSLCANVCRHPDGAAAVLGSIQAKPAPAALLPALANAAHHCRHAFLQSSDLLELLSSCLLTGDTAEIVSSARAVWALAANNHRAKLVLRSAGLQTAVQTTLQRLQKNKDVATQRAVELLTYTNTVLQAI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: