MonarchBase - Protein-coding gene

DPOGS206678
Transcript	DPOGS206678-TA	1401 bp
Protein	DPOGS206678-PA	466 aa
Genomic position	DPSCF300048 + 1106142-1109696
RNAseq coverage	426x (Rank: top 29%)

Annotation
*Heliconius*	HMEL022654	0.0	76.07%
*Bombyx*	BGIBMGA014622-TA	2e-66	36.68%
*Drosophila*	CG17323-PA	1e-77	34.01%
EBI UniRef50	UniRef50_G9LPR5	0.0	72.65%	UDP-glycosyltransferase UGT44A2 n=2 Tax=Obtectomera RepID=G9LPR5_HELAM
NCBI RefSeq	XP_392319.3	1e-77	35.58%	PREDICTED: similar to CG17323-PA [Apis mellifera]
NCBI nr blastp	gi\|363896108	0.0	72.65%	UDP-glycosyltransferase UGT44A2 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896108	0.0	72.65%	UDP-glycosyltransferase UGT44A2 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	1e-121	metabolic process
	GO:0016758	1e-121	transferase activity, transferring hexosyl groups
KEGG pathway	ame:408788	4e-77
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[44-466] IPR002213	1e-121	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL34670		Lepidoptera specific

Nucleotide sequence:

>DPOGS206678-TA
ATGCCAAACCCGCCTGTCAACTATCATGAAGTTCTACTTAATGACAAACAAGATAATAAAGGCCTGTCATTCGAATCAGTTATTGTGAATGAAGTATCGCGTGTGCCGTTCGAAACTCTGGTATCAACTAAAGAAGGAAACGATGATTGCAAAACGCTAATGAACAATCACGAGGTACTGCACATGATAAGAACGCAACCTAAATATTCTGTGATAATAGTCGAATCATACAATAGTGACTGCGCCCTTGCGTTGGCGGCAAATTTAAGTTCTCCGTACATAGCGTTTAATCCTCAGTCGATACACCCTTGGCATTTCAGTAGACTAGGAATACATTTCAACTCAGCTTACGTCCCCCAATCTCTACTGCCGTTTGGAAAAGAACCATGGTTTTTTGATAGAGTCAAAGGTTTTATATTGTACCACGTAGCGAACTGGGTGTATTATATCGGTTCGCAAGTAACGGATCACGTGTACCTCTATAAATATTTAGGGGATAATCTACCAGCGTTGGAGAGCATAGCGTCAAATGCCAGCCTCGTGTTTGTGAACACCCACAAATCTGTTTTCGGGGGTGTGGTGCGAGCTGATAATGTTGTCGACATCGGAGGAATACATATCAGACCACCCAAAAGTATACCTACGCATATAGAAAGATTTATTAACGAAGCTGAAAACGGAGTTATCTACGTCAACTTGGGGTCAACCGTCAAAGATTTCACATTACCGAGCGACAAACTCACAGAACTAATATCAACGTTCAGAAAATTACAACTCCGAATATTATGGAAATGGGATGGAGACAGCGTGGAAAATCTGCCAAGAAACGTTATGACTATGAAATGGTTTCCGCAGTATGATATTTTAAAACATGACAACGTAAAGGCGTTTATCTCCCACGGTGGTATTCTAAGTTGTACAGAGGCGTTGGATGCCGGCGTGCCAGTGGTAGCTATTCCTTTGTTTGGCGAACAGTATGGCAATTCCGCAGCCCTAGTTGATGCTGGCATTGCCAGTATAGTCACATATGAGAATCTTAAAGATGAACTACTGTTAGACGCCATCAATGAGGTCTTGGATCCAAGATGCCAGCAACAAGCTAAGCTTGTTTCTCGAATGTGGCACGACCGTCCGATGAATGCCTTAGAAACCGCCATCTATTGGATTGAATACGTAGCTCGATACAATGGTTCGCCAAATATGGGAGCGCCATCTGTTAAAGTACCTTGGTACCAACAACTGCAACTAGATGTCCTCGCATTTATTTTTATAGTATTTTATATTGTAATGTACGCTTTTTACAAAGTATTAAAAGTTTGCTGCTGTTGTTGTTGTCAACCGGAACCCCCAGTTGAAAAAATATCACGAGAACGAACGACAAGAAGAGTCAAATTTGAATAA

Protein sequence:

>DPOGS206678-PA
MPNPPVNYHEVLLNDKQDNKGLSFESVIVNEVSRVPFETLVSTKEGNDDCKTLMNNHEVLHMIRTQPKYSVIIVESYNSDCALALAANLSSPYIAFNPQSIHPWHFSRLGIHFNSAYVPQSLLPFGKEPWFFDRVKGFILYHVANWVYYIGSQVTDHVYLYKYLGDNLPALESIASNASLVFVNTHKSVFGGVVRADNVVDIGGIHIRPPKSIPTHIERFINEAENGVIYVNLGSTVKDFTLPSDKLTELISTFRKLQLRILWKWDGDSVENLPRNVMTMKWFPQYDILKHDNVKAFISHGGILSCTEALDAGVPVVAIPLFGEQYGNSAALVDAGIASIVTYENLKDELLLDAINEVLDPRCQQQAKLVSRMWHDRPMNALETAIYWIEYVARYNGSPNMGAPSVKVPWYQQLQLDVLAFIFIVFYIVMYAFYKVLKVCCCCCCQPEPPVEKISRERTTRRVKFE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: