MonarchBase - Protein-coding gene

DPOGS204754
Transcript	DPOGS204754-TA	1497 bp
Protein	DPOGS204754-PA	498 aa
Genomic position	DPSCF300231 - 125784-128344
RNAseq coverage	15x (Rank: top 81%)

Annotation
*Heliconius*	HMEL022545	4e-95	40.16%
*Bombyx*	BGIBMGA002854-TA	1e-64	34.76%
*Drosophila*	CG15661-PB	2e-35	25.45%
EBI UniRef50	UniRef50_G9LPS0	1e-81	37.25%	UDP-glycosyltransferase UGT48A1 n=1 Tax=Helicoverpa armigera RepID=G9LPS0_HELAM
NCBI RefSeq	NP_001037040.1	2e-69	32.72%	phenol UDP-glucosyltransferase [Bombyx mori]
NCBI nr blastp	gi\|363896118	4e-81	37.25%	UDP-glycosyltransferase UGT48A1 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896118	3e-84	37.25%	UDP-glycosyltransferase UGT48A1 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	1.7e-50	metabolic process
	GO:0016758	1.7e-50	transferase activity, transferring hexosyl groups
KEGG pathway	dme:Dmel_CG15661	1e-33
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[11-474] IPR002213	1.7e-50	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL34563		Lepidoptera specific

Nucleotide sequence:

>DPOGS204754-TA
ATGGACAAATTATTGTTACTATCGTGTTGTGTGGTCGCGAGTCACTGTTCCAACATCTTAGTAGTGTTCCCAGTACCGGAGAGGAGTCATCGTGTTCTGGGGGAATCTATAGTTAAAATTTTATTGGAGGCCGGTCATGAGGTGACCTGGGTGACTCCTTTCCCGAGGGACATAAAATGGTCTAAATTAGATTACATTGACATTAGCTCGGCTCTGATACACGAGACAGAGACGGGAAATAATGACGACCATGGCCCGAGTATTTCAGAACTGAGACTTAATATTCAGCAGCTGGGGTCTCGGTACGCCGGTCTGGCTCTCCGACACCCCGCCCTTCAGGAGCTGATGGTGAATACCACCGTACGCTTCGAGGCCGTGGTCGCGGAATGGTATCACTCTGGACTACTGGCTCCACTGGCATCCGTCTTCGATTGTCCATTAGTCTGGTATACTCCTGAAGATATCTCTTGGCAGACATATGGCCTCGTGCATGGAGATAGCAGTCTCGATTTTATGGCTTCCACTCTTCAATCCCCGAGCTACTCTCTCCCAGAGAGATTAAGATATTTGTGGTCAAAACTCTGTTTTGGTGTTCGAAATTACTTTCACATAAGCGCGACTGAATTGCCTGAATATGAAGCATGTTACCTCCGCGCGTTTCAGTCCCGGAGGCGTGTCTTACCAAACTATGAAGAATTGGTTTACCAGGGATCAGCACTTTTAATTAATTCTCATCCGCCACTCGGACACAAAATACCTCTACCATTGAATGCGAAATTTAATATTGCAAAATTATTAGATGGATCGAAGGCAGGAGTTATTTATGTAAACTTAGAATCGCATGTCACAAGCGGAGAGGTGTCACATCATGTTATACAGGAGCTTATAGAGATATTTGGTGTAGTTCAGCAAACTGTGATATGGAAGAGCGAGGAAATCCAGTGGAGCCTTCCACAAAACGTGTTCATGATGAAGAATCCACCTCAAAATATTATACTGAATCACACAAACACCATAGCATATATAAACCACGGCCAGATGCTTTCAATCGTGGATGCGATCAACTTTGGAGTGCCGGTCATCGGTATACCACTTCTAGAAGATCACATTGTCAACATGGACTCTGTAGTGAAAAGAGGATGCGGCATTAAAGTTGACTATACCAACGAGTTTGCCTGGAAGGTTAAAGACGCTGTCAACAGGATACTTAAAATGTCAAGTTATCGTGAGCAATCAAATAAAGATAAATTGATATTCCGCAACCGTGTGGCTACTCCTCAATCAGAAGTCCTGCACTTGATGCAACTGGTGCTGGACTCAGATGGAGCTGGACACCTGCAGTCCTCGACGCTGTTTCTTTCAGTCATGGAGAGACATAACTTGGACATTATTATACTAGTGTTGATGTTCTTTTGGTTCCTGAACAGGGCATGGAGCTTGTTCGGTGCGTACTTTGTTTGGGGGGAAGACGACAGTGATGATAAAAAGTACCAGTAA

Protein sequence:

>DPOGS204754-PA
MDKLLLLSCCVVASHCSNILVVFPVPERSHRVLGESIVKILLEAGHEVTWVTPFPRDIKWSKLDYIDISSALIHETETGNNDDHGPSISELRLNIQQLGSRYAGLALRHPALQELMVNTTVRFEAVVAEWYHSGLLAPLASVFDCPLVWYTPEDISWQTYGLVHGDSSLDFMASTLQSPSYSLPERLRYLWSKLCFGVRNYFHISATELPEYEACYLRAFQSRRRVLPNYEELVYQGSALLINSHPPLGHKIPLPLNAKFNIAKLLDGSKAGVIYVNLESHVTSGEVSHHVIQELIEIFGVVQQTVIWKSEEIQWSLPQNVFMMKNPPQNIILNHTNTIAYINHGQMLSIVDAINFGVPVIGIPLLEDHIVNMDSVVKRGCGIKVDYTNEFAWKVKDAVNRILKMSSYREQSNKDKLIFRNRVATPQSEVLHLMQLVLDSDGAGHLQSSTLFLSVMERHNLDIIILVLMFFWFLNRAWSLFGAYFVWGEDDSDDKKYQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: