MonarchBase - Protein-coding gene

DPOGS214629
Transcript	DPOGS214629-TA	1611 bp
Protein	DPOGS214629-PA	536 aa
Genomic position	DPSCF300050 + 424444-428509
RNAseq coverage	1372x (Rank: top 9%)

Annotation
*Heliconius*	HMEL022592	0.0	74.37%
*Bombyx*	BGIBMGA005046-TA	0.0	63.58%
*Drosophila*	CG17324-PB	9e-74	31.11%
EBI UniRef50	UniRef50_G9LPW3	0.0	63.58%	UDP-glycosyltransferase UGT47A1 n=3 Tax=Obtectomera RepID=G9LPW3_BOMMO
NCBI RefSeq	XP_001811749.1	3e-108	42.25%	PREDICTED: similar to AGAP007920-PA [Tribolium castaneum]
NCBI nr blastp	gi\|363896116	0.0	71.40%	UDP-glycosyltransferase UGT47A2 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896116	0.0	70.22%	UDP-glycosyltransferase UGT47A2 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	2.7e-138	metabolic process
	GO:0016758	2.7e-138	transferase activity, transferring hexosyl groups
KEGG pathway	ame:409304	4e-84
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[11-516] IPR002213	2.7e-138	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL12826		Insect specific

Nucleotide sequence:

>DPOGS214629-TA
ATGCAGGCGCTGCTGTGTCTGGCGCTATGCTGCGCTACAGTCCACGCTGCCAGCATATTGGCAGTGCTGCCCACCAACACCAAGAGCCATTACGCGATGTACGGCCGGCTCATAGAAGCTCTAGCGATCAATGGGCATAATATAACTGTGATCACGCATTTCGCTATGAAAAATCCGCTGCCGAACGTGGACGAGATCAACCTAGCTGGCACGATTCCAGATTTAGCCAACAACCTGACGAAACAGCAGTCGACCTTCAAACCGGACACTATAAGAAATTTGGAGAATATCATCAAGGAATGCGTACACGCTTGTGATGTTGTTTCCCAACATGCTGAAGTCAAAGCACTAGTAAATTCCTCCAAGACATTCGACCTGGTGATAATCGAAGTGTTTGGTAGCGAGTGCTTTCTGCCTTTCGGTAAGAGATTTGATGCACCCGTCGTGGGGTTGCTCTCGAGTGTTCCTTTGCCCTGGTTGAACGATCAATTGGGAAATCCAGAAGAAACTGCCTATGTACCAGCCTACATGATGGGTTACGGACAACATATGAACTTATTTCAACGTTTTATTAATACCGTAGCAGTGATATGGGCTAAGGCGTTTTACAGGAACAAATCACAGATACCATCACAGATAATCGCTGACAGGTTGTTTGGTCCAGGTCCGAGGCTTGAGAGTTTAGCTCAGAACTATAGCCTTGTATTGTCCAACAGTCACTTTAGTATAAACGAAGTTAGACCATTAGTACCAGCTCTGGTGGAGGTCGGGGGCTTACATCTTGACACCACGCAACAGTTACCGAAGGAATTAAGAAATCTCCTGGACAATGCTGACGAGGGAATCATATATTGGAGCTTCGGTTCTATGTCCCGCATCGAAACAATACCTTACGTACAGCTGACACAAATATTCGCTGCTTTATCTGAACTGCCACAGACCGTTCTGGTGAAAATGAACAAGAAGATGCTGCAGGGGAATCTGACGGTACCAGACAACATTTATGCAATGGATTGGATACCGCAATACAAAACTTTATGCCATCCAAACGTTAAATTATTCATATCTCACGGTGGTCTACTCGGTACGCAAGAGGCTGTTGCGTGCAGTGTTCCTATACTGATGGTGCCGTTGTACGCTGATCAGGCTTTAAACGCACGTGCTATGAGCGATCGAGGCGTCGCTAGGATTGTGACATTACGCGATTCGACCACCGAGATATGGAGAGACGCGTTAAGACAGCTATTGACAAATACGAGGTACAAACAGAAAGCTATCGAACTTAGAGATAAATTCTTGGACCGGCCTCTACCACCTCTGGAGACTGGGATTTACTGGATCGAATACGTCATAAGACACAGGGGTGCACATCACCTACGGTCCCCAGCTCTCGACTTGACCTACGCCCAGTACCACCTGCTCGATGTGGCAGCCCTAATCATAGCCATCACCGCCACCATCACATACATACTACATAAGCTGTTCAGATACCTATGCACCCGTTGCGTTCGGTGGTGCGAGAAACACACCGTTATAGAGAAGAGACTCTTTATAAGGAACAGTAGTTTGTTCCAGTGTTTTCTTTGGTTATACAAAGTGAAGCCTAATTAG

Protein sequence:

>DPOGS214629-PA
MQALLCLALCCATVHAASILAVLPTNTKSHYAMYGRLIEALAINGHNITVITHFAMKNPLPNVDEINLAGTIPDLANNLTKQQSTFKPDTIRNLENIIKECVHACDVVSQHAEVKALVNSSKTFDLVIIEVFGSECFLPFGKRFDAPVVGLLSSVPLPWLNDQLGNPEETAYVPAYMMGYGQHMNLFQRFINTVAVIWAKAFYRNKSQIPSQIIADRLFGPGPRLESLAQNYSLVLSNSHFSINEVRPLVPALVEVGGLHLDTTQQLPKELRNLLDNADEGIIYWSFGSMSRIETIPYVQLTQIFAALSELPQTVLVKMNKKMLQGNLTVPDNIYAMDWIPQYKTLCHPNVKLFISHGGLLGTQEAVACSVPILMVPLYADQALNARAMSDRGVARIVTLRDSTTEIWRDALRQLLTNTRYKQKAIELRDKFLDRPLPPLETGIYWIEYVIRHRGAHHLRSPALDLTYAQYHLLDVAALIIAITATITYILHKLFRYLCTRCVRWCEKHTVIEKRLFIRNSSLFQCFLWLYKVKPN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: