MonarchBase - Protein-coding gene

DPOGS207651
Transcript	DPOGS207651-TA	2484 bp
Protein	DPOGS207651-PA	827 aa
Genomic position	DPSCF300133 - 148056-157203
RNAseq coverage	536x (Rank: top 23%)

Annotation
*Heliconius*	HMEL022645	0.0	59.15%
*Bombyx*	BGIBMGA010433-TA	6e-103	61.19%
*Drosophila*	CG17323-PA	2e-78	33.14%
EBI UniRef50	UniRef50_G9LPR6	1e-179	57.36%	UDP-glycosyltransferase UGT46A3 n=6 Tax=Obtectomera RepID=G9LPR6_HELAM
NCBI RefSeq	XP_971626.2	7e-90	38.82%	PREDICTED: similar to glucosyl/glucuronosyl transferases [Tribolium castaneum]
NCBI nr blastp	gi\|363896110	4e-179	57.36%	UDP-glycosyltransferase UGT46A3 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896110	6e-174	57.36%	UDP-glycosyltransferase UGT46A3 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	4.4e-126	metabolic process
	GO:0016758	4.4e-126	transferase activity, transferring hexosyl groups
KEGG pathway	ame:408788	7e-80
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[316-827] IPR002213	4.4e-126	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL20396		Insect specific

Nucleotide sequence:

>DPOGS207651-TA
ATGCGACCGCTTATTTATTTCGCTGCGATAATCGCTCTCTCCACCGTTGAAGGGGGACGGATTCTTGGGCTCTTCCCGCACACAGGCAAGAGCCACCAGATGGTCTTCGAGCCGCTGTTAAAGAAACTCGCTGAAAGAGGACACCAAGTCACAGTAGTGTCGTTCTTCCCCTTAAAAAAACCAATCGCAAATTACACTGATGTCAGCCTTGAGGGGATCGCGACTTTAGGTGTGGAAACTATTAATCTAGGCTGGTATGAGGAATTTAGTATTTGGACAAAGCTACCAAAAATAGGTAGAGTAATCAAGCAACTGTCGGAGTTCCAACCTTTAGCAGGAATGGCGTTAGACGTTTGCAGTAAGGCTGTAGATTGGGTTCCTTTAAAGGAAGCTCTGCAGAAGAATTACGATTTAGTGCTGGTTGAAAATTTCAACAGTGATTGTATGATGGGTCTGTTGCACATTTACGATATAAAGGCTCCTGTAATTGCATTACTGTCAAGTGCCATGATGCCATGGTCATCGGACCGTATTGGCGTAACAGATAACCCCTCTTACGTGCCAATTATAAGTTCAACCTTTACCCCGACAATGAATTTAATGGATCGAATTGAAAACACGTTCCTTAACGCCTATCATAAGATATGGTTCCGTTACGCAATACAATTAAAAGAACAAGCACTCATAGAAACACATTTTAGAACGAAAATACCAGATCTGGACATATTATCACGAAACATAACATTGATGTTCTTGAATACGTTTCATGCTTTGAATGGTGTAAAACCACTTGTACCAGGTATCGTGGAAGTTGGGGGGATGCACTTGGATCCTACGCGAAAAAACATCCCCGAGATAATTTTGAACAGTCTACTGCACGCCAGTCGGGTGCGGGCGCGCAAAATGATTTTAACGAAAATCATTATATTGTCATTCTTATCGTTACCCAATGATGTGTATTGTGCGAGAATATTAGGCCTATTTCCTCATCCCGGCAAAAGTCACTTCATGGTATTCGAGCCCCTACTGAAAAGATTATCCGAGTTAGGACACCATGTCACTGTAGCATCCTTCTTTCCACCGGAAAACCCACCCGCTAACTACACTCACATAAAGTTTGATGGAGCTGGTGAACCCAGATTGGATATATTAGATTTAAAAACGAACGATAATGTAAATTTTGTTAGGAGAATACCCATCCTCGGTGGCATTATCCAGCAGATGTCGGATTTCAATCTGTTAGCTGAACTAGCATTAACTAAGTGTCAGCAAATAATAGAATTTCAGCCATTAGCTAATGTTCTGAAAGAGGACTACGATTTGGTGTTCATAGAGATTTTCAACAGTGACTGTGCTCAAGGTCTCATACATCAGTATGGAATTAAGGCACCCATTATCGGCCTGTCGTCCTGTACAATAATGCCATGGACAGCTTACCGTATAGGAGTTTCTGATAATCCTGCGTATGTGCCAGTTATGGGCACAACTCATACTCCTACAATGTCATTATTACAACGGATGGAGAACACATTTATGTTGCTCTACCATAATTTGTGGTACCGGTACAAAGTCCAAGTAAAAGAACAGGCTATAATTGAGAATTACTTCGGACGGAAGATGGCCGACTTAGATTTACTGTCTCGGAATATATCATTACTGCTTGTGAACACGTTCCATCCCCTGAACGGTGTCAAACCACTCGTGCCAGGTGTGGTGGAAATCGGAGGAATACATTTAAATCCAAATAAAAAAAGTATTCCAGGGTACATCGAAAGATTCCTTAACGAATCAAAACACGGCGTCATCCTTTTGAGTTTCGGATCTCTCATCAAAACATCGACTATACCTAAGTACAAGGAAGAAATCATCGTTAATACTCTATCAAAATTCAAACAGCGCGTCATATGGAAGTATGAAGAGAGCGAGCCAGAGGGTACACTTGTGGGCAACATTCTGAAAGTAAGATGGTTGCCGCAATTTGAACTTTTACAACATGAAAAAGTTGTGGCTTTCATAGCCCATGGTGGGTTGTTGGGGATGACGGAGTCCGTGTATTCTGGGAAGCCGATGGTGGTGGTGCCTTTCTTCGGAGACCAACCCTCAAACGCCGCGGCCGCTGCCAACGCCGGCTTCGCTAAGATCATCTCCTATATAGACATGACAGAGAAAGATTTAGGTGATGCAGTTAGGAGCGTCCTGAGTGAAGAAATGCAACTGAATGCACGTCGAGTTTCAAAAATGTGGCAGGACAGAGAGTCAGCTCCACTAGATACGGCTGTATACTGGACTGAGCGTGTTTTAAGATGGGGACACTCAGGTCAACTTCATACGGCCGCAAGAGACTTGTCACTGTATGAACTTGCCCTTATAGATGTTTTTGCTGCGTATGCCCTTGCCTTAACAGTTATTTTGTTATCTGTGTGGTTCATTCTCACAAAGTTGATGAGGTTAATTATAAAGGAAAGTAAACAAAAAATACATTAG

Protein sequence:

>DPOGS207651-PA
MRPLIYFAAIIALSTVEGGRILGLFPHTGKSHQMVFEPLLKKLAERGHQVTVVSFFPLKKPIANYTDVSLEGIATLGVETINLGWYEEFSIWTKLPKIGRVIKQLSEFQPLAGMALDVCSKAVDWVPLKEALQKNYDLVLVENFNSDCMMGLLHIYDIKAPVIALLSSAMMPWSSDRIGVTDNPSYVPIISSTFTPTMNLMDRIENTFLNAYHKIWFRYAIQLKEQALIETHFRTKIPDLDILSRNITLMFLNTFHALNGVKPLVPGIVEVGGMHLDPTRKNIPEIILNSLLHASRVRARKMILTKIIILSFLSLPNDVYCARILGLFPHPGKSHFMVFEPLLKRLSELGHHVTVASFFPPENPPANYTHIKFDGAGEPRLDILDLKTNDNVNFVRRIPILGGIIQQMSDFNLLAELALTKCQQIIEFQPLANVLKEDYDLVFIEIFNSDCAQGLIHQYGIKAPIIGLSSCTIMPWTAYRIGVSDNPAYVPVMGTTHTPTMSLLQRMENTFMLLYHNLWYRYKVQVKEQAIIENYFGRKMADLDLLSRNISLLLVNTFHPLNGVKPLVPGVVEIGGIHLNPNKKSIPGYIERFLNESKHGVILLSFGSLIKTSTIPKYKEEIIVNTLSKFKQRVIWKYEESEPEGTLVGNILKVRWLPQFELLQHEKVVAFIAHGGLLGMTESVYSGKPMVVVPFFGDQPSNAAAAANAGFAKIISYIDMTEKDLGDAVRSVLSEEMQLNARRVSKMWQDRESAPLDTAVYWTERVLRWGHSGQLHTAARDLSLYELALIDVFAAYALALTVILLSVWFILTKLMRLIIKESKQKIH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: