MonarchBase - Protein-coding gene

DPOGS200225
Transcript	DPOGS200225-TA	1410 bp
Protein	DPOGS200225-PA	469 aa
Genomic position	DPSCF300414 + 5918-9358
RNAseq coverage	63x (Rank: top 68%)

Annotation
*Heliconius*	HMEL022531	0.0	82.20%
*Bombyx*	BGIBMGA008381-TA	5e-112	72.11%
*Drosophila*	CG30438-PD	7e-148	54.25%
EBI UniRef50	UniRef50_G9LPS1	0.0	66.92%	UDP-glycosyltransferase UGT50A2 n=2 Tax=Obtectomera RepID=G9LPS1_HELAM
NCBI RefSeq	XP_001816444.1	2e-161	60.14%	PREDICTED: similar to CG30438 CG30438-PB [Tribolium castaneum]
NCBI nr blastp	gi\|363896120	0.0	66.92%	UDP-glycosyltransferase UGT50A2 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896120	0.0	66.92%	UDP-glycosyltransferase UGT50A2 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	2.6e-126	metabolic process
	GO:0016758	2.6e-126	transferase activity, transferring hexosyl groups
KEGG pathway	dme:Dmel_CG6658	4e-61
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[5-427] IPR002213	2.6e-126	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL13802		Single-copy universal gene

Nucleotide sequence:

>DPOGS200225-TA
ATGGGAGGTACAAAATCTCATAAAATACCATTCTTGGAACTGGCCAGAGGTCTGCTTAGAAGGAATCACAATATTACTTTAATAAGTCCTTTCACGCCTGATTTTCATATTGAGGGTCTGGAGGAGATCACTCCGGAAGGCTTGATGTCCTTTGTAAGAGGATATATGACCTTTGACCTGGTGGGTGCAAGGATGAGAGGTGAAGAACCATTGCCATATATGGATATTATAAGATATGGTTATGAGGCATGCGAAGCTTTTCTAAGCGACGTCGAGACAAAATCCTTTTTGAGATCAGGAAGGAATTACGATCTTATTGTTCTAGACGGGGCATATCCTGAGTGCGCTTTAGGCCTTGTCTATCGAATGAAAGTGCCTTTCATGTATATTAATACGGTGGGATTTTACGCAGGACCAACGAGTATTTCTGGTAGTCCGGCACCATACTCTGTCACTCCGATTTTTGCCAAAGCTTTCACAGATAATATGGGATTCATAGATAGAACACTCAATACTATGTGGAATATTGGAGCCATGTTAGGGCACATCGCAAGTGTTACAGTTTTGCAAGGAGTTTTAAAGAGACATTTTGGCTCAAAGATCCCTCACGTGTATGATATGGGCAAAAATGTCAGTTTTATTCTCCAAAACGGACATTATTCGGTTTCGTATCCGCGGCCGTTTTTACCAAATGTTGCTGAAGTAGCCTGTATTCACTGCAAGGAACCCAAGGTTTTAAGTTCGGATTTAGAAGAGTGGATAGCTGGTGCTGGTGAAGCTGGTTTTGTGTACGTATCTATGGGATCATCAGTTCGAACGAACAAGATGCCATTATCAGCGCACCGTCTGTTCGTGAAGGCATTGGGAAGACTGCCGCAGCGAGTTCTTTGGAAACAGGACGGGGAGCAAAACATGACGGACATACCTACCAACACCAGGATATACAACTGGCTACCACAGCAAGATTTATTAGGTCATCCGAAAATAAAGGCGTTTGTGACTCACGGAGGTCTTCTCAGTATGTTCGAGACGGTGTACCACGGAGTCCCCATCATCAGTATACCAGTTTTCTGCGACCACGACGCAAACGCAGCTAAGGCTGAACTCGATGGGTTTGCAAAAAAGTTAGATCTTCAGCAGCTCACCTCAGATAAACTATACAAAGCTATCAAAGAAGTGATCAATGACCCAAAATATAAGAAGCAAGTCAAAATTAGACAAACACTCCTGAGAGATCAAAAGGAATCACCCTTGGAACGGGCTATTTATTGGACGGAGTTCGGTTTTAAACGTGCCGTCGAATATTTACACAACAAGAGAATGGATAAGTTGATCAACAAGTCTAGCGATTTGTTAAAGAGATCCTCTAAATTAATAGGTGAAGCCACAATGAAGAAGAAACGGTTGTAA

Protein sequence:

>DPOGS200225-PA
MGGTKSHKIPFLELARGLLRRNHNITLISPFTPDFHIEGLEEITPEGLMSFVRGYMTFDLVGARMRGEEPLPYMDIIRYGYEACEAFLSDVETKSFLRSGRNYDLIVLDGAYPECALGLVYRMKVPFMYINTVGFYAGPTSISGSPAPYSVTPIFAKAFTDNMGFIDRTLNTMWNIGAMLGHIASVTVLQGVLKRHFGSKIPHVYDMGKNVSFILQNGHYSVSYPRPFLPNVAEVACIHCKEPKVLSSDLEEWIAGAGEAGFVYVSMGSSVRTNKMPLSAHRLFVKALGRLPQRVLWKQDGEQNMTDIPTNTRIYNWLPQQDLLGHPKIKAFVTHGGLLSMFETVYHGVPIISIPVFCDHDANAAKAELDGFAKKLDLQQLTSDKLYKAIKEVINDPKYKKQVKIRQTLLRDQKESPLERAIYWTEFGFKRAVEYLHNKRMDKLINKSSDLLKRSSKLIGEATMKKKRL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: