MonarchBase - Protein-coding gene

DPOGS205682
Transcript	DPOGS205682-TA	2697 bp
Protein	DPOGS205682-PA	898 aa
Genomic position	DPSCF300250 - 440976-451287
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL022626	1e-133	48.82%
*Bombyx*	BGIBMGA013860-TA	0.0	45.44%
*Drosophila*	Ugt35b-PA	1e-58	33.59%
EBI UniRef50	UniRef50_G6CZJ2	0.0	49.50%	Antennal-enriched UDP-glycosyltransferase n=11 Tax=Obtectomera RepID=G6CZJ2_DANPL
NCBI RefSeq	NP_001040425.1	9e-124	44.66%	antennal-enriched UDP-glycosyltransferase [Bombyx mori]
NCBI nr blastp	gi\|363896128	9e-123	44.47%	UDP-glycosyltransferase UGT33D4 [Bombyx mori]
NCBI nr blastx	gi\|114051706	5e-123	44.74%	antennal-enriched UDP-glycosyltransferase precursor [Bombyx mori]

Group
Gene Ontology	GO:0008152	6.7e-104	metabolic process
	GO:0016758	6.7e-104	transferase activity, transferring hexosyl groups
KEGG pathway	dpo:Dpse_GA19751	2e-56
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[1-388] IPR002213	6.7e-104	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL19122		Lepidoptera specific

Nucleotide sequence:

>DPOGS205682-TA
ATGCTTCGTAATATGAATCCCCTCTTTATGAAGGTCATTGAGTATCATTTTCAATCCAAAGAAGTCCAGGAAATCGTAGCTAATAATAAATATGATCTGATATTGTTAGAATCTATTGTTCTCTCGGGATTGATATACTCACACATATTCAAGGCTCCAGTGATATTAGTGAGTTCATTCGGAGGTTATATAAATGAACATAAAATAATGGGGACACCGACTGCACCTATTTTGTATCCATTGCCTCTGCGAAATAAAATTTACAATCTTAATTTTTTTGAAAAGATCCGAGAAATATACAGACATTATTCAAACGAATATGCAGAATATTTGAATGACCTTGACATTGATAAATTTTTGAAAGATAGATTTGGTTCCCAAACTCCAACTATAAATGAATTGAGTGATAATATTCATATGCTCTTTTTAAATGTTCACACCATTTGGGCAGATCATAAGCCCAGCACTCCGAATATTGTCTATATGGGTGGTATACACCAAGTACCACAGAAAGATTTACCGAAGGACCTTGAGACATTCCTCAATTCTTCTAAACACGGAGTCATATATGTAAGCTTTGGGACAAATGCTTTGTCATATATGATTCCTTCAGATAAAATAGAAAATGTGGTAAAAGTTCTATCAAAACTTCCCTACGATGTGTTATGGAAATGGGATGGAGAGGAATTGCCGGGAAAGTCAGACAATATTAGGTTATCCAAATGGTTCCCACAATCTGATCTGTTGAGACATCCAAATATAAAACTTTTTATAACACAAGCTGGACTGCAATCTACTGATGAAGCTATAACAGGTGGGGTACCGTTAGTTGCCATACCAATGTTTGGCGATCAATGGTACAATGCTGAAAAATTTGAAAAATTCGGTATTGGTATTCAACTAGACATTACAAGCTTTACAGAGGAAGAACTGCATAATGCTGTAATTACCGTAATAAATAATGAAAGCTACCGGAACAACGTTTTTAAACTTCGTGAAATAATTCTTGATCAACCAATGAGTTCTATAGAACGTGCAATGTGGTGGACAGAATATGTATTAAGACACAGAGAAAAGAATCATTTTCGTACTCTAGCTAGTAACTTGTCATACATGGATTACTTCGATGTAAAGTTTTGGATGACTATTTTTGCAATCATTGTAGACATAAGTAAAAACATGAAAATTGAAATACTAACAATTTTTTTTATATTGGTATGGGTATATCAAGTAAAATCAGCAAGAATATTAGGTGTATTCCCAGTACCATCACTTAGCCATCAAATCGTTTTCCGTAAGATTACTCAAGAACTCCATAAACGAGGACATGAAATGACAGTGTTAACACCAGACCCAGCTTATCCAAAAGGAACTGCACCCGCAAATTATACCGAAATAGATTTTCACGATGCATCATACAAAATATTCAAAGCAAATATTTATGCCAGTTATAAAAGCGAAGGTTTAGCAATTAACTTCGACGCGGTTAGAGAAATATACAACCATTATTCAAACGAATATGCAGAATATTTGAATGACCTTGATCGTGATAAATTTTTAAAAGAGAGTTTTGGTCCCCAAACTCCAACTATGAATGAATTGAGTGAAAATATTCATATGGTCTTTCTAAATGTTCATACCATTTGGGCCGATAACAAACCTACTACTCCGAATATTCTCTACCTGGGTGGCATACACCAAGTACCGCAAAAAAAATTGCCAAAGATCAGAGAAATATACAGACATTATTCAAACGAATATGCAGAATATTTGAATGACCTTGACAATGATAAATTATTGAAAGAGAGATTTGGTTCCCAAACTCCAACTATAAATGAATTGAGTGATAATATTCATATGCTCTTTTTAAATGTTCACACCATTTGGGCCGATCATAAGCCCAGTACTCCGAATATTGTCTATATGGGTGGTATACACCAAGTACCACAGAAAGATTTACCGAAGGACCTTGAGACATTCCTCAATTCTTCTAAACATGGAGTGATATATGTAAGCTTTGGGACAAATGCTTTGTCATATATGATTCCTTCAGATAAAATAGAAAATGTGGTAAAAGTTCTATCAAAACTTCCCTACGATGTGTTATGGAAATGGGATGGAGAGGAATTGCCGGGAAAGACAGACAATATTAGGTTATCCAAATGGTTCCCACAATCTGATCTATTGAGACATCCAAATATAAAACTTTTTATAACACAAGCTGGACTGCAATCTACTGATGAAGCTATAACAGGTGGGGTACCGTTAGTTGCCATACCAATGTTTGGCGATCAATGGTACAATGCTGAAAAATTTGAAAAATTCGGTATTGGTATTCAACTAGACATTACAAGCTTTACAGAGGAAGAACTGCATAATGCTGTAATTACCGTAATAAATAATGAAAGCTACCGGAACAACGTTTTTAAACTTCGTGAAATAATTCTTGATCAACCAATGAGTTCTATAGAACGTGCAATGTGGTGGACAGAATATGTATTAAGACACAGAGAAAAGAATCATTTTCGTACTCTAGCTAGTAACTTGTCATACATGGACTACTTCGATGTAAAGTTTTGGATGACTATTTTTGCAATCATTGGTATCTTATTAACGTTATTTGTGGTAACGATTGCATATGTCATAAAATTTCTTATTAAGATATGGCTTGCATATAATAAGGTAAAAAAACAATAA

Protein sequence:

>DPOGS205682-PA
MLRNMNPLFMKVIEYHFQSKEVQEIVANNKYDLILLESIVLSGLIYSHIFKAPVILVSSFGGYINEHKIMGTPTAPILYPLPLRNKIYNLNFFEKIREIYRHYSNEYAEYLNDLDIDKFLKDRFGSQTPTINELSDNIHMLFLNVHTIWADHKPSTPNIVYMGGIHQVPQKDLPKDLETFLNSSKHGVIYVSFGTNALSYMIPSDKIENVVKVLSKLPYDVLWKWDGEELPGKSDNIRLSKWFPQSDLLRHPNIKLFITQAGLQSTDEAITGGVPLVAIPMFGDQWYNAEKFEKFGIGIQLDITSFTEEELHNAVITVINNESYRNNVFKLREIILDQPMSSIERAMWWTEYVLRHREKNHFRTLASNLSYMDYFDVKFWMTIFAIIVDISKNMKIEILTIFFILVWVYQVKSARILGVFPVPSLSHQIVFRKITQELHKRGHEMTVLTPDPAYPKGTAPANYTEIDFHDASYKIFKANIYASYKSEGLAINFDAVREIYNHYSNEYAEYLNDLDRDKFLKESFGPQTPTMNELSENIHMVFLNVHTIWADNKPTTPNILYLGGIHQVPQKKLPKIREIYRHYSNEYAEYLNDLDNDKLLKERFGSQTPTINELSDNIHMLFLNVHTIWADHKPSTPNIVYMGGIHQVPQKDLPKDLETFLNSSKHGVIYVSFGTNALSYMIPSDKIENVVKVLSKLPYDVLWKWDGEELPGKTDNIRLSKWFPQSDLLRHPNIKLFITQAGLQSTDEAITGGVPLVAIPMFGDQWYNAEKFEKFGIGIQLDITSFTEEELHNAVITVINNESYRNNVFKLREIILDQPMSSIERAMWWTEYVLRHREKNHFRTLASNLSYMDYFDVKFWMTIFAIIGILLTLFVVTIAYVIKFLIKIWLAYNKVKKQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: