MonarchBase - Protein-coding gene

DPOGS205723
Transcript	DPOGS205723-TA	1272 bp
Protein	DPOGS205723-PA	423 aa
Genomic position	DPSCF300250 + 422947-424458
RNAseq coverage	56x (Rank: top 69%)

Annotation
*Heliconius*	HMEL022626	6e-142	60.53%
*Bombyx*	BGIBMGA013860-TA	4e-126	52.82%
*Drosophila*	CG6475-PC	9e-61	30.88%
EBI UniRef50	UniRef50_G6CZJ2	0.0	100.00%	Antennal-enriched UDP-glycosyltransferase n=11 Tax=Obtectomera RepID=G6CZJ2_DANPL
NCBI RefSeq	NP_001135960.1	7e-122	48.39%	uridine diphosphate glucosyltransferase [Bombyx mori]
NCBI nr blastp	gi\|363896068	1e-125	51.96%	UDP-glycosyltransferase UGT33J1 [Helicoverpa armigera]
NCBI nr blastx	gi\|363896052	3e-127	52.39%	UDP-glycosyltransferase UGT33B7 [Helicoverpa armigera]

Group
Gene Ontology	GO:0008152	4.4e-115	metabolic process
	GO:0016758	4.4e-115	transferase activity, transferring hexosyl groups
KEGG pathway	dme:Dmel_CG15661	1e-56
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[2-423] IPR002213	4.4e-115	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL18547		Lepidoptera specific

Nucleotide sequence:

>DPOGS205723-TA
ATGACCTTTTCTGACGTAAGGGGAACTTCTATGTTCATGAGGGCGATATTTCGAGCACAGTTGGAAACAGAAGAGGTGCAGAAAATAATATCTGAGAGGCCTAAATTTGATTTGATTTTAATAGAATCAATTAATCGTCTGGGTTTATCGTACTCGCATCTATTTAAGGCACCGGTTATATTAGTTAGCTCATTCACAGCTGTTTTCGATAATCATAATGTTATGGGATCTCAAACGCATCCTTTTTTGTATCCAATATCTTTTCGTGATCGGATTTACAATCTCTCGCTTACTGAAAAGTTAAAACAATTATATATCCATTTTTATGTTGAATACGCAGATTATTTAAATCGAAAAGAAGAAAATTCTTTTCTAAAGGAAATTTTCGGGCCTCAATGTCCATCGCTGAATGAAATGAATAAAAATGTTGACATGTTGCTTTTAAATATTCATCCTATGTGGGTAGACAATCAGCCTGTTGCCTCCAATGTAATTTATATGGGTGGTATACATCAGTTACCTGAAAAAAAACTACCACAGGAACTTCAAAAATATTTAGATTCATCTAAAAAAGGAGTCATTTATGTGAGTTTCGGAACCAACGTGCTGTCGCAAGTTTTTCCTGAAGATAAACTTAAAATTATTATCAATGTTGTATCAAGACTTCCTTACGATATACTATGGAAATGGGATAAGGATGAACTACCTATAAAAGCCAGCAATATCAAATTATCAAAATGGTTGCCACAATCTGATTTATTAAGGCACAAGAATGTTAAACTTTTCATAACACAAGCTGGTCTCCAGTCTACCGATGAAGCCATTACAGCAGGAGTTCCTCTGGTTGCGATTCCAATGTTAGGAGACCAATGGTTTAATGCTGAGAAATATGAAAAGTTCGGTATCGGTATTAAATTAGATGTTAAGACCTTGACAACGGATCAACTATCCAAAGCCATTGAGACCGTTATAAGTGATGAAAGCTATCGTCACAATATATCAAAACTTCGAGGTCTAATGCATGATCAGCCCGAACCACCTCTTAATCGGACCATGTGGTGGATTGAATATGTATTAAGACATGGTGGCGCAAAACATTTACGATCGGCTGGAGCTAATATGTCATATTGGGAATATTTTGAAACGGAATTAATATTAGTGATTCTCTTAGGAATATTTATAATTGTAGCAGGGATTTCTGTTGTAGGTTTTATGCTTATACATTTTATTTCACAATTTTCCAAAACTACGAAGAAATTAAAAACAAATTAA

Protein sequence:

>DPOGS205723-PA
MTFSDVRGTSMFMRAIFRAQLETEEVQKIISERPKFDLILIESINRLGLSYSHLFKAPVILVSSFTAVFDNHNVMGSQTHPFLYPISFRDRIYNLSLTEKLKQLYIHFYVEYADYLNRKEENSFLKEIFGPQCPSLNEMNKNVDMLLLNIHPMWVDNQPVASNVIYMGGIHQLPEKKLPQELQKYLDSSKKGVIYVSFGTNVLSQVFPEDKLKIIINVVSRLPYDILWKWDKDELPIKASNIKLSKWLPQSDLLRHKNVKLFITQAGLQSTDEAITAGVPLVAIPMLGDQWFNAEKYEKFGIGIKLDVKTLTTDQLSKAIETVISDESYRHNISKLRGLMHDQPEPPLNRTMWWIEYVLRHGGAKHLRSAGANMSYWEYFETELILVILLGIFIIVAGISVVGFMLIHFISQFSKTTKKLKTN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: