MonarchBase - Protein-coding gene

DPOGS209772
Transcript	DPOGS209772-TA	1488 bp
Protein	DPOGS209772-PA	495 aa
Genomic position	DPSCF300397 - 45240-49510
RNAseq coverage	1110x (Rank: top 11%)

Annotation
*Heliconius*	HMEL022619	5e-162	56.14%
*Bombyx*	BGIBMGA010289-TA	4e-129	50.00%
*Drosophila*	CG15661-PB	3e-60	30.52%
EBI UniRef50	UniRef50_G9LPQ6	7e-133	51.30%	UDP-glycosyltransferase UGT40Q1 n=1 Tax=Helicoverpa armigera RepID=G9LPQ6_HELAM
NCBI RefSeq	NP_001037040.1	1e-134	51.24%	phenol UDP-glucosyltransferase [Bombyx mori]
NCBI nr blastp	gi\|112983138	2e-133	51.24%	phenol UDP-glucosyltransferase precursor [Bombyx mori]
NCBI nr blastx	gi\|112983138	6e-133	50.40%	phenol UDP-glucosyltransferase precursor [Bombyx mori]

Group
Gene Ontology	GO:0008152	3.1e-118	metabolic process
	GO:0016758	3.1e-118	transferase activity, transferring hexosyl groups
KEGG pathway	dme:Dmel_CG15661	2e-58
	K00699 (UGT)	maps->	Drug metabolism - cytochrome P450
			Starch and sucrose metabolism
			Porphyrin and chlorophyll metabolism
			Steroid hormone biosynthesis
			Pentose and glucuronate interconversions
			Ascorbate and aldarate metabolism
			Drug metabolism - other enzymes
			Metabolism of xenobiotics by cytochrome P450
			Retinol metabolism
InterPro domain	[2-495] IPR002213	3.1e-118	UDP-glucuronosyl/UDP-glucosyltransferase
Orthology group	MCL23345		Lepidoptera specific

Nucleotide sequence:

>DPOGS209772-TA
ATGGTGTTCCCTGTGCCCGGAAAGAGTCACTCCATCCTGGGGGAGGGTTATGTAAGACATTTGTTAGCGGCTGGACATGAGGTAACCTATTTAACTCCGATACCGATTAAAAACCCGCCAGACAGACTTCGACAGATAGATGTGTCTGAAAACATAAAGTATATGTCAGAAGAACTTTTTGATGTAAAGAAGTACATGTATAAAGAAGTTAATTTGGTTCATTTGGAACTCACTGAACTGTTCGACAATCTCTGTTATAATACCTTCAAAATTGACAGCGTCCAAAGATTTATGAGAGACAAAGACGTTGATTTTGATGTCGTCATTGTCGAGTGGCTGTATTCTGAACTAGGTGTTGGGTTTTCATCAGTCTTTAATTGTCCTCTGGTATGGTCATCGTCTTTGGATGTTCACACTGAGGTGCTAGGTCTCATAGATGGGTACACAAACCCGGCGTACACCAAACATTTCTTCTCTACTGATTATTCATTCACGTTTTGGGATAGAGTGAATGAACTTTGGAGGGTATCCCGATTACTGTTATATAAATGGTGGCACATTGACGAGAACGATAAGATGTTTCGAGAGATATTCGGACCGGCTGCCGAAGAACGAGGTATAAAATTACCACATTTCAACGACGTGCGCTACAATGCATCCCTCATGCTTGGCAATTCACATATAGTGATTGGAGATGCAATCGCACTGCCGCAGAATTACCTGCATATCGGAGGTTACCACATTAAAAACGTTTTGGAACCGCTACCAAAGGATCTACAACAAATCATGGATAAGGCCAAAAATGGTGTAATATACTTCAGTTTGGGCAGTACGTTACAAGGCAGTAAAATACCAAGTAACGTTAAAAGGAAATTTCTTGACATGTTTGGTGAATTAAGCCAAAACGTTATTTGGAAATTGGATGGAAAAATTACAGATTTACCTAAAAATGTGCATATCGTTGATTGGGCTCCGCAACAAAGTATTTTGGCACATCCTAATTGCGTACTTTTTATAACACACGGTGGTCTTCTATCAACGTTAGAGACCATTAAATATGGCGTGCCAATTATCGGTATACCATTCTTTGCCGACCAATTCCTTAATGTCAACAAAGTTGTCGCTAAAGGATTCGGCAGGCGTGTAGATATAAGTGAAAACACACCGGAAGAATTGAGATTTGCTATAAGGGAAGTATTAGGAAATACCAGCTACCGCACTCGTGTGAAGGAACTGTCATCTCTGTTCATCGCTGATTCAGATCCAGGACAGCGATTGGTTCAGGGCGTGGAGTTAGTGGTCAGGACAAACGGAGCACCACATCTTCGTTCCGTCGCACTACGCGTGCCGTTCTACCAAAAACTGTACTTGGATGTTTTACTATTAGTTATTGCAATCGTTTTTGGACTTCCTCTTGTCATATATTATACGTGTAAACACTTATTGTTGGATGGCACTAAGTCTAATCTTAATAAGAAGAGAAACTAG

Protein sequence:

>DPOGS209772-PA
MVFPVPGKSHSILGEGYVRHLLAAGHEVTYLTPIPIKNPPDRLRQIDVSENIKYMSEELFDVKKYMYKEVNLVHLELTELFDNLCYNTFKIDSVQRFMRDKDVDFDVVIVEWLYSELGVGFSSVFNCPLVWSSSLDVHTEVLGLIDGYTNPAYTKHFFSTDYSFTFWDRVNELWRVSRLLLYKWWHIDENDKMFREIFGPAAEERGIKLPHFNDVRYNASLMLGNSHIVIGDAIALPQNYLHIGGYHIKNVLEPLPKDLQQIMDKAKNGVIYFSLGSTLQGSKIPSNVKRKFLDMFGELSQNVIWKLDGKITDLPKNVHIVDWAPQQSILAHPNCVLFITHGGLLSTLETIKYGVPIIGIPFFADQFLNVNKVVAKGFGRRVDISENTPEELRFAIREVLGNTSYRTRVKELSSLFIADSDPGQRLVQGVELVVRTNGAPHLRSVALRVPFYQKLYLDVLLLVIAIVFGLPLVIYYTCKHLLLDGTKSNLNKKRN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: