MonarchBase - Protein-coding gene

DPOGS204233
Transcript	DPOGS204233-TA	5475 bp
Protein	DPOGS204233-PA	1824 aa
Genomic position	DPSCF300046 - 590904-606161
RNAseq coverage	293x (Rank: top 38%)

Annotation
*Heliconius*	HMEL015160	74.29%
*Bombyx*	BGIBMGA007512-TA	75.94%
*Drosophila*	Ugt-PA	63.72%
EBI UniRef50	UniRef50_Q09332	63.72%	UDP-glucose:glycoprotein glucosyltransferase n=14 Tax=Diptera RepID=UGGG_DROME
NCBI RefSeq	XP_969332.2	65.30%	PREDICTED: similar to UDP-glucose glycoprotein:glucosyltransferase [Tribolium castaneum]
NCBI nr blastp	gi\|189237348	65.30%	PREDICTED: similar to UDP-glucose glycoprotein:glucosyltransferase [Tribolium castaneum]
NCBI nr blastx	gi\|270007094	64.51%	hypothetical protein TcasGA2_TC013545 [Tribolium castaneum]

Group
Gene Ontology	GO:0006486	1.3e-63	protein glycosylation
	GO:0003980	1.3e-63	UDP-glucose:glycoprotein glucosyltransferase activity
	GO:0016757	2.7e-08	transferase activity, transferring glycosyl groups
KEGG pathway	tca:657804	0.0
	K11718 (HUGT)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[6-1824] IPR009448	0	UDP-glucose:Glycoprotein Glucosyltransferase
	[1528-1746] IPR002495	2.7e-08	Glycosyl transferase, family 8
Orthology group	MCL11445		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204233-TA
ATGAAAGCTACAATTTTGGGCATTATTTTAACTGTAGTAATTTCAATCTTTGGTAATGTTGTTGCCAATGGTGACTTACCGAAACGAGAGGAAAGAAAGTCTAAAGGAGTTACTACATTTATTAGCGCCAAATGGGAAGCGACGCCAATTGTGCTAGAACTGGCGGAATATTTGTCTGCTGAAAGTTCTGATTTATTTTGGTCTTATTTTGATGGCATTATTTCACTTAAATCAAGCTTAGAGTCTTTGGAGACAGATAAACAAGTTTATGATGCTTGCATTGGAGTAGCAAGTACATTATTAGCTCCGGCACAGCTCCGTATGGCTAAGCTAGCCTTGTCCATGCATTTGACTTCACCAGCAGTCCGCATGTTTGATCAGATTGCTACACAAAACGGTGCAAAAGAGTTGCCCTGTGAAACATTTGTGGCAATTGCATCAAGAAAAGTTTGTGATAATGATATCCTTAGGGACATTCTTAAATCTACAGTCAAATTTGATCCAGAGGAGCATAGAATTGAAACATACCTATTAGACCACTCATATCCCAGCAGTGACAATAGAAGCCTCACAGCTATTCTATATGGAGAGCTGGGAAACTCTGACTTTTCAGCCAAACATAAAATATTATCTGGCTACGCTGATAAAGGTGTTATTAACTATGTGGTCAGATGGAACATAAAATCTAGAGGCAAGCCAAAACTTCGTCTGTCTGGATATGGAATTGAATTGCAATTGAAGAGTACAGAATACAAAAGTCAAGATGATACCACTCCTAAGGAGACTGTAGATGATGCAGGAGTGCCCTCAGAAGAAGAAGACGAAAATGATCCCCAGAACCAAATAGATGGATTCAATTTTGGAAGACTAAAGAATTTATTTCCGGCACTTCGCACACCTCTCGAGCGTTTCCGAAGACATCTCTCTGAAATGAGTGAAGAAATAGAGCCCCTTAAAGTATGGCAGATGCAAGCTCTGAGTATGCAGGCCGCTGCTGCTGTGATGGATGCACACGACGCGGGCGGAGATGAGGCTCTTAAAGTGTTGATATCTCTAGCACAGAACTTCCCCATGCAGACTAAATCGTTGATCCATGTGAATGTGCCCCGATCCTTCCGCGATGAAGTCCTGTACAATCAAGACGTTTGGTCGTCATCTCTAGGGCTCCGGCCTGCGGAACCCTTGTTGCTCGTATCCGGGGCTCAGTACGATGCTGACGAGGTCGACCTTATGGCCCTCTTAGCAGCGCTCAGAGAAGACATAGGACCTATGAATACTCTGCATGCTTTGGGTCTGAACAGGAAGCTCATCAACAAGCTTCTATCACTTGAACTCGGTGAGTCTTTCACTTGGGAAGAGTATGGCTTAGACATCCGTGACACAGCCATCACCTGGCTCAACGATCTAGAGACAGACGATAGATACAGACGATGGCCATCTTCATACATGGAACTCCTACGACCCACATATCCTGGTATGCTGAGGAACTTAAGAAGAAATATATATAATTACGTGATAGTGATAGACCCAACATCACCGTCGTCCGCGCCCCCTTTAAAGCTGGGTGAGACATTACTGAAACATGCTACGCCTGTACGAGTGGGCTTGGTACTGGCACCGGGACGCGACTCCGCTCTGGGCACCGCACTAAGAAGCGCCTTCAACTATGTAGCACAGGAGAGGAATTCTAACAAGGAGGCCTTCTATTTCCTTACACAGGTTCTCAATTCTCTTCAAGAAGATGCTCTGAGTGTGGATCATATAAAAAAGTATCTGAAAAAGTATGCCAGTTCGAGCGCAAATCTCGATGAAATCATTTCAGAGGAATCTGAATTCAACTTCGGACACCAACTGGCTGAGGAGTTCGTGTCGAAGCTGGGAACTAATAAATTCCCTCAAGTGATAGTGAATGGCGTTCCTCTGTACGATGAGGGCTCTGGTGCGTTGTCTTCGGTGGAACTGCTCGAGGAGGCGCTAGTGACGGCACTGTCGCGTCACACGGCGCGTCTACAGCGAGCCGTGTTTAGAGGGAACCTCGCAGACTCCGACGACGCCGTAGAGTATCTCATGAAGCAGCCGCATATTGTGTCCAGGTTAAACCGTCGCGTTCTTGCATCTGAACCGTCTCAGTACTTAGACTTGTCTGGTGTATCCTCATCGAGAGATTTATTTTCCGAAGACAAAATTCATCGTCTCCTGCATTTAACTGGACGCGACGCTCTAGCAACAGCTTTACCTATCTTTAAATATTTCACAAAACCCGGGAAGTCTGAGAAGATAACACAAACTCTTTGGATAGCGGGAGATCTCAATAAGAAGGAATCTAGAGAATTGTTAAGAAATGCTCTCACGTTTATGAGGGAATCGGGTGGAATTCGTGTTGCATTTATACCCAATGTCGACGGTTCCGGCGAAGATCAATCGTTTAATAAAGTAGTTCTTGCCGCTCTGACGAGTTTGGAACCCGCAGAGGCTACCAAATATGTAGTTCAACTCTTAGAGGACGAAGGATGCCATGAGAGAAAAGATTGCGAAATTCTGCCTGAGTTGGTACCGGCGTTGAACAAGTACGAGTGGGTGTTGAAGGCGTCCCGCGTGTTATGTGCTCGGAGCCTCAAGCTGCGTGGCTCTGAGCGAGCAGTCATACACAACGCCAGAGTTATAGGACCCTTCAACAAAGGAGAGAGCTTCTCCCTAGAAGACTTCGCACTGCTTGAGAGGTACAGTAACCAAGTGTATGGAGACAAGCTATCCGAATTGTTACACCAGAACAAGAAGCTGTCAAATAATGTTTTGGACGATGACGATGACATCACTGATATAAGCACAGATAACTATTTGAAGGTTATATCAGTGCTTGCTTCGCGTAGTCCCCGTGTGCGCACGCCCTTACCGAGCGGATTACGAACGGATCATTCTGTTATAGAACTACCTCCTTTGTATGAGGACGAAGCGGCCGTTGAAATAGTAGCCGTGGTGGACCCGGCGTCGGCGGCCGCTCAGCGCCTAGCTCCGCTGCTGCTGGTGTTGCGACGCGTTGTCAACTGTCGCTTACAATTGTTCCTCAACCCGCAGGACAAGAATTCTGACATGCCGCTTAAGAGTTTTTACCGCTACGTGTTGGAGCCGGAGCTACAATTCAATAGCGCGGGTGTGCAGACGGGCGGTGCGATCGCGCGTTTCTCCCGTTTGCCGCACGCTCCTCTTCTATCGCTGGAGCTGCGTACGCCGCCTAATTGGCTGGTCGAGTGCGTGAAGTCTGTATACGACTTGGATAATATACGCCTGGCCGATGTCGAGTCACTCGTTCACAGGTTGGGACATTATTATTATCCTGAGTTGGTACCGGCGTTGAACAAGTACGAGTGGGTGTTGAAGGCGTCCCGCGTGTTATGTGCTCGGAGCCTCAAGCTGCGTGGCTCTGAGCGAGCAGTCATACACAACGCCAGAGTTATAGGACCCTTCAACAAAGGAGAGAGCTTCTCCCTAGAAGACTTCGCACTGCTTGAGAGGTACAGTAACCAAGTGTATGGAGACAAGCTATCCGAATTGTTACACCAGAACAAGAAGCTGTCAAATAATGTTTTGGACGATGACGATGACATCACTGATATAAGCACAGATAACTATTTGAAGGTTATATCAGTGCTTGCTTCGCGTAGTCCCCGTGTGCGCACGCCCTTACCGAGCGGATTACGAACGGATCATTCTGTTATAGAACTACCTCCTTTGTATGAGGACGAAGCGGCCGTTGAAATAGTAGCCGTGGTGGACCCGGCGTCGGCGGCCGCTCAGCGCCTAGCTCCGCTGCTGCTGGTGTTGCGACGCGTTGTCAACTGTCGCTTACAGTTGTTCCTCAACCCACAGGACAAGAATTCTGACATGCCGCTTAAGAGTTTTTACCGCTACGTGTTGGAGCCGGAGCTACAATTCAATAGCGCGGGTGCGCAGACGGGCGGTGCGATCGCGCGTTTCTCCCGCTTGCCGCACGCTCCTCTTCTATCGCTGGAGCTGCGCACGCCACCCAATTGGCTGGTCGAGTGCGTGAAGTCTGTATACGACTTGGATAATATACGCCTGGCCGATGTCGAGTCACTCGTTCACAGTGAGTTCGAGTTGGAATACCTGCTTGTGGAAGGTCACGCGTGGGATACGTCTCTGGGCACGCCGCCTCGCGGGTTACAACTCGTGCTGGGCACGAGACACCGACCAGACACAGTTGACACCATCGTGATGGCCAACCTCGGCTACTTCCAGCTCAAGGCCAACCCCGGTGCCTGGACGTTGCGTCTCAGACCCGGCCGCTCTGACGATATTTACGAGATTGTCGGGCACGAAAACACTGACACCCCAGCCGGCAGTAAAGACATCCAGGTCCTGATGAGTTCATTCCGGAGTCAAGTTATTAAATTGAGGGTCACTAAGAAGGCGGATAAACAACACCTTGATCTTTTAGCTGAAAATGACGAAAAGAACGCTGGTGGGATATGGAATTCTATTGCAAGTTCGTTCGGAGGTGGCGAAGAACAAGAAGCGCAAGACGAGACTATCAACGTGTTCTCAGTAGCATCCGGTCACTTGTACGAACGTTTTCTACGTATTATGATGCTGTCTGTACTAAAGAACACTAAGTCACCCGTGAAGTTCTGGTTCTTAAAGAACTATCTCAGCCCCTCACTTAAGGACATCCTTCCATACATGGCGCAAGAGTACGGGTTCCAGTACGAGCTGGTACAGTACCAGTGGCCTCGCTGGCTGCAGCGGCAGCGTGACAGACAGCGGACCATCTGGGGGTACAAGATACTGTTCCTCGACGTGTTATTCCCATTGGACGTCAAGAAGATCATCTTTGTTGATGCTGATCAGATTGTTCGAGCTGATCTAAAGGAACTAGTAGATTTGGATCTAGGCGGAGCTCCCTATGGATACACCCCGTTCTGTGACAGTAGAAAAGAAATGGAAGGATTCAGGTTCTGGAAGCAAGGCTACTGGCGGAATCATCTCCAAGGTCGGAGTTATCACATCAGTGCACTGTACGTGGTGGATCTGAAGCGTTTCAGACGAATCGCTGCCGGCGACCGACTGAGGGGACAGTACCAGGCGCTCAGCCAGGACCCTAACAGTTTGTCAAATCTAGATCAAGATCTTCCCAACAATATGATTCACCAGGTGGCTATAAAGTCTCTGCCCCAGGAATGGTTGTGGTGTGAGACCTGGTGCGATAATGAATCCAAGAAATACGCCAAGACCATTGATTTGTGCAACAACCCTATGACGAAGGAGGCCAAGTTGTCAGCAGCTATGCGCATCGTGCCTGAGTGGAGCGACTATGACAACGAGCTGAGAGCATTGCACGCCCGCGTCAGGCAGGGACACTACCAGGACGACACCGAACAGGAAATCGAGACTCATGAACATGAACAAGTCAGCAAAGAAGATAAAACTGATAAAGCACAGGAACACACTGAGTTATGA

Protein sequence:

>DPOGS204233-PA
MKATILGIILTVVISIFGNVVANGDLPKREERKSKGVTTFISAKWEATPIVLELAEYLSAESSDLFWSYFDGIISLKSSLESLETDKQVYDACIGVASTLLAPAQLRMAKLALSMHLTSPAVRMFDQIATQNGAKELPCETFVAIASRKVCDNDILRDILKSTVKFDPEEHRIETYLLDHSYPSSDNRSLTAILYGELGNSDFSAKHKILSGYADKGVINYVVRWNIKSRGKPKLRLSGYGIELQLKSTEYKSQDDTTPKETVDDAGVPSEEEDENDPQNQIDGFNFGRLKNLFPALRTPLERFRRHLSEMSEEIEPLKVWQMQALSMQAAAAVMDAHDAGGDEALKVLISLAQNFPMQTKSLIHVNVPRSFRDEVLYNQDVWSSSLGLRPAEPLLLVSGAQYDADEVDLMALLAALREDIGPMNTLHALGLNRKLINKLLSLELGESFTWEEYGLDIRDTAITWLNDLETDDRYRRWPSSYMELLRPTYPGMLRNLRRNIYNYVIVIDPTSPSSAPPLKLGETLLKHATPVRVGLVLAPGRDSALGTALRSAFNYVAQERNSNKEAFYFLTQVLNSLQEDALSVDHIKKYLKKYASSSANLDEIISEESEFNFGHQLAEEFVSKLGTNKFPQVIVNGVPLYDEGSGALSSVELLEEALVTALSRHTARLQRAVFRGNLADSDDAVEYLMKQPHIVSRLNRRVLASEPSQYLDLSGVSSSRDLFSEDKIHRLLHLTGRDALATALPIFKYFTKPGKSEKITQTLWIAGDLNKKESRELLRNALTFMRESGGIRVAFIPNVDGSGEDQSFNKVVLAALTSLEPAEATKYVVQLLEDEGCHERKDCEILPELVPALNKYEWVLKASRVLCARSLKLRGSERAVIHNARVIGPFNKGESFSLEDFALLERYSNQVYGDKLSELLHQNKKLSNNVLDDDDDITDISTDNYLKVISVLASRSPRVRTPLPSGLRTDHSVIELPPLYEDEAAVEIVAVVDPASAAAQRLAPLLLVLRRVVNCRLQLFLNPQDKNSDMPLKSFYRYVLEPELQFNSAGVQTGGAIARFSRLPHAPLLSLELRTPPNWLVECVKSVYDLDNIRLADVESLVHRLGHYYYPELVPALNKYEWVLKASRVLCARSLKLRGSERAVIHNARVIGPFNKGESFSLEDFALLERYSNQVYGDKLSELLHQNKKLSNNVLDDDDDITDISTDNYLKVISVLASRSPRVRTPLPSGLRTDHSVIELPPLYEDEAAVEIVAVVDPASAAAQRLAPLLLVLRRVVNCRLQLFLNPQDKNSDMPLKSFYRYVLEPELQFNSAGAQTGGAIARFSRLPHAPLLSLELRTPPNWLVECVKSVYDLDNIRLADVESLVHSEFELEYLLVEGHAWDTSLGTPPRGLQLVLGTRHRPDTVDTIVMANLGYFQLKANPGAWTLRLRPGRSDDIYEIVGHENTDTPAGSKDIQVLMSSFRSQVIKLRVTKKADKQHLDLLAENDEKNAGGIWNSIASSFGGGEEQEAQDETINVFSVASGHLYERFLRIMMLSVLKNTKSPVKFWFLKNYLSPSLKDILPYMAQEYGFQYELVQYQWPRWLQRQRDRQRTIWGYKILFLDVLFPLDVKKIIFVDADQIVRADLKELVDLDLGGAPYGYTPFCDSRKEMEGFRFWKQGYWRNHLQGRSYHISALYVVDLKRFRRIAAGDRLRGQYQALSQDPNSLSNLDQDLPNNMIHQVAIKSLPQEWLWCETWCDNESKKYAKTIDLCNNPMTKEAKLSAAMRIVPEWSDYDNELRALHARVRQGHYQDDTEQEIETHEHEQVSKEDKTDKAQEHTEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: