MonarchBase - Protein-coding gene

DPOGS203382
Transcript	DPOGS203382-TA	1362 bp
Protein	DPOGS203382-PA	453 aa
Genomic position	DPSCF300003 + 501408-504684
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL007286	8e-87	37.56%
*Bombyx*	BGIBMGA002045-TA	2e-82	41.43%
*Drosophila*	CG9384-PA	7e-80	36.57%
EBI UniRef50	UniRef50_Q9VUH4	1e-77	36.57%	CG9384 n=19 Tax=Diptera RepID=Q9VUH4_DROME
NCBI RefSeq	XP_002047901.1	4e-81	37.96%	GJ13695 [Drosophila virilis]
NCBI nr blastp	gi\|195378258	8e-80	37.96%	GJ13695 [Drosophila virilis]
NCBI nr blastx	gi\|195378258	6e-79	37.96%	GJ13695 [Drosophila virilis]

Group
Gene Ontology	GO:0016020	4.9e-78	membrane
	GO:0016758	4.9e-78	transferase activity, transferring hexosyl groups
	GO:0005975	4.9e-78	carbohydrate metabolic process
KEGG pathway	dvi:Dvir_GJ13695	1e-80
	K00738 (MGAT4A_B)	maps->	N-Glycan biosynthesis
InterPro domain	[10-297] IPR006759	4.9e-78	Glycosyl transferase, family 54
Orthology group	MCL10892		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203382-TA
ATGGTAGTGCAAAAAAAATGTGTAGGGTGGGGACCGGAAGAGGAAACTAAAAGCGAGAAATCGGAAATGAATTCTTTTGCTATTGAACTAATGCCTCATTTGATTCAACGTTCGTCCAGCCTGAAGCCGGTTTTCTTACTGAATGGCTCTCGACAGGACTGCGAGCTGGTTATAGGTATCACAACTACACACTCGGATAAGGAACTCTATATTCTGGTTTCACTCATGAATTTGATTGACGCCATGAATGAAAAGGAAAAGGGCAAAACTCTTATAATAGTTTTAGTAGCTGAATTGATTTTGGATCAGGTGCGCCCGTTATTGGAGCTACTTGCCTTTGTGTTCGCTGAACACGTCCATAGTGGTCTTGTCGAAATAGTGGTACCCTCTCCGCATTATTACCCCGATTTGGAAACGTTAACAACTAATCCCCTTGACCCATCCAATCGAGTGAAGCGCCGTACGAAGCAAAATCTTGACATATTGTATCTTATGGCCTATGCTCGCCCCAGAGGGACTTATTATTTAAGTCTTCGAGACGATATAACCGTTAAGTACCGATTCGTCGAGCATATAATGGATTTTATAAAGACCACCTCCGACACGAATCCTCACTGGTATGTTCTGGAATTCTGTAACGTCCGAGGTGTTGGGAAAGTGTTTAGAACTAAAAGTATGGTCCAATTCATGACATACATTCAAATCTTCTACAAAAATATGCCGATTGATTGGCTTCTGAACAGCTATATCGCTAATAGCTCTTGCTCTCGAAACAAGACAACGGAAACATGTAAGAAGAATAAATTGAAAAGCAAACCTAAATATCCAGTATCACTGTTTAACCACATTGGATTGTATTCTACTAGCGAGGGAAAGGTTCAGATATTGAAGCATTTAAATACTGACGAGGAAACTCTATTCACTGCCCACGACAACCCGCCGGTTGATCGAGTTTATACAGACATACCGGCATACGATAAGCATACGCTTTTAAGAGCTTATGAGGGAGAAACGTTCTTCTGGGGAAAGAAGCCGGTGGAAGGAAACGTTGTGGAATTTTGGTTTAGGGAGCCCACTATTATTGTCAGCTATGCCTTCGGAACCGGCAATATTTTGCATGAAAAGGACAAATTTTATCACGCCGTGGTGGAAGTTCTTCCGTATAAGAGACATCAGTTCATCTATGACAAAGATTTCGGAGAATTTGGCTATGTTTATGGGGATCTGCATTTCGGAGAGTTGGTTGCTATTAGAATTCGAGTCACCAAGAACAGCACCCACATGATTGTTCTATCTGAGATACAACTGGTGACTATTGCGCAAGCTAAATCTAGGCAACGCAAAATAGTTATAAATTATTAA

Protein sequence:

>DPOGS203382-PA
MVVQKKCVGWGPEEETKSEKSEMNSFAIELMPHLIQRSSSLKPVFLLNGSRQDCELVIGITTTHSDKELYILVSLMNLIDAMNEKEKGKTLIIVLVAELILDQVRPLLELLAFVFAEHVHSGLVEIVVPSPHYYPDLETLTTNPLDPSNRVKRRTKQNLDILYLMAYARPRGTYYLSLRDDITVKYRFVEHIMDFIKTTSDTNPHWYVLEFCNVRGVGKVFRTKSMVQFMTYIQIFYKNMPIDWLLNSYIANSSCSRNKTTETCKKNKLKSKPKYPVSLFNHIGLYSTSEGKVQILKHLNTDEETLFTAHDNPPVDRVYTDIPAYDKHTLLRAYEGETFFWGKKPVEGNVVEFWFREPTIIVSYAFGTGNILHEKDKFYHAVVEVLPYKRHQFIYDKDFGEFGYVYGDLHFGELVAIRIRVTKNSTHMIVLSEIQLVTIAQAKSRQRKIVINY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: