MonarchBase - Protein-coding gene

DPOGS208641
Transcript	DPOGS208641-TA	2691 bp
Protein	DPOGS208641-PA	896 aa
Genomic position	DPSCF300281 - 236414-242096
RNAseq coverage	167x (Rank: top 51%)

Annotation
*Heliconius*	HMEL011746	80.72%
*Bombyx*	BGIBMGA007776-TA	76.37%
*Drosophila*	botv-PA	61.56%
EBI UniRef50	UniRef50_Q9XZ08	61.56%	Exostosin-3 n=18 Tax=Coelomata RepID=EXT3_DROME
NCBI RefSeq	XP_397082.1	60.26%	PREDICTED: similar to brother of tout-velu CG15110-PA [Apis mellifera]
NCBI nr blastp	gi\|383862854	60.04%	PREDICTED: exostosin-3-like [Megachile rotundata]
NCBI nr blastx	gi\|383862854	60.15%	PREDICTED: exostosin-3-like [Megachile rotundata]

Group
Gene Ontology	GO:0016758	2.5e-87	transferase activity, transferring hexosyl groups
	GO:0031227	2.5e-87	intrinsic to endoplasmic reticulum membrane
	GO:0016020	5.6e-46	membrane
KEGG pathway	dpo:Dpse_GA13499	0.0
	K02370 (EXTL3)	maps->	Glycosaminoglycan biosynthesis - heparan sulfate
InterPro domain	[639-881] IPR015338	2.5e-87	EXTL2, alpha-1,4-N-acetylhexosaminyltransferase
	[190-476] IPR004263	5.6e-46	Exostosin-like
Orthology group	MCL11247		Single-copy universal gene

Nucleotide sequence:

>DPOGS208641-TA
ATGGTTACAGTGATTCTGTTTGTTGTGCCGCTCTTTACACATTATTATTTGTCTAAGTATGAATCATCATCAATGACATTGGGTTCCAATAACATGCGACACACACTAGAAGCCCTCGGAGACTTATCAGCCGTCAATATCGGAGACCTTAAGATAAGGATAGAAGAAATGCTTAGAATTAAGGCGTCAGTGTCCACGGAGTTGCGTGAATTAGAAGAACGACGAGGGAAACTGCAAAAAGAAGCGGCAGCTGCTAGTGCAAACGCAGACAGTGTTAAGGCTGAGTATGCACGCGCGACTGCTGAATTGCAGAGATTGAGGGTATCCGCAGACCAAGCTCGACTAGCCCAGTTGGAGGCTATACGACGGGATTCCCCTGAACTCGCCCCACCACTGCCAATCTTACCTTCGTCCCCACCACCCATTCTCCCACCTGCTACATCAACATCTGAACTACACTGTCGAATGCATTCATGCTTTGATCACTCCCGCTGTTCACTAACTTCCGGTTTCCCAGTGTACTTCTATGATCCTGATGTATTCTCTCCTCTCATTGGGGCGGAGGTGGATGGTTTTCTCAAAACCACATTACGACAAACGTTAAGCTACAATTCACACCTTACTCAAAACCCTAATGAAGCATGCGTCTATCTCGTGCTGGTCGGCGAAGGATTTCCTTCTGACAAGACTCAAACTTCCACGAAAAAGCTGTTGTTGAATGAGACAGCAATCAAAAGTCTGCCATATTGGGGCGGAGACGGGCGTAACCATGTGTTACTAAATCTGGCTCGTCGCGATCTATCCGTCGGTTCCGGAGACGCGTTTCTGGATTCGTCGACTGGTAGAGCGATGATAGCGCAGTCTACGTTTACATTGCAACAGTTCCGGCCAGGATTTGACCTGGTGACACCTCCAGCCCTCGGACCTCCTGGAGGAGACGTATGGTCAGACTGCGCGCCTATGGCACCGGCAAGACGTCTATACATACTTAGTTTTCAGGGTTCACAGACTCCAGCGGCAGGGTCCCACGTAGATGACGATCAGTCACTCATCGAGTCTCTGAGGAAGATGGTCAGCCAGGCTCCTTCTTCTGATGTGTTTCTATTGCAATTCGACTGCGACCCGCCTATCGACAAGCGTGCGGTCCTTCCGATCGGTGACTGGGGACTCTGCGGCACCGATCGGTCGAGACGAGCCGTTCTTAGAGATTCCACTTTCGTATTAATATTGGCACCGGCTGACGGAGATTATGCTTCAACAGCTCTCCTGCAAGCGAGGCTATATGAAGCGCTACGCTCCGGAGCTATACCCGTCATACTTGGGGGTGATCGTATACAGCTGCCGTATAGCGAAGTTTTAGACTGGCGAAGGGCTACATTATCCCTCCCGAAAGCTCGCGTCACTGAGTTACATTTTCTGCTGAGAGCTCTATCGGATGCAGATTTACTAGCGTTCCGTAGACAGGGACGTTTGTTATGGGAGAGATATTTAAGTTCGGTACAAGCTAGTATGGACTCGCTCCTGGCTACTATACGGACTCGTTTGAACATTCCTCCACATTCAGCGGCACCGACTATGGGTGTGCCGGCGTTCAATGACACCTTCTATCCACCGAAAATTGAACCGCCGGCCGTGGACACTGAGCCCGAAGAGACCCTCGGGCCTTTAGAAGCTCCTTATCCGAGTCCGGCCTATAGACGTAATTACTCGGTGTCTCTATTAAACGGTTACGAACTATGGAATGACTGGGGAGAGCCGTTCGCACTGTTTCCTCAATTGCCTTGGGATCCGCCGGTAACATCGGAAGCCCGGTTCATGGGTTCCGCAGCAGGTTTCCGACCAATCGGAGCAGGAGCCGGGGGTTCTGGGAAGGAGTTCAGCGAAGCTCTAGGAGGTGACCGGCCGAGGGAACAGTTCACTATTGTCATCCTCACGTATGAGAGGGAAGCCGTTCTGGCAGCGGCACTGGCGAGGCTCCGGGGTCTACCGTACTTGAATAAGGTGGTGGTTGTATGGAACGGAGTGAACCCACCACTCTCGTCCCAGTCGTGGCCGGAGTCGGGCGCGCCGGTGGCGGTGGTGCGGGCTCCTCGCAACTCATTGAACAACCGCTTCCTACCATACAACGTGATCGACACTGAGGCCGTTCTCTGCGTAGACGATGACGCGCATTTGAGACACGATGAGATAGTCTTCGCGTTTAGAGTCTGGCGTGAACATCGCGATCGTATAGTGGGCTTCCCTGGGAGGTACCACGCGTGGGATCTCAACTTCAATAATGGATTCCTTTACAACTCTAACTACAGTTGTGAGCTGAGTATGGTGTTAACCGGGGCGGCGTTCGTGCACCGCTACTATTTGTGGTCGTACTGGCGTCTGCTGCCCGCCGCTGTCCGGGACTACGTCGACCAGTACATGAACTGCGAGGACATCGCTATGAACTTCCTAGTGGCTCACATCACGAGGAAACCGCCGGTCAAGGTGACATCTCGTTGGACGTTCCGTTGTCCTGGTTGCCCTGTGACGCTGTCAGCGGACGAGACCCATTTCCACGAGCGACACAAATGCATTCAGTTCTTCTCCCAGGTGTTTGGTTACACTCCACTTCTGTCGACACAGTACAGAGCTGATTCCGTACTTTTTAAGACGAGGATATCACACGACAAGCAGAAGTGCTTTAAATTCATTTAA

Protein sequence:

>DPOGS208641-PA
MVTVILFVVPLFTHYYLSKYESSSMTLGSNNMRHTLEALGDLSAVNIGDLKIRIEEMLRIKASVSTELRELEERRGKLQKEAAAASANADSVKAEYARATAELQRLRVSADQARLAQLEAIRRDSPELAPPLPILPSSPPPILPPATSTSELHCRMHSCFDHSRCSLTSGFPVYFYDPDVFSPLIGAEVDGFLKTTLRQTLSYNSHLTQNPNEACVYLVLVGEGFPSDKTQTSTKKLLLNETAIKSLPYWGGDGRNHVLLNLARRDLSVGSGDAFLDSSTGRAMIAQSTFTLQQFRPGFDLVTPPALGPPGGDVWSDCAPMAPARRLYILSFQGSQTPAAGSHVDDDQSLIESLRKMVSQAPSSDVFLLQFDCDPPIDKRAVLPIGDWGLCGTDRSRRAVLRDSTFVLILAPADGDYASTALLQARLYEALRSGAIPVILGGDRIQLPYSEVLDWRRATLSLPKARVTELHFLLRALSDADLLAFRRQGRLLWERYLSSVQASMDSLLATIRTRLNIPPHSAAPTMGVPAFNDTFYPPKIEPPAVDTEPEETLGPLEAPYPSPAYRRNYSVSLLNGYELWNDWGEPFALFPQLPWDPPVTSEARFMGSAAGFRPIGAGAGGSGKEFSEALGGDRPREQFTIVILTYEREAVLAAALARLRGLPYLNKVVVVWNGVNPPLSSQSWPESGAPVAVVRAPRNSLNNRFLPYNVIDTEAVLCVDDDAHLRHDEIVFAFRVWREHRDRIVGFPGRYHAWDLNFNNGFLYNSNYSCELSMVLTGAAFVHRYYLWSYWRLLPAAVRDYVDQYMNCEDIAMNFLVAHITRKPPVKVTSRWTFRCPGCPVTLSADETHFHERHKCIQFFSQVFGYTPLLSTQYRADSVLFKTRISHDKQKCFKFI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: