MonarchBase - Protein-coding gene

DPOGS211641
Transcript	DPOGS211641-TA	2409 bp
Protein	DPOGS211641-PA	802 aa
Genomic position	DPSCF300325 + 8485-11589
RNAseq coverage	286x (Rank: top 38%)

Annotation
*Heliconius*	HMEL006645	75.38%
*Bombyx*	BGIBMGA011693-TA	67.36%
*Drosophila*	oxt-PB	50.14%
EBI UniRef50	UniRef50_D7EJH3	50.91%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D7EJH3_TRICA
NCBI RefSeq	XP_969448.1	50.91%	PREDICTED: similar to protein-O-xylosyltransferase [Tribolium castaneum]
NCBI nr blastp	gi\|91094259	50.91%	PREDICTED: similar to protein-O-xylosyltransferase [Tribolium castaneum]
NCBI nr blastx	gi\|91094259	50.91%	PREDICTED: similar to protein-O-xylosyltransferase [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	3.3e-40	membrane
	GO:0008375	3.3e-40	acetylglucosaminyltransferase activity
KEGG pathway	tca:657929	0.0
	K00771 (XYLT)	maps->	Glycosaminoglycan biosynthesis - heparan sulfate
			Glycosaminoglycan biosynthesis - chondroitin sulfate
InterPro domain	[252-502] IPR003406	3.3e-40	Glycosyl transferase, family 14
	[153-232] IPR002889	6.1e-17	Carbohydrate-binding WSC
Orthology group	MCL11386		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211641-TA
ATGGCGAGTTTTCGGAGGATATTTTACAAATATGCTAAATACTTAGCTATAATTGTTTTGACAACGTTTTTTGCTCAACTCTTCATATCAATATTATTTTTTCCTTCAATTCACGACAATCTTCTTAAAAGAAATGGTTATACATCCGTTGCAAGAAACGAAGGCGGAGATGCTTCAGCAAGAAAACTTGGTTCTAATATTAGCGATGATGAAGATTTCGGTTCAAAAACTCTATCACACAACAAACCATTACCGCAATTGAGACTCGAAGAGTTAGACTTTAGGCCAAGCTGTGATATTAAAAGTCGGGAAGCGATATCAGCTATTCATCGAGCTAAAACACAAAAATGTAAACAGGAAATAGTTAATAAGACTTGTCTTATACAGAATGGCAGCTTTTATCCTAAAAAACTACCAAATTATTGCAGTTCCAAGACCATGAAATATGGACGTCACTTAGGTTGTTTTGTAGATGAAAAGAAATTAAGGTTGTTGTCAGGATTTTATGGAAGTTATGCTAATGCTAATTCTCCGACATTTTGCCTAGATATCTGTGTTCAGGCTGGTTTTCTTTATGGTGGAGTACAATATGCTTCTGAGTGTTTCTGTGGTGATACCACTCCCACTGCATCATCACTTACTGCTGACAGTTCCTGTGACATGAAGTGTCCCGGAGATCATTCAAAGATCTGTGGGGAGTTTGTTGCACAGATTCCAAAAACTCCTGAGAACAAACAAACATCAGTTAGAATTGTATTTCTCTTGACATTAAATGGAAGGGCACTTAGACAAGTACATAGATTAATTAATTCTTTGTACAGAGAAAATCACTATTTTTATATACATGTTGATAAGAGACAAGACTATTTACATCGTAAGTTAACTGTATTAGAGAAGCAATTTCCAAATATAAAATTAGCTAAAAAACAATATTCTACAATATGGGGTGGAGCCTCTCTTCTTACAATGTTATTGACATCCATGAAAGATATTTTGAAGAATGGATGGGAATGGGACTATGTCATTAATTTAAGCGAAAGTGATTTCCCCATAAAGTCTCTAGAGGAACTTGAAAAATTTCTCTCCGACAACAAAGGTTATAATTTTGTTAAATCTCATGGACGGGAAGTCCAGAGATTTATTAAGAAACAGGGCCTCGACAAAACCTTCATAGAATGTGAGACACACATGTGGAGGGTGGGAGAGAGGAAATTACCAAAAGGTATTGTTATAGATGGAGGAAGCGACTGGATAGCATTGTCACCAGAGCTCGTGTCTTATGTTGTTGGTGAGCGTGATGAGCTTTTATCTGGCTTGGATGTTATATTTGAACACACATTACTACCAGCTGAATCTTATTTTCACACTGTATTAAGGAATTCCCGCTTCTGTAATACATATGTGGATAACAATTTGCATGTAACAAATTGGAAAAGGAAACTGGGTTGCAAATGCCAATATAAGCATGTTGTTGATTGGTGTGGTTGTTCTCCTAATGACTTTAAAACTGAAGACTGGCCGAGGATTCAGAACACACAGAGTAGACAGTTATTCTTTGCTAGAAAATTTGAGCCTATAATCAACCAAGAAATCATCACGAGAGTTGAGCAGTACATAGGATTTAAAGACCATTATTTAATCCCTAATTTAGAGGCGTACTGGCAAAATATATATGATATAGAAGATTTAACAGCCAATACTGATGACACTTTACTCTCGCATGGGGGTAGCATAATTCGCCATAATTCAAAGATTTTAGCTCAAGAAAACTGCAATATTGAAATTAAAGAAATCATTGAAATTAATTTGTATAAATATGCAGATGTTTACAAAGGTAACCTTATACTGCACAAAGCGACAATCAATAACAATATGGAAGTGTTTCTGGAGACTTGGTACAAACCAAAGAAATTTCTCGATTTAGGCATTGAAAATCTTGATATGGAATATATAAAAGTATTTAAAGTTAGCTCAGATTATGATCAGAAGGAAATGTTATTTCGGAATTTGGCAAATATTCTGGGTCCTTGGTCGGAGCCGGTATTGCTTTATCAGTTCTCTGCATATGTAGATAAAAATATGGGAAACTTGACTCTAGTATGGTTAGACCCAGCCGGTGTGATTGCGGATATAAATATAATTTCCCGAGATGAAAATAACTTAACCAGTTTTATCAAACCTCACATCAAAGCACCTTTATTGCCTGGTGTCTGGAAAGTTGGCCTATTTGATAACACAAGTACTATTGCCGTTACTAAGTTCCTTATAACTCCTCTGGAATATTTCTCTGGCAAAGAAATAACCCAACAGGAACAATGCATCCTTTCTGATTGGAGTTCTAAATCACCGGATCCAAAAGGCGTGGTAGGAAAGTTGGATAAAAATACTGGCCGTTTAAAAAGGATGTGA

Protein sequence:

>DPOGS211641-PA
MASFRRIFYKYAKYLAIIVLTTFFAQLFISILFFPSIHDNLLKRNGYTSVARNEGGDASARKLGSNISDDEDFGSKTLSHNKPLPQLRLEELDFRPSCDIKSREAISAIHRAKTQKCKQEIVNKTCLIQNGSFYPKKLPNYCSSKTMKYGRHLGCFVDEKKLRLLSGFYGSYANANSPTFCLDICVQAGFLYGGVQYASECFCGDTTPTASSLTADSSCDMKCPGDHSKICGEFVAQIPKTPENKQTSVRIVFLLTLNGRALRQVHRLINSLYRENHYFYIHVDKRQDYLHRKLTVLEKQFPNIKLAKKQYSTIWGGASLLTMLLTSMKDILKNGWEWDYVINLSESDFPIKSLEELEKFLSDNKGYNFVKSHGREVQRFIKKQGLDKTFIECETHMWRVGERKLPKGIVIDGGSDWIALSPELVSYVVGERDELLSGLDVIFEHTLLPAESYFHTVLRNSRFCNTYVDNNLHVTNWKRKLGCKCQYKHVVDWCGCSPNDFKTEDWPRIQNTQSRQLFFARKFEPIINQEIITRVEQYIGFKDHYLIPNLEAYWQNIYDIEDLTANTDDTLLSHGGSIIRHNSKILAQENCNIEIKEIIEINLYKYADVYKGNLILHKATINNNMEVFLETWYKPKKFLDLGIENLDMEYIKVFKVSSDYDQKEMLFRNLANILGPWSEPVLLYQFSAYVDKNMGNLTLVWLDPAGVIADINIISRDENNLTSFIKPHIKAPLLPGVWKVGLFDNTSTIAVTKFLITPLEYFSGKEITQQEQCILSDWSSKSPDPKGVVGKLDKNTGRLKRM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: