MonarchBase - Protein-coding gene

DPOGS210837
Transcript	DPOGS210837-TA	930 bp
Protein	DPOGS210837-PA	309 aa
Genomic position	DPSCF300027 + 52224-53310
RNAseq coverage	14x (Rank: top 82%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA003911-TA	1e-37	41.72%
*Drosophila*	alpha4GT1-PA	5e-40	29.51%
EBI UniRef50	UniRef50_D6WW57	2e-41	30.62%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WW57_TRICA
NCBI RefSeq	XP_969928.1	4e-42	30.62%	PREDICTED: similar to GA14400-PA [Tribolium castaneum]
NCBI nr blastp	gi\|380019673	7e-42	34.17%	PREDICTED: uncharacterized protein LOC100863408 [Apis florea]
NCBI nr blastx	gi\|380019673	5e-41	34.17%	PREDICTED: uncharacterized protein LOC100863408 [Apis florea]

Group
Gene Ontology	GO:0005795	9.9e-17	Golgi stack
	GO:0008378	9.9e-17	galactosyltransferase activity
KEGG pathway	tca:658448	1e-41
	K01988 (A4GALT)	maps->	Glycosphingolipid biosynthesis - globo series
InterPro domain	[188-302] IPR007652	9.9e-17	Alpha 1,4-glycosyltransferase domain
	[55-167] IPR007577	4.6e-10	Glycosyltransferase, DXD sugar-binding motif
Orthology group	MCL10812		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210837-TA
ATGATACATATGGATTTTGGTCAAGAGTTTTCACGGGGTCCGCCGGCCAATGTATCGTGTCACTACGTAAACAGCAACTTTAGTTTGCCGCTTTTACAATCAACTTTACCACAAAGATCAATATTCTTCCACCAAACTTCTTGTCCAGCGAACCTGACCCCCAGGCAGGTCTGTTCCATCGAATCGGCTGCTAGAACTCATCCGGCTTGGCAAATTAACGTTATATTCTCAGGTCCTGTACATTTAGAGACAGTGAATGGCGTAAAATTATTAAAAAGCTTCACTAATATTAAATTCTGGACGATTAATATAAAGGATTTCGCCACGAATACTCCGTTGGAAGGATTGGTTAGCAGTGGTGTGTTAAGTAAATGCAAATGGGGCATGGAGCGCACGAGAGATGTGTTGAAATATTTATCATTATACAGGTTTGGGGGTATATTCTTAGATTTGGACATTATAATTGCCCGCACCTTAGGCTCTTTGGCCAGGAATTGGGCGGCGAGGGAAAACGCAAATAAAGTAGGAGATGGTATATTAGCTATTTCCAAGAATAGTATAGGACATAATATCACTGACGCTGCGATCAGGTATATCGTGTCAATTTACAAGAATAACGATTGGTGTAAGGAAAGTCAGGATGTGGTGATGGGGGTGCTCCAAGAATTATGTTCCACTCCCGATGCGAACTATATGTCCGCAGCAACTTGTAACGGTTTCGAAGTTTATGGCTCACAATTCTTCTATCCAATTGAAAAGCAATCGGCCCGCGAATATTTTGTTCCTGGAGAAGTACAAGACCTCAGCGCCTATATTTATCACCTATGGGGAGATGTTACGAATGGATATAAAATTTCTAAGTCTTCTCCATACTCTAAACTTGCTAGAAGGTTCTGTCCTTTCAATTCATTATTAAATATAAAAAAGTAA

Protein sequence:

>DPOGS210837-PA
MIHMDFGQEFSRGPPANVSCHYVNSNFSLPLLQSTLPQRSIFFHQTSCPANLTPRQVCSIESAARTHPAWQINVIFSGPVHLETVNGVKLLKSFTNIKFWTINIKDFATNTPLEGLVSSGVLSKCKWGMERTRDVLKYLSLYRFGGIFLDLDIIIARTLGSLARNWAARENANKVGDGILAISKNSIGHNITDAAIRYIVSIYKNNDWCKESQDVVMGVLQELCSTPDANYMSAATCNGFEVYGSQFFYPIEKQSAREYFVPGEVQDLSAYIYHLWGDVTNGYKISKSSPYSKLARRFCPFNSLLNIKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: