MonarchBase - Protein-coding gene

DPOGS206312
Transcript	DPOGS206312-TA	1038 bp
Protein	DPOGS206312-PA	345 aa
Genomic position	DPSCF300082 - 707331-712618
RNAseq coverage	298x (Rank: top 37%)

Annotation
*Heliconius*	HMEL012618	5e-54	60.45%
*Bombyx*	BGIBMGA014130-TA	2e-152	80.59%
*Drosophila*	C1GalTA-PA	2e-112	57.01%
EBI UniRef50	UniRef50_F4X6V2	9e-115	59.38%	Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 n=10 Tax=Bilateria RepID=F4X6V2_ACREC
NCBI RefSeq	XP_972808.2	7e-114	58.86%	PREDICTED: similar to Glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1 (Core 1 beta1,3-galactosyltransferase 1) (Core1 UDP-galactose:N-acetylgalactosamine-alpha-R beta 1,3-galactosyltransferase 1) (Core 1 beta3-Gal-T) (C1GalT1) (Core 1 O-glyc [Tribolium castaneum]
NCBI nr blastp	gi\|345483017	3e-117	63.27%	PREDICTED: glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345483017	7e-119	63.45%	PREDICTED: glycoprotein-N-acetylgalactosamine 3-beta-galactosyltransferase 1-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0016020	3.4e-13	membrane
	GO:0016757	3.4e-13	transferase activity, transferring glycosyl groups
KEGG pathway	nvi:100120600	5e-112
	K00731 (C1GALT1)	maps->	O-Glycan biosynthesis
InterPro domain	[91-258] IPR003378	3.4e-13	Fringe-like
Orthology group	MCL14238		Single-copy universal gene

Nucleotide sequence:

>DPOGS206312-TA
ATGTACCCTGTGCAGGACGGCCGGATGGGGCGGCGTTTCGTTCTAACACTGGTGATCGGAATATCGGCTGGTTTTAGTTTCGCGTACATTCTGTTAACCTCGGCCGGCTTCACACGGGATGTAGCCTGGTCCTACAGAGATTCAGCAAGAGATCTCGAAAAACATCCAATACCGAGCGTCATAGATCACGGCAAAGACGAGCCCGCTCATAGAGATGAAGACAGAACTGTGGCCGATGAATTGGCTAAGCGAGTACGCGTTCTCTGCTGGGTTATGACACAGCCGAGTAACCATAAGAAAAAGGCTATCCATGTTAAAGCTACGTGGGGGAAGAGATGCAATAAACTGTTGTTTATGAGCACCGTCGAAGATGAGAGTTTGCCATCAGTGAAGCTACCAGTGTCAGAAGGAAGGGATTATCTTTGGGCGAAAACTAAAGCTGCCTTCAGATACGTTTACGAACATCACAGGAGAGACGCAGACTGGTTCCTTAAAGCTGATGACGACACGTATGTGGTAGTAGAGAACCTGAGGTACATGCTGTCAGAGCACGACAGCAAGGAACCGATGTATTTCGGATGTAGATTCAAACCATTCACCTCGCAGGGCTACATGAGCGGCGGGGCTGGGTACGTTTTAAGCCGAGCGGCTCTGGACAAGTTCGTGAGGAACGGTCTGCCGTCACCACACCTGTGTAAGGCGGGCGACCACGGGGCCGAGGACGCCGAGATGGGTATATGCCTTCAGCACCTGGGCGTTAAGGCGATGGATTCGCGGGATTCTCTCCAGCGGGGACGATTCTTTCCCTTCGTCCCTAAGGATCATTTGTTCCCCAACAAGGATAAAGGCTTTTGGTACTGGCAGTACATATACTATCCCACTGATGAGGGTCTAGACTGTTGTTCCGACCACGCGGTTTCCTTCCACTACGTGAATCCTGAACAGATGTACGTATTGGACTATCTGATATACCACCTGAGACCATACGGCATCAACTACAGGGGCTCCATACCCAGGAACGACACTGACGTTAGATAG

Protein sequence:

>DPOGS206312-PA
MYPVQDGRMGRRFVLTLVIGISAGFSFAYILLTSAGFTRDVAWSYRDSARDLEKHPIPSVIDHGKDEPAHRDEDRTVADELAKRVRVLCWVMTQPSNHKKKAIHVKATWGKRCNKLLFMSTVEDESLPSVKLPVSEGRDYLWAKTKAAFRYVYEHHRRDADWFLKADDDTYVVVENLRYMLSEHDSKEPMYFGCRFKPFTSQGYMSGGAGYVLSRAALDKFVRNGLPSPHLCKAGDHGAEDAEMGICLQHLGVKAMDSRDSLQRGRFFPFVPKDHLFPNKDKGFWYWQYIYYPTDEGLDCCSDHAVSFHYVNPEQMYVLDYLIYHLRPYGINYRGSIPRNDTDVR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: