MonarchBase - Protein-coding gene

DPOGS215452
Transcript	DPOGS215452-TA	1272 bp
Protein	DPOGS215452-PA	423 aa
Genomic position	DPSCF300098 - 669366-676092
RNAseq coverage	718x (Rank: top 18%)

Annotation
*Heliconius*	HMEL008363	1e-167	74.35%
*Bombyx*	BGIBMGA007485-TA	2e-139	68.48%
*Drosophila*	beta4GalNAcTA-PA	3e-83	48.46%
EBI UniRef50	UniRef50_Q6J4T9	3e-163	71.67%	Beta 1,4-N-acetylgalactosaminyltransferase n=6 Tax=Arthropoda RepID=Q6J4T9_TRINI
NCBI RefSeq	XP_001662147.1	1e-91	48.65%	beta-1,4-galactosyltransferase [Aedes aegypti]
NCBI nr blastp	gi\|47156063	1e-162	71.67%	beta 1,4-N-acetylgalactosaminyltransferase [Trichoplusia ni]
NCBI nr blastx	gi\|47156063	5e-167	71.67%	beta 1,4-N-acetylgalactosaminyltransferase [Trichoplusia ni]

Group
Gene Ontology	GO:0016757	2.1e-142	transferase activity, transferring glycosyl groups
	GO:0005975	2.1e-142	carbohydrate metabolic process
KEGG pathway	cel:Y73E7A.7	4e-81
	K07968 (B4GALT3)	maps->	Glycosphingolipid biosynthesis - lacto and neolacto series
			Glycosaminoglycan biosynthesis - keratan sulfate
			N-Glycan biosynthesis
InterPro domain	[151-419] IPR003859	2.1e-142	Galactosyltransferase, metazoa
Orthology group	MCL10856		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215452-TA
ATGATGATAATGGGACCCTTCCATAGAGCTCCCTCCTTAAACAAACTTAAGTCACAGGCTGCGCCATATGCGTTGATGGGCACCGCGGGCGGAGGGCGGGCGGCGCGGGCGCTCCGGCTTCTGCTTCTGCTAGTGCTGGCGCTGGCCGCTGTCGAGTACCTGTTCGGTTCCATCCTGGACGCATCACCTCTCAGGACCTATCTGTATGCACCGATGCACAACGTCACGCCGTCTATCAAAAACGATAAACAGATTATGGCTAAAAAACTTCTCACACAAGGAACAGAATCAGTTACAAACTACACACACACAACAAACAGTTCAAATAAAAATCCAGCCAAGGAAACATTTAACATGACGAAACCCAATCTATCTGACGACACGAGCACGCCGCTTTTAATCACCAAGATTATGGAGAGCATAAAGAATTTGGTAACCACAGAAGAAGACTTCAGAGATGAACCATCCTTACCGCTCTGTGATGAAATGCCGCCAGATCTAGGTCCCATATCAGTGAACAAGACTGAGATTGAACTAGATTGGGTGGAGAAGAGGTACCCGGAGGTCCGGAGTGGAGGAATATACTCTTCCTCTAATTGCACAGCCAGACATAGAGTTGCTATCATAGTACCCTACAGGGACCGTCAACAACACCTAGCGATATTCCTGAACCACATGCATCCATTCTTGATGAAACAGCAGATAGAATACGGAATATATATAATTGAACAAGAAGGTACCAGCGAATTTAATCGCGCGAAGCTGATGAACGTAGGCTTCGTGGAGAGTCAGAGACAGAGGTCGTGGCAGTGCTTCATCTTCCACGACATAGACCTCCTTCCTCTAGACTCACGGAACATGTACTCGTGTCCGAAACAACCGCGTCACATGTCCGCATCTATAGACAAACTCAACTTTAGGTTACCATACGAAGATATATTCGGAGGCGTCTCAGCTATGACACTGGAACAGTTCACGAAGGTGAACGGATTCTCCAACAAGTACTGGGGCTGGGGTGGAGAAGACGACGATATGTTTTATAGATTGAAAAAAATGAATTACCACATAGCGAGGTATAAAATGTCAATTGCAAGATACGCCATGTTAGATCATAAGAAGTCAGCGCCTAATCCTAAGAGATATCAGTTGTTATCACAGACGAGCAAAACATTTCAGAAAGACGGTCTATCGACGCTGGAATACGAAGTAATAAAGGTGACGGCCAACCATCTCTACACGCACATACTAGTGAACATAGACGAGCGCAGCTGA

Protein sequence:

>DPOGS215452-PA
MMIMGPFHRAPSLNKLKSQAAPYALMGTAGGGRAARALRLLLLLVLALAAVEYLFGSILDASPLRTYLYAPMHNVTPSIKNDKQIMAKKLLTQGTESVTNYTHTTNSSNKNPAKETFNMTKPNLSDDTSTPLLITKIMESIKNLVTTEEDFRDEPSLPLCDEMPPDLGPISVNKTEIELDWVEKRYPEVRSGGIYSSSNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIYIIEQEGTSEFNRAKLMNVGFVESQRQRSWQCFIFHDIDLLPLDSRNMYSCPKQPRHMSASIDKLNFRLPYEDIFGGVSAMTLEQFTKVNGFSNKYWGWGGEDDDMFYRLKKMNYHIARYKMSIARYAMLDHKKSAPNPKRYQLLSQTSKTFQKDGLSTLEYEVIKVTANHLYTHILVNIDERS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: