MonarchBase - Protein-coding gene

DPOGS200445
Transcript	DPOGS200445-TA	2115 bp
Protein	DPOGS200445-PA	704 aa
Genomic position	DPSCF300236 + 537848-553190
RNAseq coverage	727x (Rank: top 18%)

Annotation
*Heliconius*	HMEL003641	8e-111	41.46%
*Bombyx*	BGIBMGA008904-TA	0.0	83.45%
*Drosophila*	pgant5-PA	4e-176	63.96%
EBI UniRef50	UniRef50_Q6WV17	7e-174	63.96%	Polypeptide N-acetylgalactosaminyltransferase 5 n=28 Tax=Coelomata RepID=GALT5_DROME
NCBI RefSeq	XP_002064617.1	0.0	64.11%	GK23729 [Drosophila willistoni]
NCBI nr blastp	gi\|195433228	0.0	64.11%	GK23729 [Drosophila willistoni]
NCBI nr blastx	gi\|194761562	0.0	64.56%	GF15722 [Drosophila ananassae]

Group
KEGG pathway	dwi:Dwil_GK23729	0.0
	K00710 (GALNT)	maps->	O-Glycan biosynthesis
InterPro domain	[565-693] IPR008997	3.4e-38	Ricin B-related lectin
	[183-367] IPR001173	2e-30	Glycosyl transferase, family 2
	[570-693] IPR000772	2.5e-30	Ricin B lectin
Orthology group	MCL11025		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200445-TA
ATGTTTAGAAGCAAAATAAGGATACACACATGTCGCATAATTTTACTCACATCATTAGTGTGGTTATTAGTTGATGTTGCCTTGTTAGCACTCTATTCAGATTGTTTTGGTGATGGATGGGATTGCAATAAAAATAAAAATCTAAATAATGACTACACAATCAAGACAAATGATGAGTACAAAGGAAAGAAAGCAGCCATAGCAGCAGCTTTACAGAAGGATGAAGATTTTGATGAGACAAATTTAGAAGAGAATGAAGTGGAACATGACATGGGTGATGATGGTTTAATTTTACCACCCTATCCAAAATCACAGCTTAGGAGATGGGCCCCAGCACCATTTGTTAAACCCCAGGAAGAGACTCCTGGTGAAATGGGTAAGGCAGTTAACATACCGATTGAACAAGAAAAAGTGATGTTGGAAAAGTTCCAAGAGAATCAGTTCAATTTACTCGCAAGTGACATGATATCACTGAACAGATCACTCACTGATGTTAGATTTGAAAAATGTAAAGCCAAACGCTATCCGACACTTTTGCCGACGACGAGTGTAGTTATAGTTTTCCATAATGAAGCGTGGACTACACTACTTAGGACAATATGGAGTACAATCAATCGGTCTCCCAGACCGCTGTTGAAGGAGATCATTCTCGTCGACGATGCCAGCGAAAAAGAACATCTAGGTAAGAAATTGGAAGAATATATAAAGACCCTGCCAGTTTCTACCCGGTTGTTCCGTACAGAGAGTCGATCGGGTTTAATAAGAGCCAGATTGCTTGGAGCCAAACACGTTAAAGGGGATGTCATAACGTTTTTGGACGCTCATTGTGAATGTACCGAGGGATGGTTGGAGCCGTTGTTATCACGGATCGTTGAGGACAGGAGTACGGTGGTGTGTCCTATTATAGATGTTATATCGGACACAACCTTCGAATATATACAGGCGTCTGATATGACCTGGGGCGGATTCAACTGGAAACTGAACTTTAGATGGTATCGTGTCCCAGAACGCGAGATGCAGCGCCGTGGTGGTGACCGCACCGCTCCTCTGCGTACACCCACCATGGCTGGCGGCTTGTTCGCCATCGATCGTGAATACTTCTACAAGATAGGATCCTATGATGAGGGCATGGATATATGGGGTGGGGAGAACTTGGAGATGAGCTTCAGGCTTGGTCCATACAAATGTACCAGTGTTACCAACATAAAATCCGCGGCTAAGGTATGGCAGTGCGGCGGCGTGCTGGAGATCGTTCCGTGCTCTCACGTGGGCCACGTGTTCAGGGACAAGTCCCCCTACTCCTTCCCCGGGGGGGTACAGGCCGTGGTGCTGAAGAACGCGGCCAGGGTCGCAGAAGTTTGGATGGACGAATGGGGGGAATTCTATTACGCCATGAACCCAGGTGTGTGGATGTGCGGTGGTACTCTGGAGATAGCCCCGTGCTCGCACGTGGGTCACGTGTTCAGGAAGACCACGCCGTATTCCTTCCCCGGCGGCACAGGCCGCGTCGTGAACCACAACAACGCCCGTCTAGCTGAAGTCTGGCTCGACGACTGGAAACATTTCTACTACAATATTAACCCAGGCGCTCTCAACGTACCCGTGGGCGACGTGAGCGAGCGGAAGGCGCTCCGTGAGCGTCTCAAGTGTAAAAGCTTCAGGTGGTACCTCGAAAACATATATCCAGAAAGTCAAATGCCATTGGATTATTACTATTTGGGAGAGATACGGAACGCGGAAACATCGAACTGTTTGGATACATTGGGTGGGAAGGCCGGGCAGCCGCTGGGTATGGGATACTGTCACGGGATGGGGGGAAACCAGGTGTTCGCGTATACTAAACGCAAGCAGATCATGTCGGATGACAATTGTTTGGACGCAGCTCACCCTCGCGGACCAATCAAGCTGATACGATGTCATGGGATGAGGGGAAATCAAGAGTGGACGTATGATACTAAGAGCCGTACAATAAAGCACACCAACACTGGCATGTGTCTCGACAAGCCAGAGTCTACAGACGTTTGGAAGCCGGTGTTGAGGTCCTGCGACAGGTCCAGAGGTCAACAGTGGCTGATGCAGGTCGACTTCAAGTGGCAAGCGAGGCATTCCAGCTAG

Protein sequence:

>DPOGS200445-PA
MFRSKIRIHTCRIILLTSLVWLLVDVALLALYSDCFGDGWDCNKNKNLNNDYTIKTNDEYKGKKAAIAAALQKDEDFDETNLEENEVEHDMGDDGLILPPYPKSQLRRWAPAPFVKPQEETPGEMGKAVNIPIEQEKVMLEKFQENQFNLLASDMISLNRSLTDVRFEKCKAKRYPTLLPTTSVVIVFHNEAWTTLLRTIWSTINRSPRPLLKEIILVDDASEKEHLGKKLEEYIKTLPVSTRLFRTESRSGLIRARLLGAKHVKGDVITFLDAHCECTEGWLEPLLSRIVEDRSTVVCPIIDVISDTTFEYIQASDMTWGGFNWKLNFRWYRVPEREMQRRGGDRTAPLRTPTMAGGLFAIDREYFYKIGSYDEGMDIWGGENLEMSFRLGPYKCTSVTNIKSAAKVWQCGGVLEIVPCSHVGHVFRDKSPYSFPGGVQAVVLKNAARVAEVWMDEWGEFYYAMNPGVWMCGGTLEIAPCSHVGHVFRKTTPYSFPGGTGRVVNHNNARLAEVWLDDWKHFYYNINPGALNVPVGDVSERKALRERLKCKSFRWYLENIYPESQMPLDYYYLGEIRNAETSNCLDTLGGKAGQPLGMGYCHGMGGNQVFAYTKRKQIMSDDNCLDAAHPRGPIKLIRCHGMRGNQEWTYDTKSRTIKHTNTGMCLDKPESTDVWKPVLRSCDRSRGQQWLMQVDFKWQARHSS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: