MonarchBase - Protein-coding gene

DPOGS202401
Transcript	DPOGS202401-TA	1788 bp
Protein	DPOGS202401-PA	595 aa
Genomic position	DPSCF300233 - 188868-193260
RNAseq coverage	406x (Rank: top 30%)

Annotation
*Heliconius*	HMEL007418	4e-56	83.72%
*Bombyx*	BGIBMGA003295-TA	0.0	69.18%
*Drosophila*	CG11851-PA	1e-142	41.83%
EBI UniRef50	UniRef50_E2B716	1e-143	45.83%	Alpha-1,2-mannosyltransferase ALG9 n=2 Tax=Formicidae RepID=E2B716_HARSA
NCBI RefSeq	XP_971096.1	7e-144	48.46%	PREDICTED: similar to CG11851 CG11851-PA [Tribolium castaneum]
NCBI nr blastp	gi\|332373836	3e-145	44.95%	unknown [Dendroctonus ponderosae]
NCBI nr blastx	gi\|91084169	2e-152	48.55%	PREDICTED: similar to CG11851 CG11851-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0006506	2.8e-101	GPI anchor biosynthetic process
	GO:0016757	2.8e-101	transferase activity, transferring glycosyl groups
	GO:0031227	2.8e-101	intrinsic to endoplasmic reticulum membrane
KEGG pathway	tca:659725	2e-143
	K03846 (ALG9)	maps->	N-Glycan biosynthesis
InterPro domain	[55-575] IPR005599	2.8e-101	GPI mannosyltransferase
Orthology group	MCL14458		Single-copy universal gene

Nucleotide sequence:

>DPOGS202401-TA
ATGCCACTTACTGCTCGACAACGAAGTATTCACAATAAAAATGGAGCTAAACGTACTGCTAGTTTTACTAAAGGCAGAAGATCGCAGAAATCTAACGAAGGAGAATATCTGTTTACAAATGCTCCATCAGACCTTCGAAGTATAGCATATCCTGGAGGAGCAGTGGCCCTAGCACTGCTCCTGTCAGCTCGCCTTGCATCTGCTTACTGGGGACAAATAGCAGACTGTGATGAAACTTACAATTATTGGGAGCCATTGCATTATTTGGTATACGGCAGCGGTCTTCAAACGTGGGAATACAGTGCCCAATATGCCATTCGATCATATATGTCTCTCTGGTTGTTTGCCGTACCGGCTAAAATACTATCCCTCATAATGACTCCTGTGACTATATTTTATACTCTGAAAGCACTACTGGCAGTGTTGATGGCTTGTTCTGAACTGATGTTTTATAAAGCCGTGTGCCATGAGTTTGGGGTCCATGTTGGTCGAGTGTGGTTGTTCCTGAACCTTCCAGCGGCTGGGTGCTTTGCTTCATCAGCTGCTATGTTACCGTCGTCTTGGAGCTCAGCGCTGGTGACGGCGGCCCTCGCTTGTTGGTGGCGTCGTAGATATCCGCCCGCTATCTTCCTTATCGCTGCCACTGTACTACTAAGTTGGCCATTCACAGCACTCCTGGGTGTACCGATAGCGGTGGATATGTTGTTATTCAAAGGACTTTTCAAAGAATTCATTAAATGGTCAATGATATCGCTGGTCATAATTCTTCTCCCGACTGTTGCTGTGGACTCCTGGCACTACGGACGTCTTGTGGTCGCTCCGTGGAACATTGTAGCTTATAATATATTCACCGAGCACGGTCCTGATCTGTATGGCGTTGAGCCGTGGACCTATTACTTTGTGAATGGATTCCTTAATTTTAATATTGTATGGGTCTTAGCTCTGTCCTGTCCCCTACTATTGGTCGCGTGTTCTCTTATATCAACTCGGTCGTCGCGTGCGTCGTTCTGTATCCCCTACTGGCTTAGTCTGATGCCATTGGCCTTATGGCTCGCCGTGTTCATGACGCAGCCGCACAAAGAGGAGAGATTTTTATATCCTGTGTACAGTATGATAATACTCTGTGGGGCAATATCCTTGGACTGTCTCCAGAAGATGACCTTCGCTGTCGGAACTGAACTGCTCCGCTGGAGGAAGGAGAGGGAAAGGCGACATTATCTAGTGTACACCGGGCCACTCGTAGTCATGTGTGTCTTGTTGGCCGGACTGTTGAGTATATCCCGTATTATAGCGTTACACAGTCATTACGGCTCAGTTTCTTCGTTGACCAGCCACGTGTCCCCTACTACAGCCGCTGGCGCCACCAACGACGTCCTAGTGTGTTACGGCAAGGACTGGTACCGCTCGTCTTCGAGTTTCCTAGCTCCTGGGCACGTGAGGTTCATCGCCAGCGAGTTCGACGGACAGCTACCCGCGCCATATTCTGTCGGAGCCAATGCAACCCGCGTGATACACCCGTACTTCAACGACCAGAACAGAGGCGATAACCGCACGTACCTACAACCGTCGGAATGCCATTACCTCGTGGACTCGGACGCGGGTAAACCGACGAGACTTCAACCACACTACCACAAGAGGGACGAATGGGAGATAGTTGCGAGAGTACCGCTACTGGACGCTGACAGATCACACAGGATATTCAGAGCCTTCTATGTGCCCGTGTTGACTAACAAGAACTGCGTTTACGCCAATTTGTACTTATTAAAGAACAGGCTTATAGAGTTTTAG

Protein sequence:

>DPOGS202401-PA
MPLTARQRSIHNKNGAKRTASFTKGRRSQKSNEGEYLFTNAPSDLRSIAYPGGAVALALLLSARLASAYWGQIADCDETYNYWEPLHYLVYGSGLQTWEYSAQYAIRSYMSLWLFAVPAKILSLIMTPVTIFYTLKALLAVLMACSELMFYKAVCHEFGVHVGRVWLFLNLPAAGCFASSAAMLPSSWSSALVTAALACWWRRRYPPAIFLIAATVLLSWPFTALLGVPIAVDMLLFKGLFKEFIKWSMISLVIILLPTVAVDSWHYGRLVVAPWNIVAYNIFTEHGPDLYGVEPWTYYFVNGFLNFNIVWVLALSCPLLLVACSLISTRSSRASFCIPYWLSLMPLALWLAVFMTQPHKEERFLYPVYSMIILCGAISLDCLQKMTFAVGTELLRWRKERERRHYLVYTGPLVVMCVLLAGLLSISRIIALHSHYGSVSSLTSHVSPTTAAGATNDVLVCYGKDWYRSSSSFLAPGHVRFIASEFDGQLPAPYSVGANATRVIHPYFNDQNRGDNRTYLQPSECHYLVDSDAGKPTRLQPHYHKRDEWEIVARVPLLDADRSHRIFRAFYVPVLTNKNCVYANLYLLKNRLIEF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: