MonarchBase - Protein-coding gene

DPOGS211902
Transcript	DPOGS211902-TA	1815 bp
Protein	DPOGS211902-PA	604 aa
Genomic position	DPSCF300011 - 153640-161975
RNAseq coverage	1673x (Rank: top 8%)

Annotation
*Heliconius*	HMEL017722	9e-169	63.38%
*Bombyx*	BGIBMGA001097-TA	0.0	70.71%
*Drosophila*	Cnx99A-PC	0.0	53.43%
EBI UniRef50	UniRef50_B7PGQ2	1e-150	53.05%	Calnexin, putative n=4 Tax=Ixodidae RepID=B7PGQ2_IXOSC
NCBI RefSeq	NP_001036766.1	0.0	53.43%	calnexin 99A, isoform C [Drosophila melanogaster]
NCBI nr blastp	gi\|322790259	1e-180	51.84%	hypothetical protein SINV_10264 [Solenopsis invicta]
NCBI nr blastx	gi\|116008116	0.0	52.76%	calnexin 99A, isoform C [Drosophila melanogaster]

Group
Gene Ontology	GO:0005509	9.6e-212	calcium ion binding
	GO:0006457	2.6e-58	protein folding
	GO:0005783	2.6e-58	endoplasmic reticulum
	GO:0051082	2.6e-58	unfolded protein binding
KEGG pathway	dme:Dmel_CG11958	2e-180
	K08054 (CANX)	maps->	Phagosome
			Antigen processing and presentation
			Protein processing in endoplasmic reticulum
InterPro domain	[1-604] IPR001580	9.6e-212	Calreticulin/calnexin
	[50-297] IPR013320	1.1e-95	Concanavalin A-like lectin/glucanase, subgroup
	[44-299] IPR008985	1.9e-68	Concanavalin A-like lectin/glucanase
	[257-398] IPR009033	2.6e-58	Calreticulin/calnexin, P
Orthology group	MCL10647		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211902-TA
ATGATGGCACCTGGTATTATGCGGGTCTTTTTATTAAGCTTCTTGGTAGTCTCTGGCTCGCTGCAAGTTACGGCCGATGTCGACGATGCCGAAGATGGAGTAACTGTTGAGACAGAAGAGGAAATCTACCAAAGTCCTAAGGCCGATCCCAAGAAGGTGTATCTGGCGGAGAACTTTGATGATGTGGCATTGTTCAAGAAGAAGTGGATTAAGTCTGAAGCAAAGAAACAGGGTGTGGACGAAGATATCGCCAAATATGATGGGAAATGGGAGATACAAATACCAACAAGAAAAATATTCAATAGCGACTCAGGGTTGGTGCTGACTACAGAGGCTAAGCATGCAGCTATATCAACACTGCTCGACCGGCCGTTCGAGTTCAAAGACAAACCACTCATTGTACAATACGAAGTGACTATGCAGGAGGGTCAAAATTGTGGTGGTGCTTACCTAAAACTTCTATCACGCGGTGTGAACACGAAAGCAGACCTCAAACAGTTCCACGACCAGACTGCGTACACCATCATGTTTGGGCCCGACAAATGTGGCAACGACAACAAACTGCACTTCATCTTCAGACACAAAAACCCCAAGAATGGGACCATCGAAGAAAAACACTGCAAGAAACCAACCCAACGTCTTGAAGACATCTACAAAGACAAGGAGCCTCACCTGTACACTCTGATAGTGCGGCCAGACAACACATTCTCAGTCCTCGTCGACAACAAGGAGTTCAACGCCGGTTCGTTGCTAGAAGACTTCACCCCACCCGTCAACCCTCCGGAGGAGGTGGACGATCCCAACGACGAGAAGCCAGAGGACTGGGACGAGAGGGAGAAGATCGTGGATCCCTCAGCGAGTAAGCCAGATGACTGGGATGAGAGTGAGCCGGCACAGATCATAGACTTCAACGCTGTCAAACCAGACGGCTGGTTGGAAGACGAGCCTGACATGATACCAGACCCGGAGGCCAAGAAACCTGCGGATTGGGACGAGGAGATGGACGGGGAGTGGGAGGCGCCTCTCGTGGATAACCCTCGCTGTGCCTCCGCACCCGGCTGTGGAACCTGGGCGCCGCCCACCATTCCCAACCCTAAATACAAGGGTATCTGGCGGGCACCTCTCATCCCCAACCCCAACTACAAGGGCAAGTGGAGTCCAAGGCGGATCCCCAACCCGGACTACTTCAACGATGAGCATCCCTTCAGGATGACGCCCATTCACGCTGTTGGATTTGAACTGTGGTCGATGTCGCCCATGCTCTTGTTCGACAACCTGATCATCACGGACGATCCGGCGGTGGCGGAGGCCTGGGCCGCTCAGGGCTTCGCTCTCAAGAAACAGAGGATATCCAGTGACTCGAAAACGTGGTGGGGCAGACTGCTGAGAGCCGTGAAGTACCGGCCGGGCGCGGTGTCGCTGTACGTGGTGTACTGCGCCGTACCTATCGTTATATACGTCGCCTACCTTATAAGGAGATCCTATGAGGAGTCCGTGGTGGAGCTCGTCCTGCGCTCGGTGGGTGACAGACCCTGGCTGTGGGGAGCCGCGCTTCTGGTTTCCTTCGCTGTGTTGGCCTTCGTCGCATACATGTGTTGTGGACCTCGAGTGGATCCGGAAGCGGATGTCAAGAAGACGGACGCGGTTGTAGAGGATGATCCTCATCAAGAAGAAGTTGAAGAAACCAGTGAGAAGACGAGCAAAGCTGATCTGGAAGGCCCCGAGCCTGAGGCTGACACCAGTGATACCACACCCTTAGTGGACTCGGAAGCAGCCGGCGACGGACAGAGGAAGAGGAAACCACGCAAGGAGTGA

Protein sequence:

>DPOGS211902-PA
MMAPGIMRVFLLSFLVVSGSLQVTADVDDAEDGVTVETEEEIYQSPKADPKKVYLAENFDDVALFKKKWIKSEAKKQGVDEDIAKYDGKWEIQIPTRKIFNSDSGLVLTTEAKHAAISTLLDRPFEFKDKPLIVQYEVTMQEGQNCGGAYLKLLSRGVNTKADLKQFHDQTAYTIMFGPDKCGNDNKLHFIFRHKNPKNGTIEEKHCKKPTQRLEDIYKDKEPHLYTLIVRPDNTFSVLVDNKEFNAGSLLEDFTPPVNPPEEVDDPNDEKPEDWDEREKIVDPSASKPDDWDESEPAQIIDFNAVKPDGWLEDEPDMIPDPEAKKPADWDEEMDGEWEAPLVDNPRCASAPGCGTWAPPTIPNPKYKGIWRAPLIPNPNYKGKWSPRRIPNPDYFNDEHPFRMTPIHAVGFELWSMSPMLLFDNLIITDDPAVAEAWAAQGFALKKQRISSDSKTWWGRLLRAVKYRPGAVSLYVVYCAVPIVIYVAYLIRRSYEESVVELVLRSVGDRPWLWGAALLVSFAVLAFVAYMCCGPRVDPEADVKKTDAVVEDDPHQEEVEETSEKTSKADLEGPEPEADTSDTTPLVDSEAAGDGQRKRKPRKE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: