MonarchBase - Protein-coding gene

DPOGS203268
Transcript	DPOGS203268-TA	1875 bp
Protein	DPOGS203268-PA	624 aa
Genomic position	DPSCF300229 + 61659-65362
RNAseq coverage	359x (Rank: top 33%)

Annotation
*Heliconius*	HMEL015358	87.40%
*Bombyx*	BGIBMGA000448-TA	89.93%
*Drosophila*	CG10217-PB	70.89%
EBI UniRef50	UniRef50_E3X967	71.03%	Putative uncharacterized protein n=10 Tax=Neoptera RepID=E3X967_ANODA
NCBI RefSeq	XP_395969.3	80.82%	PREDICTED: similar to CG10217-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|380014355	75.65%	PREDICTED: uncharacterized protein LOC100871601 [Apis florea]
NCBI nr blastx	gi\|380014355	75.65%	PREDICTED: uncharacterized protein LOC100871601 [Apis florea]

Group
KEGG pathway	nvi:100114326	2e-11
	K12386 (CTNS)	maps->	Lysosome
Orthology group	MCL14700		Insect specific

Nucleotide sequence:

>DPOGS203268-TA
ATGGTTCTTAAATCAATTTTAGTTTTAGTTACTTGTGTGATATTTATTTTACATGGACTTACGTCGGTTTCGGCGGAATGCACAATTCCAGTGGTTCTTCGAAATACTTGGTTTTCTTTTGAAAATGGAAAGCAAACGATCACTGATATAAATGCCAATGAAATGACTGGAAGGGGAATATGTATTAATATTAAAGCAGATTATCATGTAAACTACACAATGGTTTTTCAACACTCCAAGTGCTATTACTGTGTTAAGTTAATAGTTCGAACTGTGAATGTTTTGGAGAAAATTGAAACACCTTGTGTTGATTTGCCACCTGATCAAGAGCCTACAGTAGAAAGAGTGTGCAAAGGGTTTAAACCTGATCAATCTCTGATAACATTGTTCTCGGAGAATTCAGTTCCAGTTAACTGTAGGTCTTCACTTGAAGGTGTATGGCAATTTGCTTATCAGAATCGTTTCCGATTCACTGGTGAGTGTAACCACCCAGGTGCTCAGATTAAATCGTGTCAAACAGCTGGGACTCAGTTTCTTATAACTAACCAGAAGTTCAATATAACTTATAAGGAATGTCCCGGTATGTCTGGTACTTTTGAAGGTGTAGTTGAATTCAGCTGTCTAGGACATTGGTTTGTCGATAAGAACCACTTCTTTGCTGTGGCGAATACAAAGGAGTCACGTAAGGATGAAAGATACCGTTGCTTCCTTAAGAATCGGGACGATGACCTGTATATTGGTGCGTCCATAACACCTCAATGCAACACTTTGAAAACTGTCGAAAAGTCGCCGGAGAGATACAGAATAACACCAGTGAAGGCAGAAGTAGTGGAACCAGGTTGCCGTTTGCCTCAAAACTTTTCCGGAGACTGGATCAATACAGCAAATATTGATGCTGATGTGTTCATCAACGAGACTCACATCATTGAAACTTATTATCCAGATGAGGGGAGATACAGAAGGACAATATATGTGTGCAAAGAGCAACGTGACAGTCGTGTTATGATGGCCCGGCTTACAGTTGATGGTTGTCAAAAAGATTACGTCTGTTTTGACTTTGTACCTCAACATCATAATATCATAAGATATCGTAAAGGCCTAGCCATGATACAAAGTAATTTCCACACAGTCTGCTCATGGGTACAATTTCCGAACAAACAGAAATGGCGTTACGATTTATTCTTGAAGAGAGATCCCTCACCTATAAGATGTCCTGTTGCCGGTAAATTTAACTTTACACAAAGAGGAGACGTCAAATTTGAGACTAGAATACTCGGTGGAGTAACTTTGAGTCCACGTCCGAACTTGTACTGCAAACTGAACATAAGTGACTTTTCTGTATGCGATGTAGATCAGAAGACCATACAAATAAAAGAGAATTATTGCTTAACCGTGGACCATTTGGGTCGACCAGTGGATATTTACAGTGACCCAGATTATAAAATGAAATGTATCGGATATTGGAAGGAGAATTTGAAGTCTTATTTGATCACATACGACGAATTGGATCCCTTCTCAAAATATAGATGTTGGGTTTACCAAAGAGCTGATCTCAACAGAGTTCTTATGTCTCAAGCTCTGGGTCCGTACTGCGATTTGAAGCAAGATGTAACATCATGGAATTACACTGAGGGTGCCGCTGTGGCTATTGAAATGGAAGAATATGAGAGGGAGAGGGATCAATGTCCTATGCATTTCGATGATGGTAGTGACCCCTGGTCAACCAAAGAAAATTATATTAAGGTGTTTAACTTTGCTTACTCATTTTGGAGAAGCAATGGTGCAGCCACCATAACAATGTTTTTACCTCTCACAGCTTTAGTTTTTGGTATAAATATTTGGAAGAATCTTAATATTTTCTGTAGGTTAATGTAG

Protein sequence:

>DPOGS203268-PA
MVLKSILVLVTCVIFILHGLTSVSAECTIPVVLRNTWFSFENGKQTITDINANEMTGRGICINIKADYHVNYTMVFQHSKCYYCVKLIVRTVNVLEKIETPCVDLPPDQEPTVERVCKGFKPDQSLITLFSENSVPVNCRSSLEGVWQFAYQNRFRFTGECNHPGAQIKSCQTAGTQFLITNQKFNITYKECPGMSGTFEGVVEFSCLGHWFVDKNHFFAVANTKESRKDERYRCFLKNRDDDLYIGASITPQCNTLKTVEKSPERYRITPVKAEVVEPGCRLPQNFSGDWINTANIDADVFINETHIIETYYPDEGRYRRTIYVCKEQRDSRVMMARLTVDGCQKDYVCFDFVPQHHNIIRYRKGLAMIQSNFHTVCSWVQFPNKQKWRYDLFLKRDPSPIRCPVAGKFNFTQRGDVKFETRILGGVTLSPRPNLYCKLNISDFSVCDVDQKTIQIKENYCLTVDHLGRPVDIYSDPDYKMKCIGYWKENLKSYLITYDELDPFSKYRCWVYQRADLNRVLMSQALGPYCDLKQDVTSWNYTEGAAVAIEMEEYERERDQCPMHFDDGSDPWSTKENYIKVFNFAYSFWRSNGAATITMFLPLTALVFGINIWKNLNIFCRLM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: