MonarchBase - Protein-coding gene

DPOGS204663
Transcript	DPOGS204663-TA	2439 bp
Protein	DPOGS204663-PA	812 aa
Genomic position	DPSCF300170 - 415583-425405
RNAseq coverage	55x (Rank: top 69%)

Annotation
*Heliconius*	HMEL008254	0.0	79.84%
*Bombyx*	BGIBMGA007465-TA	0.0	71.27%
*Drosophila*	CG15385-PA	2e-68	30.71%
EBI UniRef50	UniRef50_Q7Q0T7	3e-82	33.89%	AGAP010170-PA n=3 Tax=Culicidae RepID=Q7Q0T7_ANOGA
NCBI RefSeq	XP_319343.4	6e-83	33.89%	AGAP010170-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299217	1e-81	33.89%	AGAP010170-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|380020534	3e-43	39.92%	PREDICTED: acid phosphatase-like protein 2-like [Apis florea]

Group
Gene Ontology	GO:0003993	3.3e-12	acid phosphatase activity
KEGG pathway
InterPro domain	[528-740] IPR000560	3.3e-12	Histidine phosphatase superfamily, clade-2
Orthology group	MCL15071		Single-copy universal gene

Nucleotide sequence:

>DPOGS204663-TA
ATGATGAAGTTTTCGTTTCAGCACAGGGCATTTTACTGCTATCTTGGTATGAGTATTTGGATATGTTTTCTTATAACTGTAGTTTACAAATACATGTCTGTAGCTGAAGACACGGTCGCGTTGAAAGTTACTCATAACCAGTATGTGTCCAAGACTGATTCAAAATATAGGAAGCTCTTCATGCGGGCCTGCAATCCCCCTGATAGTATAGTCAGGGGATCTGAAGCTGCAGTAGACTCAGACAACTGGCTGTTACAAGGCATCTTAGTTATCACGAGGCACGGAGATCGCGGACCATTGACACATCTGAAGGGCGGGGATAAGCTGCCCTGCGATGTGGTTCCCGTCTCGCCGTTGCTTAAAAGCTATGAGGAGTTCGTTTTGAACGCCTCATCATCAGGTCGCGCCTGGTGGGTGTCAAGCGCTGGGCCGTTTCACAACTTCCCTTCCTTGCCACGAGCCGCGGCCACGCACTGCGCCCTCGGGCAGCTCACACCCACCGGACTGCTTCAGATGATCACCGTCGGCAACATCATTCGTGAGGCGTACAGTGAGAAATTGGGTCCAGAATATTTAGATTTAACGGGGAAACACGAGAGAATAGTTTACAAATACATGTCTGTAGCTGAAGACACGGTCGCGTTGAAAGTTACTCATAACCAGTATGTGTCCAAGACTGATTCAAAATATAGGAAGCTCTTCATGCGGGCCTGCAATCCCCCTGATAGTATAGTCAGGGGATCTGAAGCTGCAGTAGACTCAGACAACTGGCTGCTACAAGGCATCTTAGTTATCACGAGGCACGGAGATCGCGGACCATTGACACATCTGAAGGGCGGGGATAAGCTGCCCTGCGATGTGGTTCCCGTCTCGCCGTTGCTTAAAAGCTATGAGGAGTTCGTTTTGAACGCCTCATCATCAGGTCGCGCGTGGTGGGTGTCAAGCGCTGGGCCGTTTCACAACTTCCCTTCCTTGCCACGAGCCGCGGCCACGCACTGCGCCCTCGGGCAGCTCACACCCACCGGCCTGCTTCAGATGATCACCGTCGGCAACATCATTCGTGAGGCGTACAGTGAGAAATTGGGTCCAGAATATTTAGATTTAACAGGGAAACACGAGAGAAGTGGCGTAGCGTATAGCACGCGGTACCGGCGTACGTTCCAGTCCTTGCAGGCGGTCTCTTGGGGCGTGGGCCGGGGCGCCGCCGCCGCCAGGGAAGCGCACAGTGTGGCCTTCTGTTACAGACACTGTGCCTGTCACGCACACCACCTCCTTGACAAAAAAATAAGCACTGAGGCAAAGAGACGTTTGGAATCCCATCCAGCAATGAAGGAACTGATCAAGAAATTATCGAGAGTATTGTTCGAATCACAGGAATACACGGATGCGGATGTGGTCAGGGACGCGCTGCTGGCTTACATGTGCCACGAAGCGCCGCTGCCGTGCTCGGAGAGAACGAAGAGAAATAAGAAAAAACTATCGCTCAATAAAGGGAAAAGAAAGTATAGATCGGAGACAATCCCGCAAAGAAATCTCTTAGACATAGACATAGACGCGTTGAACTTAGAGCTAGACTATATCAATAACCGACTGGACTTCAACAACGAAATAGGAAGAAAGGCCAGAGACATCATAGGGAAGTATGACAAAAAGACGCCCTTGGATTTCGACGCCCAGATGGAGAGGGAGAAGCTTTTATACTACCAGCAAAGGTACCTGGACAACGCCGAATCCTACGACGACGTTGTTGTCGTCAAGAAAAATCTCGACGCGGATTTTAACTTCCCAAACGAAGCCCGTGAAGATTTCGAAGAAGATTACAAGGAACCGACGCCGGATGCTGAGGATTTTTGCATAAAAAAGGAGCACATTATATCCGTTTTCGCCTATCTGGAGTGGAGCTACCGTCAGGACGTCAAGAACACGCACAACAGAAGACGCGGGCTCTTGATAGCTTACGGCCTCATACACAACGTCGTACAAAACATGATAAGAATTATATCTGAGAACAAACCCAAATTCGTCCTATACTCCGGCCACGACAAGACCTTGCAGGCGTTAGTATTGGCGCTGGGACTCAAGAGCTACCAGCATTACAACATACAGTACGCATCGAGAGTCATCTTCGAGGTCTACAGGAAGAAGGATTTACGCGACGAATTCAAATTCATGAAACGGAAAGCGGTCGCTCAGGACTTCTACTTCCGGGTGGTTTACAACGGGGAGGACGTGACGGATAAGCTCAGCTTTTGCGCGGACACGCAGCTCGTGACTATGAAGGTGGTGGACCCGATCGACGACGTCAAAGCCTACAACACACACCTCTGCCCGATAGAAAATATCGTCAGATTCATTCACGACGATTACTTCTCAAGTTTCAACGTGAGTAATTACAAAGACGCCTGCGCCACCTACGGCGGCTCTAAGACTGTTTATTGA

Protein sequence:

>DPOGS204663-PA
MMKFSFQHRAFYCYLGMSIWICFLITVVYKYMSVAEDTVALKVTHNQYVSKTDSKYRKLFMRACNPPDSIVRGSEAAVDSDNWLLQGILVITRHGDRGPLTHLKGGDKLPCDVVPVSPLLKSYEEFVLNASSSGRAWWVSSAGPFHNFPSLPRAAATHCALGQLTPTGLLQMITVGNIIREAYSEKLGPEYLDLTGKHERIVYKYMSVAEDTVALKVTHNQYVSKTDSKYRKLFMRACNPPDSIVRGSEAAVDSDNWLLQGILVITRHGDRGPLTHLKGGDKLPCDVVPVSPLLKSYEEFVLNASSSGRAWWVSSAGPFHNFPSLPRAAATHCALGQLTPTGLLQMITVGNIIREAYSEKLGPEYLDLTGKHERSGVAYSTRYRRTFQSLQAVSWGVGRGAAAAREAHSVAFCYRHCACHAHHLLDKKISTEAKRRLESHPAMKELIKKLSRVLFESQEYTDADVVRDALLAYMCHEAPLPCSERTKRNKKKLSLNKGKRKYRSETIPQRNLLDIDIDALNLELDYINNRLDFNNEIGRKARDIIGKYDKKTPLDFDAQMEREKLLYYQQRYLDNAESYDDVVVVKKNLDADFNFPNEAREDFEEDYKEPTPDAEDFCIKKEHIISVFAYLEWSYRQDVKNTHNRRRGLLIAYGLIHNVVQNMIRIISENKPKFVLYSGHDKTLQALVLALGLKSYQHYNIQYASRVIFEVYRKKDLRDEFKFMKRKAVAQDFYFRVVYNGEDVTDKLSFCADTQLVTMKVVDPIDDVKAYNTHLCPIENIVRFIHDDYFSSFNVSNYKDACATYGGSKTVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: