MonarchBase - Protein-coding gene

DPOGS210868
Transcript	DPOGS210868-TA	1599 bp
Protein	DPOGS210868-PA	532 aa
Genomic position	DPSCF300027 + 1097266-1110078
RNAseq coverage	633x (Rank: top 20%)

Annotation
*Heliconius*	HMEL014178	3e-175	60.68%
*Bombyx*	BGIBMGA006993-TA	3e-141	61.64%
*Drosophila*	Mipp1-PB	4e-52	34.05%
EBI UniRef50	UniRef50_D6WUK9	1e-79	34.20%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WUK9_TRICA
NCBI RefSeq	XP_972932.1	2e-80	34.20%	PREDICTED: similar to multiple inositol polyphosphate phosphatase [Tribolium castaneum]
NCBI nr blastp	gi\|91087961	4e-79	34.20%	PREDICTED: similar to multiple inositol polyphosphate phosphatase [Tribolium castaneum]
NCBI nr blastx	gi\|91087961	9e-77	32.27%	PREDICTED: similar to multiple inositol polyphosphate phosphatase [Tribolium castaneum]

Group
Gene Ontology	GO:0003993	2.9e-16	acid phosphatase activity
KEGG pathway	dme:Dmel_CG4317	2e-31
	K03103 (MINPP1)	maps->	Inositol phosphate metabolism
InterPro domain	[183-457] IPR000560	2.9e-16	Histidine phosphatase superfamily, clade-2
Orthology group	MCL11033		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210868-TA
ATGCGCCTCATCCTCGGCGTGTTGACGCTCACAAGCCTGGCCTATTGCCAGGAAACTTGCCAGACCGCTGATGAGGACCCCTATCTTCTTTTCGGCACCAAAACAGCTTACACCTTCGCTAACAAAGGCATTCCGGTCAACAGAGCTCATGATATACCCGGTTGTCAACCAATCGCAATTTGGTTGCTGAACCGCCACGGCTCCCACAATCCCGAGGCAGACGAAATACCAGATCTCCAGAAGTTAACAGATCTTAAAAATAATATCATCGCGAACTACAAGAATGGCAACTTTAGGAACACTAATATCCGTATGTGCACATCGGACGTCAATCTCCTAGAGCGATGGGAATGGAATTCTCGTCAGAACGTGACATTCGCTGGAGAACTCACCAGCGACGGATATATATCCACTCAGGAGCTGGCACAAGCTTGGAAACAACGGTTCCCTGGACTACTGACAGATAATAGACACGATTATTTGATCCGTATGTGCACATCGGACGTCAATCTCCTAGAGCGATGGGAATGGAATTCTCGTCAGAACGCGACATTCGCTGGAGAACTTACCAGCGATGGATATATATCCACTCAGGAGCTGGCACAAGCTTGGAAACAACGGTTCCCTGGACTACTGACAGATAATAGACATGATTATTTGTTCAAATTTGTGAACGACCAGCGGTCGGAAACAACGTTCCGCGCTTTCACCGAAGGTCTGTTCAGGTCTCAGGCAGACAATTACGATATACCGAAGGAAAGCGATGAGAAGTTACTGAGGCCTTATAAATTCTGCCCATCATGGACCAAACAAGTCGAAGAGAATAACGACACTTTGTCACAGTTACGAACGTTCGAGTCAAAACAAGAATTTAAAGAGATGATAACCAACATATCCCTTCGAATGGGCTTCAACTATGACGTCCAGCGTGAGGTAGTCCAGCGAGCGTACGACATGTGCCGATATAACAAGGCCTGGAATGTGGCACAAATATCTCCCTGGTGTGCTGTTTTTTCCAAAGACGATCTGAAGCGTCTAGAGTACGCAGAAGACTTGGAGACCTATTACAAATACGGCTACGGTTCATACATGAATCAACAGATAGGATGTACCGGCGTCAAGGATATGATGGACTTCTTTAAAATACACGTTGAACATGAAACTCCGCAACAGCCGCGCGCGACCGTTCACTTCACTGAGGCGGCCATGTTGTTTCTGTCGTTGACGTCTTTTGGCGCGAGACGTGACGCCGCGCCGCTCACAGGCGACAACTATCACACGCCGACAGCCACCGCTCGCCACTGGACATCCTCTAGCATTTCACCGTACAATGCGAATCTTGCTGCTATACTGTACAAATGCACACCAAATAGCAATTTTCAAATTAACGACAAATATCAGGTGCTATTCTTGGAGAACGAGAGACCTTTATACCTCGAGGGATGTCGAGTTGGTCTGTGCGAATGGAACCTTGTCAAGAATCGTTTCGGTTTGATCGCTGACAATTGCAATTTAAATTTCTGCAACTCAGCCACTAAAGCCAACAGCATCGGCTTAAGTTTAGCTGTATTTGTGTTCATAACCAAATATATATTCTAG

Protein sequence:

>DPOGS210868-PA
MRLILGVLTLTSLAYCQETCQTADEDPYLLFGTKTAYTFANKGIPVNRAHDIPGCQPIAIWLLNRHGSHNPEADEIPDLQKLTDLKNNIIANYKNGNFRNTNIRMCTSDVNLLERWEWNSRQNVTFAGELTSDGYISTQELAQAWKQRFPGLLTDNRHDYLIRMCTSDVNLLERWEWNSRQNATFAGELTSDGYISTQELAQAWKQRFPGLLTDNRHDYLFKFVNDQRSETTFRAFTEGLFRSQADNYDIPKESDEKLLRPYKFCPSWTKQVEENNDTLSQLRTFESKQEFKEMITNISLRMGFNYDVQREVVQRAYDMCRYNKAWNVAQISPWCAVFSKDDLKRLEYAEDLETYYKYGYGSYMNQQIGCTGVKDMMDFFKIHVEHETPQQPRATVHFTEAAMLFLSLTSFGARRDAAPLTGDNYHTPTATARHWTSSSISPYNANLAAILYKCTPNSNFQINDKYQVLFLENERPLYLEGCRVGLCEWNLVKNRFGLIADNCNLNFCNSATKANSIGLSLAVFVFITKYIF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: