MonarchBase - Protein-coding gene

DPOGS216080
Transcript	DPOGS216080-TA	2547 bp
Protein	DPOGS216080-PA	848 aa
Genomic position	DPSCF300529 - 10032-19173
RNAseq coverage	13x (Rank: top 83%)

Annotation
*Heliconius*	HMEL017128	5e-103	44.85%
*Bombyx*	BGIBMGA000402-TA	2e-141	36.38%
*Drosophila*	Mipp1-PB	9e-44	32.05%
EBI UniRef50	UniRef50_UPI0002246144	6e-58	32.95%	UPI0002246144 related cluster n=2 Tax=unknown RepID=UPI0002246144
NCBI RefSeq	XP_393246.3	4e-82	27.39%	PREDICTED: similar to Multiple inositol polyphosphate phosphatase 1 CG4123-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|345478779	2e-57	32.95%	PREDICTED: multiple inositol polyphosphate phosphatase 1-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345478779	1e-56	32.95%	PREDICTED: multiple inositol polyphosphate phosphatase 1-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0003993	6.8e-24	acid phosphatase activity
KEGG pathway	dme:Dmel_CG4317	7e-31
	K03103 (MINPP1)	maps->	Inositol phosphate metabolism
InterPro domain	[48-387] IPR000560	6.8e-24	Histidine phosphatase superfamily, clade-2
Orthology group	MCL35089		Lepidoptera specific

Nucleotide sequence:

>DPOGS216080-TA
ATGTCGAGTGTCGTGGTCAGTAAAGAGGAGTGTTACTGGAATAGACAGTGCAAGTATCAGTTATTTTCAACGACTACACCCTATGATATCATACGAGGGGACATTCGTGACCAGCCCAACCCTGACGGTTGTAAGGTCGTGAGTTTGTGGTCAATACATCGACACGGGAACCGTCATCCTGGAAGCAGGGTCGTAAAGGACACCAACGAGTTATGGGTCAAGTTGAGGGACCAAATTATAAGAAGTGAGGCAGAGTCAAGGAACTCACTTTGCTCACAGGACTTGGAAGATATATTAAATTGGAAATGGGATTCTTCGCTAGAAACTACACCATCTTACCTCACACAAGTGGGTAACGACGAAATATACTCGATCGGTAAAAGGGTAGCGAAAAAATACAATGAACTGATGCACGAAAGGATTGACCGATATTATTTCAGAGGAACCAACGAACAACGTACGAAAGCAAGTGTTCTAGCGTACGTCAATGGCCTAACTCATGGTTCAGACATGATCCTCACTTCACGGATAGAGGAATCTAGGGAACGAGATGACACTATTCGGCCTTACGAAAACTGTGATCGCTACCAGGAGTCAGTTAAGAACGGTTCGCTGTTGCCGGATCAGTTGGCTGAGTATGATCAAAGCTCCGAGTATTTAGCGGTCAGAGACCGAGTTTTCAAGCGACTAGGTATAACAAACGACACGGAAGAAATAAACGTATTCAATCTTTATGAGCTATGTCGGTTCTATCGGACCTGGAGTCCTAATCTTCAGTGTCCATGGTGCTCGCTCTTCTCCGACGAAGACCTGGTTGTGTTGGAGTACAGAGATGATGTACGGCATTATTACAAAAACGGATACGGGTTTGATATTAATGCAGATTTAGGTACACTCCCACTGAGGGATTTATTTGAGAATTTTGAGTTAGCGACGAGAGGGGAGGGTAAGAACATAGTTTCGTACTTTACCCACGACACTATGATGGAAATGATGTTCTGCGCTCTTGGGCTCTATAAGGACAAGAGCGTCATAAAAGGATCCTCAAGAAATCCAGACAGATTATGGCGGACAAGTTATATAGCATCGTTTTCTACAAATTTTATCGCCGTCCTTCACAGATGTGACTCCGATACTCATAGAGTCCAGCTGTTCATCAACGAGAAGCCCACCAGTCTTTGCCCTGTCGAAGGCTGCTCGTGGTCAGAGTTCGTCGAAACTTTCCAAAGGTTCTCCAACTCCTCTGACCGTAAAACATGTTTAGCTGACTCTGATGTGGATGAAGACAGCAATAATTTAAGTTGTAAGGTCGTGAGTTTGTGGTCAATACATCGACACGGGAACCGTCATCCTGGAAGCAGGGTCGTAAAGGACACCAACGAGTTATGGGTCAAGTTGAGGGACCAAATTATAAGAAGTGAGGCAGAGTCAAGGAACTCACTTTGCTCACAGGACTTGGAAGATATATTAAATTGGAAATGGGATTCTTCGCTAGAAACTACACCATCTTACCTCACACAAGTGGGTAACGACGAAATATACTCGATCGGTAAAAGGGTAGCGAAAAAATACAATGAACTGATGCACGAAAGGATTGACCGATATTATTTCAGAGGAACCAACGAACAACGTACGAAAGCAAGTGTTCTAGCGTACGTCAATGGCCTAACTCATGGTTCAGACATGATCCTCACTTCACGGATAGAGGAATCTAGGGAACGAGATGACACTATTCGGCCTTACGAAAACTGTGATCGCTACCAGGAGTCAGTTAAGAACGGTTCGCTGTTGCCGGATCAGTTGGCTGAGTATGATCAAAGCTCCGAGTATTTAGCGGTCAGAGACCGAGTTTTCAAGCGACTAGGTATAACAAACGACACGGAAGAAATAAACGTATTCAATCTTTATGAGCTATGTCGGTTCTATCGGACCTGGAGTCCTAATCTTCAGTGTCCATGGTGCTCGCTCTTCTCCGACGAAGACCTGGTTGTGTTGGAGTACAGAGATGATGTACGGCATTATTACAAAAACGGATACGGGTTTGATATTAATGCAGATTTAGGTACACTCCCACTGAGGGATTTATTTGAGAATTTTGAGTTAGCGACGAGAGGGGAGGGTAAGAACATAGTTTCGTACTTTACCCACGACACTATGATGGAAATGATGTTCTGCGCTCTTGGGCTCTATAAGGACAAGAGCGTCATAAAAGGATCCTCAAGAAATCCAGACAGATTATGGCGGACAAGTTATATAGCATCGTTTTCTACAAATTTTATCGCCGTCCTTCACAGATGTGACTCCGATACTCATAGAGTCCAGCTGTTCATCAACGAGAAGCCCACCAGTCTTTGCCCTGTCGAAGGCTGCTCGTGGTCAGAGTTCGTCGAAACTTTCCAAAGGTTCTCCAACTCCTCACTGGCATTTTGTACAAATCGACGCTCTGTTGTGGATGAAGACAGCAATAATTTAAGTAATATAATTACCGTCTCGAAATTTTTGACCTCACTTTTAATGTTGCTTCCATTGGTGCTTTCTGCTAATTAA

Protein sequence:

>DPOGS216080-PA
MSSVVVSKEECYWNRQCKYQLFSTTTPYDIIRGDIRDQPNPDGCKVVSLWSIHRHGNRHPGSRVVKDTNELWVKLRDQIIRSEAESRNSLCSQDLEDILNWKWDSSLETTPSYLTQVGNDEIYSIGKRVAKKYNELMHERIDRYYFRGTNEQRTKASVLAYVNGLTHGSDMILTSRIEESRERDDTIRPYENCDRYQESVKNGSLLPDQLAEYDQSSEYLAVRDRVFKRLGITNDTEEINVFNLYELCRFYRTWSPNLQCPWCSLFSDEDLVVLEYRDDVRHYYKNGYGFDINADLGTLPLRDLFENFELATRGEGKNIVSYFTHDTMMEMMFCALGLYKDKSVIKGSSRNPDRLWRTSYIASFSTNFIAVLHRCDSDTHRVQLFINEKPTSLCPVEGCSWSEFVETFQRFSNSSDRKTCLADSDVDEDSNNLSCKVVSLWSIHRHGNRHPGSRVVKDTNELWVKLRDQIIRSEAESRNSLCSQDLEDILNWKWDSSLETTPSYLTQVGNDEIYSIGKRVAKKYNELMHERIDRYYFRGTNEQRTKASVLAYVNGLTHGSDMILTSRIEESRERDDTIRPYENCDRYQESVKNGSLLPDQLAEYDQSSEYLAVRDRVFKRLGITNDTEEINVFNLYELCRFYRTWSPNLQCPWCSLFSDEDLVVLEYRDDVRHYYKNGYGFDINADLGTLPLRDLFENFELATRGEGKNIVSYFTHDTMMEMMFCALGLYKDKSVIKGSSRNPDRLWRTSYIASFSTNFIAVLHRCDSDTHRVQLFINEKPTSLCPVEGCSWSEFVETFQRFSNSSLAFCTNRRSVVDEDSNNLSNIITVSKFLTSLLMLLPLVLSAN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: