MonarchBase - Protein-coding gene

DPOGS210258
Transcript	DPOGS210258-TA	2160 bp
Protein	DPOGS210258-PA	719 aa
Genomic position	DPSCF300216 - 306533-319197
RNAseq coverage	356x (Rank: top 33%)

Annotation
*Heliconius*	HMEL016978	5e-129	75.51%
*Bombyx*	BGIBMGA000032-TA	0.0	58.13%
*Drosophila*	5PtaseI-PF	9e-126	57.91%
EBI UniRef50	UniRef50_E2A2Z9	1e-136	63.03%	Type I inositol-1,4,5-trisphosphate 5-phosphatase n=15 Tax=Coelomata RepID=E2A2Z9_CAMFO
NCBI RefSeq	XP_973481.1	3e-137	63.23%	PREDICTED: similar to IP3phosphatase [Tribolium castaneum]
NCBI nr blastp	gi\|380016284	8e-137	63.87%	PREDICTED: uncharacterized protein LOC100866560 [Apis florea]
NCBI nr blastx	gi\|270013328	5e-132	63.23%	hypothetical protein TcasGA2_TC011918 [Tribolium castaneum]

Group
Gene Ontology	GO:0004437	3.8e-37	inositol or phosphatidylinositol phosphatase activity
KEGG pathway	tca:662279	1e-136
	K01106 (E3.1.3.56)	maps->	Phosphatidylinositol signaling system
			Inositol phosphate metabolism
InterPro domain	[4-375] IPR000300	3.8e-37	Inositol polyphosphate-related phosphatase
	[3-354] IPR005135	5.7e-28	Endonuclease/exonuclease/phosphatase
Orthology group	MCL14417		Single-copy universal gene

Nucleotide sequence:

>DPOGS210258-TA
ATGGGTTCCGATAAAGTGCCGTTGTTATTGGTGACTGCGAACGTCGGATCAGTGTTTGAGGACCCATCGGTGATGCTTCCAATATGGACGTCAGAGTTTCTGCAAGCTGTGTCCAGGATGGATCCAAAGTTTATAGCTCTTCATCTTCAAGAAGTCGGCGGAAAAACTTACGAGAAATCAATGCAATACGTTAAGGATTTCGTACAGAGGCTGTGTGACTGTCCCGAGTTGAGACTGTTTGATAAGATCAGGATGTATTTGGACGAAGACTTCAGTTCCTCAGAAAAATTTACGGCCCTGGGCAATATGTACTTTGCTCATACCACATTAACCGACCTCAAGATGTGGGACTTCGAATTGAAGGCGTACGTTGATGTTGTTGGCAAAGAGGTCTACAACGGTAACATAGAGAAAGTACCCACCAAAGAGAAGGCAAAGTTTCCCCAGCAATTTTTCCCTGAGTGTAAGTGGTCTCGCAAGGGATTCCTCAGGACTCGTTGGTCCATACGAGGAACAGCCGTCGAATTTATCAACATTCACTTATTCCACGACGCATCCAACTTACTCGCCATGGAGCCGTTTCCATCTGTGTATTGTCGCAGTCGCCGTCGCGCCCTCCGCCACACCCTCCGTCACCTCCACTCTGACGTGAACGCGGCGCCGTACTTCATTTTCGGTGACTTCAACTTCAGAACAGACACCGGCGGAGTTGTGAAGAAAGTAACGGAAGATTTGCACGCCTGCCGTCTCCAGAATTCTAACAACGTAGAGTCGTCCAAGCTGCAGTACCTGAAGGAAGATCGCGTGGTGCTTACCGTTGGGAAGAAGGAGTTCGCTCATGTAGACCATCAGAAGGTGTTCAGGGAGCCCTGGTTACAGAAATACGATCGCGAGCTGGAAGCGCTACGTCCCCATCTGTTCGAGTTCCCCGTAAAATTCCCGCCGAGCTATCCCTTCGAGGAAGATATACATTTGCCAACGCATTACATGAAAACGAGATGTCCTTCGTGGTGTGATCGTGTACTGCTGTCTCCGTCCGCCAGAGTTCTGGTGCAGCATGATAGAGACAAACACCTGCACACTTCCAGGAAGTCGGTAGCTGATTCTGATAGTGGAAGAGTGTCTTCATCTGATAGTAGCCCGGGACGATCTGGATCCCAGTCTCCGAAGATTCTAGAGAAGAAGCCGAGCTCGTCAGAGTTGGATGGACTGGTGGTGCCACATATGACCGGAGCCAGGAGGAGCATCGCAGACCCCACTGGCATACAACAGGCGATCAGCGCCAGGGTATCCGACTCCGAAGCGTCACCAGGTCGTCGTAAATTGGTGAGGAATCAATCGGAGGGCTCGCCCAAAAGTGGTGAAACTTCAGCCGAGTTGAGAAGATTAGTCGACGCACCGACGCGAAGACGGAGCGAATACGGAGTCATAGGAGACACCACGTGCATGGGTGACCATAAGCCGATATACCTCCGCGTGATGCTGCAGTGTGACCGAGGTATCGTACAGTGTTGTGACCACCTGCCTTGTGCCTTATGCGTGTGCGCACTCAATTACACCAAAAAACCCCAAAAACTGCCCCGCCTACCTACAGACCCCGATCTATATGCTAAAAAAACTATTCAGAGTTACGATCACTCGAGCAGCCACCCGGAGACGCTGTCCGACGAACAGAGACTTAGACGCACCAGAACCGGCTCGCTCAATGACAAAATATTTCGTATTCCGAACGTTAAAATAACCTGCGCCGACTCCATTTACAACGGCATCTTTGTCAACGACATCGACAGTTCGTTATTGAGTCCGAGCCGATGTCTGGGTCCGTACACCCCGGAGAGCGTGGACTCTCACACGCCCACCGCTGACGTGTCCAACGGTTCGGACGACCGTGACGTCATAGACGCTGTCGACAAACAGAAATACAGTCACGACAGGAGCGTCTCCCCGACGCAGCTGAAGTCCCGCTTAGACCGGCTCCTGAGCGATAAGGAGAAACAAAGCAACGATAGCACGCCGGAGATACAGAGGCGGAACAGCAATGAGTCGTGTAAGTCGGACGGCGGCAAGGGATTGTGCTGTCTGGCGCTGAAGTGCTACGGGTTCTGTAGGCGTAAGGCGCGCAAAGTCAACTGTAGTGGCTTGAAATGTTGCACCTCATGA

Protein sequence:

>DPOGS210258-PA
MGSDKVPLLLVTANVGSVFEDPSVMLPIWTSEFLQAVSRMDPKFIALHLQEVGGKTYEKSMQYVKDFVQRLCDCPELRLFDKIRMYLDEDFSSSEKFTALGNMYFAHTTLTDLKMWDFELKAYVDVVGKEVYNGNIEKVPTKEKAKFPQQFFPECKWSRKGFLRTRWSIRGTAVEFINIHLFHDASNLLAMEPFPSVYCRSRRRALRHTLRHLHSDVNAAPYFIFGDFNFRTDTGGVVKKVTEDLHACRLQNSNNVESSKLQYLKEDRVVLTVGKKEFAHVDHQKVFREPWLQKYDRELEALRPHLFEFPVKFPPSYPFEEDIHLPTHYMKTRCPSWCDRVLLSPSARVLVQHDRDKHLHTSRKSVADSDSGRVSSSDSSPGRSGSQSPKILEKKPSSSELDGLVVPHMTGARRSIADPTGIQQAISARVSDSEASPGRRKLVRNQSEGSPKSGETSAELRRLVDAPTRRRSEYGVIGDTTCMGDHKPIYLRVMLQCDRGIVQCCDHLPCALCVCALNYTKKPQKLPRLPTDPDLYAKKTIQSYDHSSSHPETLSDEQRLRRTRTGSLNDKIFRIPNVKITCADSIYNGIFVNDIDSSLLSPSRCLGPYTPESVDSHTPTADVSNGSDDRDVIDAVDKQKYSHDRSVSPTQLKSRLDRLLSDKEKQSNDSTPEIQRRNSNESCKSDGGKGLCCLALKCYGFCRRKARKVNCSGLKCCTS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: