MonarchBase - Protein-coding gene

DPOGS210020
Transcript	DPOGS210020-TA	3399 bp
Protein	DPOGS210020-PA	1132 aa
Genomic position	DPSCF300372 - 73225-84332
RNAseq coverage	280x (Rank: top 39%)

Annotation
*Heliconius*	HMEL002089	1e-111	72.54%
*Bombyx*	BGIBMGA010836-TA	0.0	78.45%
*Drosophila*	CG7956-PC	2e-179	49.51%
EBI UniRef50	UniRef50_D6WZ41	0.0	46.50%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6WZ41_TRICA
NCBI RefSeq	XP_974291.2	0.0	48.20%	PREDICTED: similar to suppressor of actin (sac) [Tribolium castaneum]
NCBI nr blastp	gi\|189241146	0.0	48.20%	PREDICTED: similar to suppressor of actin (sac) [Tribolium castaneum]
NCBI nr blastx	gi\|189241146	0.0	48.06%	PREDICTED: similar to suppressor of actin (sac) [Tribolium castaneum]

Group
Gene Ontology	GO:0042578	4.2e-88	phosphoric ester hydrolase activity
KEGG pathway	tet:TTHERM_00079570	7e-57
	K01099 (E3.1.3.36)	maps->	Phosphatidylinositol signaling system
			Inositol phosphate metabolism
InterPro domain	[49-450] IPR002013	4.2e-88	Synaptojanin, N-terminal
	[630-744] IPR022158	1.3e-19	Inositol phosphatase
Orthology group	MCL13989		Single-copy universal gene

Nucleotide sequence:

>DPOGS210020-TA
ATGGAATTGTTTCGATCTGAATCCTATTTCATATTTGTGAGGAACGAGTCAAGTCTTTGGTGGAATCGGCTAACGGGAGCCTTTTCAGTCCGATCAGCATGGGATCTTTCCGATATCGAGGACATAGAATGCCTTGGTATAACAGAAGGTATTATAGGAAAAGTAGAACATTCAAATATATACGAGCCTCGTTTAATGATTATAAAAGAAAGCGTACCTATGGGTCAGATATATTTTCACCATACCATATACAAGATCAAATCAATATGCTTTTTGAATATGGGTGTGAATAATCAGGAACTTGAGCTTTCTCCATGTACGAAACATGGATCGTCAACCCTCTTGGAGAATGCAAGATCAAGCAGTAAGAAAATGGGGGCTCGTTTGTTTGAAAATTCCGCCTTTTTAAATAAAACTGTAGGTGCCGTTAAAAATGTTAGCAATACAATTAAAACCACAACACAGCAAGCCGCTACTCAGGTAAAACAAACAGTGAAGAAGCAACGTGATCCAAAACTAGCTGAACGGTTTGAGAAGCGTCTGACGGATGAGCTACACAAGATATTTGATGACTCTGACAGCTTCTACTATTCAAGAACATTAGATCTAACTAACTGCTTACAACGACAATATGAAATTGAAAAAATTTTGGAAACCGAAGAGGGCAATGGGAAACCAATCACTGACATAACAAGATGGTGGAAATATGTGGACGATAGATTCTTCTGGAACAAACATATGCTCAAAGATATTATCGCTTTGGAGAGTCCTGGTTGTGATGAATGGGTTCTGCCGGTCATCCAAGGCTATGTACATCTGTCACAAATAGCCGTCGAACCACCTGATGCCAATCCCTTGAATACCGAATCATTGTCGAGTACGAATTCATGCGATGAAACTTTCACTCTAGGTCTTATATCAAGAAGATCTAGGTACCAGGCTGGAACTCGGTACAACCGTCGTGGTATAGAGCCCGGTGGGAGAGTTGCAAACTATGTTGAAACTGAGCAGATTGTGTCCATTGTGTGCTCGGATAGCATTCACAGAGCATCATTTGTACAGGTCCGTGGATCTGTGCCAATATACTGGAGCCAGCCTGACTACAAGTTCAGGCCGCCGCCGAGGCTTGACAGAACCGAAGAAGAATCCCACCAGGCTTTTAAGAAGCACTTCGAAGAGGAGTTAAAACTTTATAAACAGATTTGTATAGTGAATTTGGTAGAGCAGCAGGGGAGAGAACGCATCATATGGGAGGCCTATAGCAACCACGTCCTCAAGTACAACAGTCCTAATATAATATACGCTACCTTCGACTTCCACGAATACTGCCGCGGCATGCACTATGAGAACGTTAGCATATTAATAAACGCTATATCGGATATCATCGGTGACATGCGTTTCTGTTGGCGTGACGACCGCGGCCTCATCTGTACACAGACCGGCGTTTTCAGAGTCAACTGTATAGACTGTCTCGATCGCACCAACGTCGTACAGACAGCGATAGCCAAGTACGTGTTGGAGTTGCAGCTATGTAGGTTAGGTCTCGGAGCCCCGGGCTTCGGTCTACCCGTGGGGCTCCGACAGGCCTTTCTGGCTATGTGGGCTGATAGCGGAGATCTCGTATCAAGGCAATACGCTGGCACCAAAGCTCTCAAGGGTGATTATACTCGCACAGGAGAGAGGAAGTTAACTGGGATGATGAAAGATGGCGTCGCATCCGCTAACAGATATTATCTGTCAACATTCAAGGACGCTCTCCGTCAAGTGGCTATTGATGTAATGACAGGAGAATCCAAAACTATACCAGAACAACTCATTGTACCCGACTGTACCCCGTGTACCTCAGTCAAGGTTCTTATGTTTAACGATCAATCAGTACCAGATACAGCGGCTATGGCACAGCATGTGAAGAGCCTCATAGATGACTGTAAGAAGCTCTTGGTGGATACGGAACCAGTCCTCGGCTCCTGGGGACTTATAGATGCCGACCCACATACCGGAGATCCTCAGGAAACGGAAATGGATAGCGTCCTGGTGTTAACGGGAGAGGCGTATTACGTCACAGACTATGACGAGACCTCCGACAGGTTGTTGTCGGTACAGAGGGTGCCTCTGAAGGATGTTACGTCTATAGAACTTGGCACTTTGGACTCTAGTGCTACGATATTCAGCGTGGCCCGCAAGAGTAACGCCGAGCCGGTGCACTGTATACGTATCAACTACATGTATAACAACGAACCGGGATACTTCCACATGTTCAGGTCAACATCGCTGAGGTTCTTCAATAACATGGCTGTGGCTATAAATACCAAGGACGAGATGATAGAATCCCTTCACTCGATATGTGAATCACTAGTTGTGGCGAGGGATGTAGCGAAATTATCACCTGTACCATTCCACGACGGAGTCAAGCTAGAAAGGAAAAAGTCTAAGATACATCCAACACAAGGGTCTTCAGGCGCTAAATCTTCCCTGTACTTGGACCTATCGAGACTGCCAACACTCACTAGAAATGTCAGCGAGACTCAGCTGGTGGCGGACATAAGGAGTGTCGGATCAAAAGCCCTAAACAATATGTCGGAGCAATTCAGCAAGCTGAATAAACTGAGTCACTCCCTGAACGCCAGAGCCAGACCTACATTACAATTGAAATTCGACCAAGGGACTTCAAAGACAAAGAAAATATTTACATTAGGGCAGAAGAGTGATGGCAAAAAGAAAGGAAGCCTATCAGACGGCGCGAGCTCGGACTATTCATCAGACGACGAGGCGAGGACCAACATCTTCGAGCCCACGCTAGACAACTTCGAACATCTACAACACTACATCGGAGATCAGGAGAGAAAGGACGAGAATGATTGCGATCTAGTAGAAAATCCACTGTATTCATCCAAAATTGAACCAAACTACGACATGGACACCACGATTTCCGATACCAGGACAAACGTATCGAAAACGCCAAGCAACAAGATGAACCCGTTCAACAGTGACGTCACACCGGAAATACAAGTGGACTCCAAGCCGATACCGCCGAATTCGCTGCTGCTGAACCAAAAACTGTCGCAGAGCTCCAGTTACCTCAACTTTGAACCTACGGTTAACTACGTAAGGTCTAATTCCCAGCACGAGATAACATTGAACATAGCGCAGTCGCATAGCGAATCAGCGTTACGGCAGTTGAAGAATATAACAAGTCCTGTGTCCACAGCCACCAAAGAAATGGTACTCTCGCCTCTCTCAAAACTGGCTAAGGGCGTGCAAACATTGGGCGCCAATCTAGATCCGAGGAAGATAAAGGCTCCGGCATCGGTGAAACATATATCAGAACAGCAGTATGAAGAACACAAGAGATTACAAGAAAAATGGCAGGATAGCAACACACGGCTGATTGCTCTGTGA

Protein sequence:

>DPOGS210020-PA
MELFRSESYFIFVRNESSLWWNRLTGAFSVRSAWDLSDIEDIECLGITEGIIGKVEHSNIYEPRLMIIKESVPMGQIYFHHTIYKIKSICFLNMGVNNQELELSPCTKHGSSTLLENARSSSKKMGARLFENSAFLNKTVGAVKNVSNTIKTTTQQAATQVKQTVKKQRDPKLAERFEKRLTDELHKIFDDSDSFYYSRTLDLTNCLQRQYEIEKILETEEGNGKPITDITRWWKYVDDRFFWNKHMLKDIIALESPGCDEWVLPVIQGYVHLSQIAVEPPDANPLNTESLSSTNSCDETFTLGLISRRSRYQAGTRYNRRGIEPGGRVANYVETEQIVSIVCSDSIHRASFVQVRGSVPIYWSQPDYKFRPPPRLDRTEEESHQAFKKHFEEELKLYKQICIVNLVEQQGRERIIWEAYSNHVLKYNSPNIIYATFDFHEYCRGMHYENVSILINAISDIIGDMRFCWRDDRGLICTQTGVFRVNCIDCLDRTNVVQTAIAKYVLELQLCRLGLGAPGFGLPVGLRQAFLAMWADSGDLVSRQYAGTKALKGDYTRTGERKLTGMMKDGVASANRYYLSTFKDALRQVAIDVMTGESKTIPEQLIVPDCTPCTSVKVLMFNDQSVPDTAAMAQHVKSLIDDCKKLLVDTEPVLGSWGLIDADPHTGDPQETEMDSVLVLTGEAYYVTDYDETSDRLLSVQRVPLKDVTSIELGTLDSSATIFSVARKSNAEPVHCIRINYMYNNEPGYFHMFRSTSLRFFNNMAVAINTKDEMIESLHSICESLVVARDVAKLSPVPFHDGVKLERKKSKIHPTQGSSGAKSSLYLDLSRLPTLTRNVSETQLVADIRSVGSKALNNMSEQFSKLNKLSHSLNARARPTLQLKFDQGTSKTKKIFTLGQKSDGKKKGSLSDGASSDYSSDDEARTNIFEPTLDNFEHLQHYIGDQERKDENDCDLVENPLYSSKIEPNYDMDTTISDTRTNVSKTPSNKMNPFNSDVTPEIQVDSKPIPPNSLLLNQKLSQSSSYLNFEPTVNYVRSNSQHEITLNIAQSHSESALRQLKNITSPVSTATKEMVLSPLSKLAKGVQTLGANLDPRKIKAPASVKHISEQQYEEHKRLQEKWQDSNTRLIAL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: