MonarchBase - Protein-coding gene

DPOGS211688
Transcript	DPOGS211688-TA	1599 bp
Protein	DPOGS211688-PA	532 aa
Genomic position	DPSCF300374 - 191533-198661
RNAseq coverage	56x (Rank: top 69%)

Annotation
*Heliconius*	HMEL014219	2e-96	46.30%
*Bombyx*	BGIBMGA011204-TA	2e-63	36.73%
*Drosophila*			%
EBI UniRef50	UniRef50_P19926	2e-76	37.50%	Glucose-1-phosphatase n=356 Tax=Enterobacteriaceae RepID=AGP_ECOLI
NCBI RefSeq	XP_969328.1	2e-34	45.41%	PREDICTED: similar to Parcxpwfx02 [Tribolium castaneum]
NCBI nr blastp	gi\|157371403	4e-80	38.58%	glucose-1-phosphatase/inositol phosphatase [Serratia proteamaculans 568]
NCBI nr blastx	gi\|183598460	3e-75	38.50%	hypothetical protein PROSTU_01855 [Providencia stuartii ATCC 25827]

Group
Gene Ontology	GO:0003993	1.4e-31	acid phosphatase activity
KEGG pathway	spe:Spro_3164	6e-81
	K01085 (agp)	maps->	Glycolysis / Gluconeogenesis
InterPro domain	[158-472] IPR000560	1.4e-31	Histidine phosphatase superfamily, clade-2
Orthology group	MCL16722		Lepidoptera specific

Nucleotide sequence:

>DPOGS211688-TA
ATGCTTCCCCGTTCATATTACACGGAACAAGACATAAGGAAGCGGCAGATTGATACATTAAAAATATTTAATGACAATGTTACTGAGATTGTTGAAAATACGGAATACAAAGTCGATTTTTCCGCTAATGGACACAACTTAAATCTTACAGTGATTCTTAACTCTGAATTTCCTAATGAGAAGCCTAACATATTCGTAAGCCCTGTCTTTCCTCACCCGTGGCTTGCTGAAAACTCAAACCAAGTGATTGGTGCACCAGGATTGGTGAACTATAGTCCACATTCTGATTTAGGACGGGTTGTTCAAGTTATTATACGCGAATTTCAGCGTTCAGCACCTAATATATACGGTCACGAAGATAAGTCCACAGACACCAGCCCAATGTCGCACTATAGCAACCAATCGCTGATGTTTCCAGAGTTGAATGAACTATCTATTGACGAATTACAGGAGATCATTGAGAATCCTGATCTACAGCAAGTGGTTATATTGAGCAGGCACAACATAAGGAGCCCTTTGGCGAGTTTTTTGAAGAAGTTCTCGCCTCATCCTTGGCCGGAATGGAATATAAGTGTTGGTTATTTGACAGAAAAAGGTGCTACTATGGAAGAAGACATGGGTGAATATATGTCCACTTGGTTGTGCACTGAGCTCTTCAAAGACAGCTGTCCCGAGGAGAGCTCCTTGCAAATATTCTCAAATTCTACTCAGAGAACTTACGAATCATCGAAAGCGTTTATTCGTGGTACTTTCAAAAATTGCAATAAAGTTTTAAGAGTTGGATCTGAGGAAATGGCGTCGTTGTTTGAAACTGTTGTCCGCAATGATTCAAAAGTGATGAAGGACCTTGTTCTTAACGAAATGAATACGAAAATAATGGAATTGGATACAAAAGAATCTTATAATTTATTGGAAGACATATTGGATATGAAAAATGCTGAAGTGTGCAAAATCGAGGGCATATGCAACTTTGATAAAGAAGACAGCGAAATTACATATGAATTCGGTAATTTGCTGAACGTCGAGGGCTCCTTGCTGTGGGCGAACCTGATAGTCGATTCGTTTCTTATGAGCTACTACGACGGATTTCAAATAGAAAACGTAGCTTGGGGAATGATCAAAGATTCTGGACAGTGGCGGACGCTCACAAGACTGATGATACAGTATCAGCACGTTGTTTTTAACAGTAAGTTAGTAGGGAGACAAGTGTCAAAACCTCTCCTTAGCTATATATCGTCTAAGTTTACGGCGGAAACAGAAAAAAAATTCATTTCGCTTCATGCCCATGACGCAAATTTATATTTTGTTCTGGCGGCACTGGAAGTTGAGGAGTTTGTGTTGCCAGAGCAATATGAAAGGACACCGATAGGCGGGAAGTTGGTGTTCCAGAGATGGCACGACGCTACACAGGGTAGAGATCTGTTTAAATTGAATTTTGTGTATTTAACCGTAGATCAGATAAGAGATGGGTCCAAACTATCAGCTAGTAATCCCCCACGATGGGTGCAGCTGTTTTTCAAGGATTGTCCCGTAGACTCAGACGGGTTCTGTTCTTGGGAAGATTTTGTTAATGTTCTAAATGATGCAGCCAGTTTTTAA

Protein sequence:

>DPOGS211688-PA
MLPRSYYTEQDIRKRQIDTLKIFNDNVTEIVENTEYKVDFSANGHNLNLTVILNSEFPNEKPNIFVSPVFPHPWLAENSNQVIGAPGLVNYSPHSDLGRVVQVIIREFQRSAPNIYGHEDKSTDTSPMSHYSNQSLMFPELNELSIDELQEIIENPDLQQVVILSRHNIRSPLASFLKKFSPHPWPEWNISVGYLTEKGATMEEDMGEYMSTWLCTELFKDSCPEESSLQIFSNSTQRTYESSKAFIRGTFKNCNKVLRVGSEEMASLFETVVRNDSKVMKDLVLNEMNTKIMELDTKESYNLLEDILDMKNAEVCKIEGICNFDKEDSEITYEFGNLLNVEGSLLWANLIVDSFLMSYYDGFQIENVAWGMIKDSGQWRTLTRLMIQYQHVVFNSKLVGRQVSKPLLSYISSKFTAETEKKFISLHAHDANLYFVLAALEVEEFVLPEQYERTPIGGKLVFQRWHDATQGRDLFKLNFVYLTVDQIRDGSKLSASNPPRWVQLFFKDCPVDSDGFCSWEDFVNVLNDAASF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: