MonarchBase - Protein-coding gene

DPOGS210009
Transcript	DPOGS210009-TA	933 bp
Protein	DPOGS210009-PA	310 aa
Genomic position	DPSCF300327 + 1321-3650
RNAseq coverage	157x (Rank: top 52%)

Annotation
*Heliconius*	HMEL010183	2e-126	66.45%
*Bombyx*	BGIBMGA008401-TA	2e-116	62.58%
*Drosophila*	CG16771-PA	3e-72	46.90%
EBI UniRef50	UniRef50_E0VGW0	6e-82	50.52%	Alkaline phosphatase n=4 Tax=Pediculus humanus corporis RepID=E0VGW0_PEDHC
NCBI RefSeq	XP_002425354.1	1e-82	50.52%	Alkaline phosphatase, tissue-nonspecific isozyme precursor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|307183748	7e-84	47.74%	Alkaline phosphatase, tissue-nonspecific isozyme [Camponotus floridanus]
NCBI nr blastx	gi\|307183748	8e-83	48.21%	Alkaline phosphatase, tissue-nonspecific isozyme [Camponotus floridanus]

Group
Gene Ontology	GO:0008152	8e-82	metabolic process
	GO:0003824	8e-82	catalytic activity
	GO:0016791	2.1e-66	phosphatase activity
KEGG pathway	ame:410530	8e-76
	K01077 (E3.1.3.1, phoA, phoB)	maps->	Two-component system
			Folate biosynthesis
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[1-289] IPR017849	8e-82	Alkaline phosphatase-like, alpha/beta/alpha
	[1-294] IPR017850	1.5e-71	Alkaline-phosphatase-like, core domain
	[1-283] IPR001952	2.1e-66	Alkaline phosphatase
Orthology group	MCL17730		Insect specific

Nucleotide sequence:

>DPOGS210009-TA
ATGGGCGGTGGAAGGCAGAGTTTGATGCAGAATGTCACCGAAACCTCCTCAGACCCCATGAACAGCTGGACCTGTTCCAGAAGAGATGGACGTGACCTCATCAAGGTATACAAAAAGGACAAAGAAGATAGGAAACTTAAATACAGTGTTCTATCCAATAACAGAGACCTGAAAAACCTGGACGTGGCCGAGACTGATTACGTGTTAGGAATATTCGCAAACGAGCACTTGCGATATGAAAGCCAGAGAGACAAAGGTCCGGAGGGAATGCCATCTATCAGCGACATGGTGGAAGCGGCTATAAAAGTATTACGGAAGAATAACAATGGATACTTTTTAATGGTGGAGGGCGGTAACATAGATATGGCACACCACAGAGGACGCGCAAAGCTAGCTGTCAACGAGTCGTCCGCCATGGATGAAGCTGTCAAGAAAGCTTTGGAAATTACAAATGAAGAAGAAACGTTGATAGTTGTTACAAGTGATCACTCACACACTTTGACGATCAACGGCTACCAGGACAGAGGCGGCAATATATTTGGTACAACAGGCCCATCCAAATACGACGGTCTTAACTACACGGTTATCTCTTACGGCACGGGCGGGCCGGGTTCATTCAAACATTCAATGACAACCATCGACAATGTCACTCGCGTCGTCAGAAGAGATCCGTCAGCTGTCAATACGGATGACATGCTGTACGAGCAGATCGCGGCCATAACGTTGGAAGAGAACAAACACGGCGGAAATGACGTCACAGTTTACGCTAAAGGTCCATTTTCTCACCTCTTCCACAACGTTCACGAGCAACATTACGTATTCCACGCCATATCCTACGCGGCCAAGCTCGGGGTATATTCGTCGGGTGAAAGTATAAGACACAATGTTGCCATAATAGCTGTTGTATTATTACCATTACTGCAATTGTTGTAA

Protein sequence:

>DPOGS210009-PA
MGGGRQSLMQNVTETSSDPMNSWTCSRRDGRDLIKVYKKDKEDRKLKYSVLSNNRDLKNLDVAETDYVLGIFANEHLRYESQRDKGPEGMPSISDMVEAAIKVLRKNNNGYFLMVEGGNIDMAHHRGRAKLAVNESSAMDEAVKKALEITNEEETLIVVTSDHSHTLTINGYQDRGGNIFGTTGPSKYDGLNYTVISYGTGGPGSFKHSMTTIDNVTRVVRRDPSAVNTDDMLYEQIAAITLEENKHGGNDVTVYAKGPFSHLFHNVHEQHYVFHAISYAAKLGVYSSGESIRHNVAIIAVVLLPLLQLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: