MonarchBase - Protein-coding gene

DPOGS206985
Transcript	DPOGS206985-TA	1593 bp
Protein	DPOGS206985-PA	530 aa
Genomic position	DPSCF300001 + 449014-457369
RNAseq coverage	868x (Rank: top 15%)

Annotation
*Heliconius*	HMEL002127	0.0	79.77%
*Bombyx*	BGIBMGA014198-TA	5e-146	51.99%
*Drosophila*	CG42249-PC	1e-101	38.40%
EBI UniRef50	UniRef50_E0A922	0.0	70.19%	Apyrase n=3 Tax=Obtectomera RepID=E0A922_HELZE
NCBI RefSeq	XP_001648679.1	1e-114	42.05%	apyrase, putative [Aedes aegypti]
NCBI nr blastp	gi\|302025915	0.0	70.19%	apyrase [Helicoverpa zea]
NCBI nr blastx	gi\|302025915	0.0	70.19%	apyrase [Helicoverpa zea]

Group
Gene Ontology	GO:0016787	1.8e-180	hydrolase activity
	GO:0009166	1.8e-180	nucleotide catabolic process
KEGG pathway	aag:AaeL_AAEL000575	4e-114
	K01081 (E3.1.3.5)	maps->	Purine metabolism
			Nicotinate and nicotinamide metabolism
			Pyrimidine metabolism
InterPro domain	[13-529] IPR006179	1.8e-180	5'-Nucleotidase/apyrase
	[327-528] IPR008334	4.1e-39	5'-Nucleotidase, C-terminal
	[21-233] IPR004843	1.2e-15	Metallophosphoesterase domain
Orthology group	MCL26180		Lepidoptera specific

Nucleotide sequence:

>DPOGS206985-TA
ATGCTTGGCGTTGTTTTAACTTTCGCTTTGCCATTCGAAGGATTGTTTCCAGTGGATTTGATACATTACAATGATTTTCATGCGAGGTTCGAAGAAACGTCAGTTGAGACGCCAACTTGTCGATTTAACAACAATTCCTGTATTGGTGGCCTGCCGAGACTCTTCCAGAAGATAGAAGACTTACGAAAGGAGAAACCAGATTCCATCTTACTGAACGCCGGAGATAGCTTTCAGGGGACGTATTGGTATACTCTTCTTAAATGGAATGTTACACAAGAGTTTATGAATCTTTTGCCCCATGACGCTCATGCTATCGGAAACCATGAGTTTGACGATGGACCACAAGGGTTGGCTCCATATCTCCAAGCTCTCAAAGCACCAGTACTTGCTGCCAACATGGACGCCAGTAAGGAACCAATTTTACAAGGTCTCTATAGAGGTCATGTTATCATAGAACGAAGAAAAAGAAGGATTGGACTCATTGGATTAATTACTCCTGATACAAAAATATTATCATCCGCCGGTAATGTAGAGTTCACTGATCCTGGCGAGGCGATGAGACGAGAAGCTAAGTGGCTTAATGAGAAAGGTGTAGACATCATCATTGTGCTCTCACATTGTGGCCTCGAAGTCGACAAGACATTAGCACGCGATTACGGCAAACACGTGGACATAATAGTGGGCGGACATTCCCACTCTTTACTCTGGAACGGTCCCTCTCCTAGCGGGGAAGACGTTGCCGGTCCATATCCCGTTTTTGTTCAATCTACTGCCACGACCAAACATAAGGTTTTAATAGTACAAGCATCAGCCTTCACCAAATATATGGGTAACTTGACAGTGTATTTCAATTATAGAGGTGACTATGTTAAATGGGAGGGAGGACCGGTTTTCCTTGACAGATCTTTACCGGAAGATAAAGAGATAAAAGCAAAGCTAGCGCCTTACGCAGCCATGGTGCATGCAGCTGAAAAGGAGATAGTGGGTGAAACATCTAAAACACTCCACTTTGAGGAGTGTGTGTCTGGGGAATGCGCTTTGGGAGATCTATTGGTTGATGCAATGACAGAATATGGAAAATCTTTGAAACCTGACTTGCATTACGTTGGTTTTATTCAGCGCGGGAACATAAAGTCTTCTATTCCGAGCGGAAATATAACGAAAGGGGTCATATTCGAACTTTTGCCGTTTAACGACCGTATTGAGATTTTCGAGTTACAAGGCAAAGATATATTGAAAGCCTTGGAGAGAAGCTTTTCCGGAGCCTGGAACATTAATCCGTTTAAGGGTCCCTACGTGTTACAACTGTCTGGTCTTCAAGTGACATACAACGTGTCACTACCTGAAGGGCAGCGTGTGAAATCAGTATTCGTTGGCCACAGTAAATCTAATATATCCCTAGATCCACATATATATTATCACGTGATAGCACCAGCATACTTGTCGGACGGAGGAGACGGATTTAACATGTTCAAAGAAGGAAAACGAAATACCGAGATCGTTGGTCGAGATGAGAAAGTTTTGGAACTTTACATAAAGAAGCACTCTCCGTTAAACATCAACACGGACGGACGGATTTTCGTCAATTATTGA

Protein sequence:

>DPOGS206985-PA
MLGVVLTFALPFEGLFPVDLIHYNDFHARFEETSVETPTCRFNNNSCIGGLPRLFQKIEDLRKEKPDSILLNAGDSFQGTYWYTLLKWNVTQEFMNLLPHDAHAIGNHEFDDGPQGLAPYLQALKAPVLAANMDASKEPILQGLYRGHVIIERRKRRIGLIGLITPDTKILSSAGNVEFTDPGEAMRREAKWLNEKGVDIIIVLSHCGLEVDKTLARDYGKHVDIIVGGHSHSLLWNGPSPSGEDVAGPYPVFVQSTATTKHKVLIVQASAFTKYMGNLTVYFNYRGDYVKWEGGPVFLDRSLPEDKEIKAKLAPYAAMVHAAEKEIVGETSKTLHFEECVSGECALGDLLVDAMTEYGKSLKPDLHYVGFIQRGNIKSSIPSGNITKGVIFELLPFNDRIEIFELQGKDILKALERSFSGAWNINPFKGPYVLQLSGLQVTYNVSLPEGQRVKSVFVGHSKSNISLDPHIYYHVIAPAYLSDGGDGFNMFKEGKRNTEIVGRDEKVLELYIKKHSPLNINTDGRIFVNY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: