MonarchBase - Protein-coding gene

DPOGS214668
Transcript	DPOGS214668-TA	1008 bp
Protein	DPOGS214668-PA	335 aa
Genomic position	DPSCF300321 + 17542-19524
RNAseq coverage	1696x (Rank: top 7%)

Annotation
*Heliconius*	HMEL004770	4e-164	88.82%
*Bombyx*	BGIBMGA001943-TA	3e-179	92.24%
*Drosophila*	CG1598-PA	4e-147	76.90%
EBI UniRef50	UniRef50_B0WEV5	3e-149	79.82%	ATPase ASNA1 homolog n=17 Tax=Metazoa RepID=ASNA_CULQU
NCBI RefSeq	XP_002424214.1	1e-151	80.62%	Arsenical pump-driving ATPase, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242006762	2e-150	80.62%	Arsenical pump-driving ATPase, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242006762	1e-151	80.62%	Arsenical pump-driving ATPase, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0005524	1.7e-91	ATP binding
	GO:0046685	1.7e-91	response to arsenic-containing substance
	GO:0015446	1.7e-91	arsenite-transporting ATPase activity
KEGG pathway
InterPro domain	[27-324] IPR016300	1.7e-91	Arsenical pump ATPase, ArsA
Orthology group	MCL12113		Single-copy universal gene

Nucleotide sequence:

>DPOGS214668-TA
ATGGATGAATCTAATGACTTTGAACCTCTAGAACCTTCATTAAAAAATGTAATAGAACAAAAGTCCCTCCGCTGGATATTTGTAGGAGGGAAAGGTGGCGTAGGAAAAACTACGTGTAGCTGCAGTTTGGCAGTCCAGTTATCAAAAGTTCGAGAGTCGGTTCTTATAATATCCACTGATCCGGCTCATAACATATCGGATGCCTTCGATCAGAAATTTTCTAAAGTGCCAACTAAGGTAAAAGGGTTTGATAACCTGTTTGCTATGGAGATAGATCCTAATGTAGGGTTAACAGAATTGCCCGAAGAATACTTTGAAGGCGAGACCGAGGCCATGAGACTTGGAAAAGGCGTGATGCAGGAGATCGTTGGAGCATTCCCCGGCATTGATGAAGCCATGAGCTATGCGGAGGTTATGAAGCTCGTCAAAGGTATGAACTTCAGTGCAGTCGTGTTTGACACAGCACCCACTGGGCACACATTGCGTTTGTTATCATTCCCTCAGGTGGTTGAAAAGGGTCTCGGTAAATTGATGCGACTAAAATCAAAGGTGGCTCCGTTCATCAATCAAGTGGCAACACTGTTTGGACTCGCTGAATTCAATTCGGACATGTTCAGCAACAAACTGGATGAGATGTTATCGGTCATAACACAAGTTAACACACAGTTCAAAGATCCGAATCAAACGACATTTGTCTGCGTGTGTATCGCTGAATTCCTCTCGTTGTATGAAACTGAAAGACTCGTCCAGGAACTAACGAGATGTGGAATTGATACTCATAATATAATCGTTAATCAGTTGCTCCTAAGAACATCAGCACCTTGTGAACTATGTGCAGCTCGACATAAAGTACAAGAGAAATACCTTGAACAAATAGCAGATTTATATGAAGATTTCCATGTAACAAAATTACCGTTGTTGGACAGGGAGGTACGCGGGGCGGCAGCTGTTCAGTCTTTTTCAGAACACTTACTGACACCATACGTTCCACCTGCTACCAGTTCTTAA

Protein sequence:

>DPOGS214668-PA
MDESNDFEPLEPSLKNVIEQKSLRWIFVGGKGGVGKTTCSCSLAVQLSKVRESVLIISTDPAHNISDAFDQKFSKVPTKVKGFDNLFAMEIDPNVGLTELPEEYFEGETEAMRLGKGVMQEIVGAFPGIDEAMSYAEVMKLVKGMNFSAVVFDTAPTGHTLRLLSFPQVVEKGLGKLMRLKSKVAPFINQVATLFGLAEFNSDMFSNKLDEMLSVITQVNTQFKDPNQTTFVCVCIAEFLSLYETERLVQELTRCGIDTHNIIVNQLLLRTSAPCELCAARHKVQEKYLEQIADLYEDFHVTKLPLLDREVRGAAAVQSFSEHLLTPYVPPATSS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: