MonarchBase - Protein-coding gene

DPOGS216041
Transcript	DPOGS216041-TA	3105 bp
Protein	DPOGS216041-PA	1034 aa
Genomic position	DPSCF300067 - 298137-318504
RNAseq coverage	7x (Rank: top 87%)

Annotation
*Heliconius*	HMEL008925	0.0	72.18%
*Bombyx*	BGIBMGA009019-TA	0.0	62.82%
*Drosophila*	CG8546-PB	3e-127	44.18%
EBI UniRef50	UniRef50_D6WXM6	2e-132	46.45%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WXM6_TRICA
NCBI RefSeq	XP_972346.1	3e-136	47.04%	PREDICTED: similar to pickpocket [Tribolium castaneum]
NCBI nr blastp	gi\|91089117	7e-135	47.04%	PREDICTED: similar to pickpocket [Tribolium castaneum]
NCBI nr blastx	gi\|91089117	1e-133	46.96%	PREDICTED: similar to pickpocket [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	6.1e-154	membrane
	GO:0005272	6.1e-154	sodium channel activity
	GO:0006814	6.1e-154	sodium ion transport
KEGG pathway
InterPro domain	[40-519] IPR001873	6.1e-154	Na+ channel, amiloride-sensitive
Orthology group	MCL18346		Insect specific

Nucleotide sequence:

>DPOGS216041-TA
ATGACATCCGGAAGTGTTGGAAGTATTATAGATATAACCCTAGAGGCAAATGAAAATCTTTCCAAGGACGAAGAAGTGAAAACAAAAAAACATAAATTAGGTTTACTCAAAAAGCATTTAATTGACTACTCAGCGAACTCAAATCTCCACGGACTTAAGTACATTGGTGAAAAGGACAGAACTCTGTTTGAAAAATGGAACGAAAGTCCCGTCATTGTAAGCTTCGCGGAAAAATCAACACCAGTTTGGCAGATTCCTTTTCCGGCTGTAACAATCTGTTCAGAAACAAAGGCGCGTCAAACGATTTTTAATTTAACAAAATATTATCATCTTTATGACGACGACATCACACGTTTAAATTTAACCGAGAAAGAGCGCCGATTATTCGAAGATGTTTCAATGGTTTGCGATGTGAACGTGGCATCTTACTTTGGAACTAAATTTTCTGATGCAAAAGAAACTGTTCAAAATATTAAAGAGCTATCTCCGAAAATAAATGATACATTTTATGCCTGTGTTTGGAAGAACTCGCTAAGTATCTGTTTAGACGAATTTTTGCCGATCATCACTGAAGAAGGTGTTTGCTACACCTTCAACACCTTGGGTGCTGAGGAATTATTTAGAGTTGAAAACCTCAATAAGGACTACGATTACTTAGAATATTCCAAACGAAATTCCAGTCTTTGGACGTTAGAAGATGGATATCCAACTGATAGTCCGGTAGAGACATACCCTCATAGAGGAATTGGTTTTGGCATTAAATCAGGATTGAATATATTTTTACAATCTAAAGAAATTGATCAGGACTTCCTTTGTAGAGGTCCTGTTAAGGGATTTAAGATATTACTGCATAATCCGGCCGAACTGCCTCGTCTTTCCAAGCAATACTTCAGGGCACCTTTATCTCATGAGGTGGTTGTTGCAGTTAAACCTAACATGATGACGACCTCTAAAGGCTTGAAATCTCTTGATTCTTCGAGACGTCAATGCTATTTCCCAACGGAGCGTTTCCTTCAGTATTTTAAAATTTACACACAGGCTAATTGTGAAATAGAGTGTCTATCAAACTTCACGTACGCCAGATGTGGCTGTGTTCATTTCGGCATGCCTCATGGTCCTAAAATTCCGGTCTGCAACGCCCGCAAAATCATCTGTATGAGTACAGCACAAATGGAACTAGCCACAGCAGAAATACAAAGTCATCTGGGAAAAGATACAACTGATAACGGCACTCTGGGTAACGCTCTGTTAGTAGCTACAAAATGCAAATGTCTTCAATCCTGTACATCTATAGAATACGATGCTGAAACATCACAAGGCGATTACAATTGGCAACCCCTATTTAAAGCCCTCAAGATAGATATTAGCAAAGAAGACACGGATGTTTCTATTAGTCGGGTTTCGATTTTCTTCAAAGAAGACCAATTCATTACTTCACGAAGATCTGAATTGTATGGTCAGACAGAGTTTTTAGCCAATGTCGGTGGTCTGCTAGGACTCTTTTTGGGCTTCTCCATACTAAGTCTAGCTGAAATATTTTATTTCCTTACCTTGAGATCAGGAAGTATAGGAGGTATCCAGGACGTAGACCCTGAAGTAAACAAAGGTCATCTCAATACCAAAAATGAGAAAATTAAAAAAGGAAAGCTGAGTGCCATCAAGCGGTATTTGATTGACTACACCGCAAACTCAAATCTTCACGGTCTGAAGTATATTGGAGAAAAGGAGAGAACTTTGATTGAAAAAATTTTCTGGCTGTTAATGTTTTCCTGTTCTTTAATATTCTGTATTGGAAAGATTCACTTAATATGGATTAGATGGAACGAAAGTCCCGTCATTGTAAGCTTCGCGGAAAAATCAACACCAGTTTGGCAGATCCCATATCCAGCCGTGACTATTTGTTTTGAAACAAAGGCTCGACAAACCATATTTAATTTTACCGAATACTATCATCTGTACAAGAATGAGACTACACGTGCGAATTTAACCGAAGAAGAACGCCACCTTTTTGAGGACGTATCTATGGTTTGCGATGATCACTTGGCCCCATCAAGTGGAAGAAGATTTTCTAATGGAAACGTAACAGTTGAGAATCTTAAAGAGCTATCACCAAACATAACTGAGATGCTCTTCGCTTGTAAATGGAAAGATGTTTCCCGCGTGAATTGTTCGGATTTATTTTTGCCGATCATCACTGAAGAAGGTGTTTGCTATACCTTCAATACCTTGGGTGCTGAGGAATTATTTAGAGTTGAAAACCTCAATAAGGACTATGGTTATTTAGAATATTCAAAACGAAATTCTAGTCAAATTTGGACGTTAGAAGATGGATATCCTCCTGATAGTCCGGTAGAGACGTACCCTCATAGAGGCACTGGATTCGGCGCAAAATCAGGATTAACGTTTTTGTTGAAAGCTAAGCAAATGGATCTTGACTACCTTTGTAAGGGTCCGGTTCAGGGGTTTAAGATATTACTTCATAATCCGGCAGAATTGCCTCGTCTGTCAAAACAATATTTCAGATCACCTTTATCCCAAGAGGTAGTAGTTGCAGTAAAACCTAATATGATGACGACTTCTGAAGGATTGAAACCTTACGACCCTACAAGACGTCAATGCTATTTCCCAACGGAGCGTTACCTACAGTATTTTAAAATTTACACACAAGCTAATTGTGAAATAGAGTGTCTATCAAACTTCACATACACTAGGTGTGGCTGTGTTCATTTCGGCATGCCTCATGGTCCTACAATACCCGTATGCAATGCCGGCATGGAATTAGTCACAGCAGAAATTCAAACCAATTTGGAAAAAGATGCAGCTGATAACGGTACCCTTGGTGAGGCTCTACTAGTAGCCGCAAAATGCAAATGTCTTCAAGCTTGCACGTCTATAGAATACGATGCAGAAACATCACAAGCTGACTACGATTGGCAATCCATATTCAGAGCTCATCGTCAAGAAATTGAAGAACAGGATAAGGAACTTTACTGCGTTCTGTCAAAGCGCCGACAATACTGGGACCTTGCTTCTTTTTTGGAGCGTAACCGATTCTATTATAAACTACCGAAGGAATTAAAGGGACAAAACAGTTCCCCATATTAA

Protein sequence:

>DPOGS216041-PA
MTSGSVGSIIDITLEANENLSKDEEVKTKKHKLGLLKKHLIDYSANSNLHGLKYIGEKDRTLFEKWNESPVIVSFAEKSTPVWQIPFPAVTICSETKARQTIFNLTKYYHLYDDDITRLNLTEKERRLFEDVSMVCDVNVASYFGTKFSDAKETVQNIKELSPKINDTFYACVWKNSLSICLDEFLPIITEEGVCYTFNTLGAEELFRVENLNKDYDYLEYSKRNSSLWTLEDGYPTDSPVETYPHRGIGFGIKSGLNIFLQSKEIDQDFLCRGPVKGFKILLHNPAELPRLSKQYFRAPLSHEVVVAVKPNMMTTSKGLKSLDSSRRQCYFPTERFLQYFKIYTQANCEIECLSNFTYARCGCVHFGMPHGPKIPVCNARKIICMSTAQMELATAEIQSHLGKDTTDNGTLGNALLVATKCKCLQSCTSIEYDAETSQGDYNWQPLFKALKIDISKEDTDVSISRVSIFFKEDQFITSRRSELYGQTEFLANVGGLLGLFLGFSILSLAEIFYFLTLRSGSIGGIQDVDPEVNKGHLNTKNEKIKKGKLSAIKRYLIDYTANSNLHGLKYIGEKERTLIEKIFWLLMFSCSLIFCIGKIHLIWIRWNESPVIVSFAEKSTPVWQIPYPAVTICFETKARQTIFNFTEYYHLYKNETTRANLTEEERHLFEDVSMVCDDHLAPSSGRRFSNGNVTVENLKELSPNITEMLFACKWKDVSRVNCSDLFLPIITEEGVCYTFNTLGAEELFRVENLNKDYGYLEYSKRNSSQIWTLEDGYPPDSPVETYPHRGTGFGAKSGLTFLLKAKQMDLDYLCKGPVQGFKILLHNPAELPRLSKQYFRSPLSQEVVVAVKPNMMTTSEGLKPYDPTRRQCYFPTERYLQYFKIYTQANCEIECLSNFTYTRCGCVHFGMPHGPTIPVCNAGMELVTAEIQTNLEKDAADNGTLGEALLVAAKCKCLQACTSIEYDAETSQADYDWQSIFRAHRQEIEEQDKELYCVLSKRRQYWDLASFLERNRFYYKLPKELKGQNSSPY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: