MonarchBase - Protein-coding gene

DPOGS208848
Transcript	DPOGS208848-TA	2523 bp
Protein	DPOGS208848-PA	840 aa
Genomic position	DPSCF300528 - 36936-59037
RNAseq coverage	33x (Rank: top 75%)

Annotation
*Heliconius*	HMEL011588	0.0	66.32%
*Bombyx*	BGIBMGA011390-TA	3e-157	44.98%
*Drosophila*	hoe1-PC	4e-148	42.31%
EBI UniRef50	UniRef50_Q8IGX6	7e-146	42.31%	RE09889p n=21 Tax=Arthropoda RepID=Q8IGX6_DROME
NCBI RefSeq	XP_320080.3	2e-149	43.14%	AGAP009284-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|345492484	4e-148	41.68%	PREDICTED: P protein-like [Nasonia vitripennis]
NCBI nr blastx	gi\|158300087	1e-146	43.92%	AGAP009284-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0055085	7.8e-69	transmembrane transport
	GO:0015746	7.8e-69	citrate transport
	GO:0016021	7.8e-69	integral to membrane
	GO:0015137	7.8e-69	citrate transmembrane transporter activity
KEGG pathway
InterPro domain	[294-654] IPR004680	7.8e-69	Divalent ion symporter
Orthology group	MCL10326		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208848-TA
ATGAATAAAGATAAGAGCAACAGTGTTTATTCTATGGTGTCATTCAGTGACCTGACGCCAGGAAGTTTGGATGTGTGGGTGGACCTGCCGGACGCCATAAAATATGATCCGACCCTGGCTCCCTTCAAGCAGATGTACGAACAGAAACATGGCAAGGATCTGTCTAACGTCGAGGTCGAAGTACCAGCAGGTGATGACATAAACAAAAATAACAAAATAGCAGAAGAAAATTTAGTTTGCGAAAAGCAAATACGTGATAAAGATGTTGAGAACAGATTGGTGGAAGATATTAGTCCTGATGACGAAAAAACATTACCGAAACGTAAGAAACAGCTGGACCGCACGCTACGAGTAATAAAACTGTCAGTACTGGTGGCCGGCTGGGTGATGCTAACTGTTTCTTTGCTGATGAACAGAGAGAAGACCGACATTATTCTCCATACAGCTGTAAATGCTGGAGAAATCAAAGAATATTTTTTGGGGTCGTCGAGTGAGGAGTTTAGGGTCGCTATTTCTTTGACCGGCCCCTTCACTGACTCTTCCACCAACGCGACCTCGTCACTCCAGCTCTGGCTGCACAGAACATCCAAATACAAAGAAGATGAACAGGATTCGCCAGCGTGGAGTATTAATCTTCAGCCAGATGACGTCATAGACTTCTCTCCCAGCGCATCCGAGGATAAGGTCCTCATGATAGATAAGCAAACCTTCATAAACAATGAGACGTACGAAGAAAAAAATGCGTCCGAACACGGAGTGAACGAATCCAGAATCTTTCTATGTCTCAATAGCAGCAGTAGTCAAGCCGTTCCTCTTACCATCAGTCTTCACGGAAAACCACTGTCTGAAACCGAAGGACTTATATACGCGAGCGTCCTCTTAGCCACGCTGTATATTCTTATAATATTTGAGATAGTTAACCGAACGCTAGCAGCCCTATTGTCGTCTTCCTTGGGTGTGGCAACCCTAGCGCTGGTCGGGGAACGTCCTTCCCTCCCCGAGCTGATCTCGTGGCTGGATGTGGAAACACTCTTGCTGCTCTTCAGCATGATGATACTCGTCGCCATAATCGCGGAAACCGGATTGTTTGATTTCCTCGCTGTTAAGGCTTTCGAGATAACGGCGGGCAGGACCTGGCCTTTGATTAACTGCCTCTGTTTCTTTACCGCATTCTTTTCAACGTTCCTCGACAACGTAACCACAGTCCTTCTGATGACGCCAGTCACTATACGGTTATGCGAGGTGATGCAGCTGAATCCGGTTCCAGTTCTGATGTCCATGGTCATTTTTAGCAATGTAGGCGGCGCGGCCACGCCTGTTGGAGATCCTCCAAATGTGATCATAGCCAGTCACCCCTCCATACTCGCTGTGAACATAAACTTCACGTCTTTCACCCTCCACATGGGTCTGGGTATACTCCTGGTGTGCATACAGACATACGTACAGCTGAGGTTCATGTTCAGGGACATGAACAGTCTAAGACACTGCGTGCCACGCGATATACTTGAATTGCGTCAAGAAATCAGCGTGTGGAAGCGCGCGGCCGCGTCATTATCATCTTACTCGAGAGACGAAGACATCGTCAGACGAGCGCTGGAGAAGAAGCTCACCTGGTCGCAGGTGCAGAGACTGAAGTCGACTCTCGGAAGAAGGGAGGCTGGCGGAGGCAATGACAAACTCTTCTGTTCAACTCTCGCTCATATGAAGGATAAGTATCGAATAAGGGACAAGGCGTTGCTAGTGAAGAGTGGTGTGTGTATTAGCTTCGTCGTTCTGGTCTTCTTCCTCCACGCTGTGCCTGAGCTACAGAGTTTGTCTCTGGGCTGGACGGCCTTGCTGGGAGCCCTGCTACTTCTGCTGCTGTCTGAGCGCGAAGACCTGGAACCTGTGCTGGCTAGAGTTGAATGGTCCACACTGCTGTTCTTTGCAGCTCTATTTGTGATGATGGAGGTAAATGAAAATAGCGGCGAGAGTTTGTCTCTGGGCTGGACGGCCTTGCTGGGAGCCCTGCTACTTCTGCTGCTGTCTGAGCGCGAAGACCTGGAACCTGTGCTGGCTAGAGTTGAATGGTCCACACTGCTGTTCTTTGCAGCTCTATTTGTGATGATGGAGGTGTTATCGAAGTTAGGTCTCATAGCGTGGATAGGGAGGATGACTGAAACTGTGATATCCCAAGTCGGCGAGGACTCTAGACTGGCTGTGGCTGTCATGCTGATACTTTGGGGAAACCAGAGTGATGTGCTAGAGTTACTCACAGCTAGTGATGTATCGGACAGAAATATTGTTACCGCGATGGTGGAAAGGAGTGAAAAGCTAAAGGCCATGTTCTCTCCAATCAAGGAACGCGCAGAGCGTCTGGTCATGATGCAGTCGCTGGCTGGGCTCGCAGCGATACTGTCGAGGTTCTCCGTCCAGCCTGCGCCGGGAGCGCCTCGAAAACCAACCATCGATACTCGCTCCAACATTGTCCAAGTAATACGAGGAGGTTTACCGCTCATTTTCACAGAGAGACGACCACACTGA

Protein sequence:

>DPOGS208848-PA
MNKDKSNSVYSMVSFSDLTPGSLDVWVDLPDAIKYDPTLAPFKQMYEQKHGKDLSNVEVEVPAGDDINKNNKIAEENLVCEKQIRDKDVENRLVEDISPDDEKTLPKRKKQLDRTLRVIKLSVLVAGWVMLTVSLLMNREKTDIILHTAVNAGEIKEYFLGSSSEEFRVAISLTGPFTDSSTNATSSLQLWLHRTSKYKEDEQDSPAWSINLQPDDVIDFSPSASEDKVLMIDKQTFINNETYEEKNASEHGVNESRIFLCLNSSSSQAVPLTISLHGKPLSETEGLIYASVLLATLYILIIFEIVNRTLAALLSSSLGVATLALVGERPSLPELISWLDVETLLLLFSMMILVAIIAETGLFDFLAVKAFEITAGRTWPLINCLCFFTAFFSTFLDNVTTVLLMTPVTIRLCEVMQLNPVPVLMSMVIFSNVGGAATPVGDPPNVIIASHPSILAVNINFTSFTLHMGLGILLVCIQTYVQLRFMFRDMNSLRHCVPRDILELRQEISVWKRAAASLSSYSRDEDIVRRALEKKLTWSQVQRLKSTLGRREAGGGNDKLFCSTLAHMKDKYRIRDKALLVKSGVCISFVVLVFFLHAVPELQSLSLGWTALLGALLLLLLSEREDLEPVLARVEWSTLLFFAALFVMMEVNENSGESLSLGWTALLGALLLLLLSEREDLEPVLARVEWSTLLFFAALFVMMEVLSKLGLIAWIGRMTETVISQVGEDSRLAVAVMLILWGNQSDVLELLTASDVSDRNIVTAMVERSEKLKAMFSPIKERAERLVMMQSLAGLAAILSRFSVQPAPGAPRKPTIDTRSNIVQVIRGGLPLIFTERRPH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: