MonarchBase - Protein-coding gene

DPOGS211310
Transcript	DPOGS211310-TA	3462 bp
Protein	DPOGS211310-PA	1153 aa
Genomic position	DPSCF300125 - 108533-126210
RNAseq coverage	234x (Rank: top 43%)

Annotation
*Heliconius*	HMEL009371	0.0	67.72%
*Bombyx*	BGIBMGA004963-TA	0.0	76.46%
*Drosophila*	CG31368-PD	7e-149	71.39%
EBI UniRef50	UniRef50_O60306	0.0	57.77%	Intron-binding protein aquarius n=117 Tax=Metazoa RepID=AQR_HUMAN
NCBI RefSeq	XP_002429122.1	0.0	61.53%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242017285	0.0	61.53%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|380024866	0.0	61.62%	PREDICTED: intron-binding protein aquarius [Apis florea]

Group
KEGG pathway	phu:Phum_PHUM420720	0.0
	K12874 (AQR)	maps->	Spliceosome
Orthology group	MCL14984		Single-copy universal gene

Nucleotide sequence:

>DPOGS211310-TA
ATGCTGAAATTTTATGCTCGTTTTGAGATCAGCGACGAAACCGGTGATCCCATGACCGACCGCGACATGACCTTACAGCACTATTCCAGAATAACATCACTACAGAAAGCTGCGTTTACAAAGTTTCCCGATCTAAGATTGTTCTCTCTAGCAAACGTAGCAAGCGTTGATACCAGGGAATCTCTTCAGAAACACTTTGGGAATCTCAGTGATAAGGCATTAAGGGCCATTGCCACTTATCTGAATTTAGTTCCCACGGAAGGCAAGGAAGATGAAGCGCCTTGGCACAGACTGGACAAAGATTTCCTCAGGGAACTTTTGATATCAAGACACGAGCGAAGAATTTCTCAGCTGGAAGAATTGAATTCAATGCCCCTATATCCCACCGAGAAGGTTGTGTGGGACGAGCACGTGGTGCCGACCGAGGTTTACAGCGGGGAGCGTTGCCTCGCCTTACCGAAACTTAATCTCCAATTCCTGACACTTCACGATTACCTGTTGAGGAACTTCAACCTTTTCCGCCTAGAGAGTACATATGAGATCCGTCAGGACATTGAGGATGCTGTTTATCGCCTGTCACCATGGAAATCTGAAGACGGTACTGTGATATTCGGAGGCTGGGCACGTATGGCTCATCCTATCCAAAGCTTCGCTGTGGTTGAGGTGGCGAAACCGAATATAGGAGAGAAGGCGCCTTCAAGGGTCCGTGCTGACGTCACAGTGACCCTCAGCGTCAGGAACGAGATCAAGCACGAGTGGGAGAGTCTCAGGAAGCACGATGTATGCTTCCTTATAACCGTACGGCCTAGCGAGGGTATAGGGACGAAATACGATTACAAGAAAAGTATGGTCGACCAGGCTGGTATAGTCTACATCCGAGGTTGTGAGGTCGAGGGGATGTTGGACGCCGGCGGGAGGGTCATAGAGGACGGGCCAGAACCTCGACCAGAACTAGAGGGAGATTCCAGAACATTCAGGCTGCTGCTAGACCCTAACCAGTATAGGTTGGACCTTGACGAAGCCAGCAAAGGAAAAGAGGCTGGTATAGTCTACATCCGAGGTTGTGAGGTCGAGGGGATGTTGGACGCCGGCGGGAGGGTCATAGAGGACGGGCCAGAACCTCGACCAGAACTAGAGGGAGATTCCAGAACATTCAGGCTGCTGCTAGACCCTAACCAGTATAGGTTGGACCTTGACGAAGCCAGCAAAGGAAAAGAGGATGTGTACGAGACATTCAATATCGTTGTCCGACGGAAGCCTAAAGAGAACAACTTTAAGGCTGTTCTGGAGACGATACGAGAGCTGATGAACACGGAGTGCGTGGTGCCTGAGTGGCTTCATGACATAGTGCTGGGCTATGGCGACCCTGGGCAGGCGCACTACACCAGGATGCCCAACGAAATCCCTACCCTGGATTTCAACGACACGTTCCTGGATATGGAACATCTACGGAACAGTTTCCCGGGACACGAGATAAAGGTACAGACGGACGATCCGCGGAAACTCGTCCGACCGTTCAAATTGACTTTCGAGAACGTTCTACGTAAACAGCGAGGCGAAACGGATATGGATGAAGAGGAACCCAAGAAGGTTATAGTTGTAGAACCCCACGTGCTGCCCAAGAGAGGGCCGTACCTGTACAATGAACCTAAAAAGAACAACATACTGTTCACGCCGACCCAGGTGGAAGCGATCCGTTCAGGAATGCAGCCGGGGCTGACGGTCGTGGTGGGACCTCCCGGCACGGGTAAAACTGATGTCGCAGTCCAGATAATATCGAACTTGTACCACAACTTCCCGTCCCAGAGGACGTTAGTTGTGACGCACAGTAATCAAGCTCTTAACCAGCTGTTCGAGAAGGTTGCTGAGCTGGATGTGGACGAAAGGCACCTGCTGCGTCTTGGACACGGCGAGGAGGCTTTGCAGACGGACAAGGACTTCTCCAGGTATGGACGTGTGAATTACGTGCTGGCAAAGCGTTTGGAACTCCTCGGCCAGGTGTCGCGTCTTCAGACCACGCTGGGGGCGGGGGGAGAGGCGGGTGGTTTTATTATTATTGGGCACGTTATTATTGAGGGTAGTTGTGAGAATATTTGCATATTCTTACCTAGATCTGGCTCTTCCCTGAGCATCCAACTCCACATACGGCACACCGAGTCTCACCATCCTCGTGAAAAGGCTTTGTTCCATATTACAGTACTTCTGGAAAGCCATTATAATTTTAATAATTATCCAGTCTTAATATTAATTTCATTGAAAATAAAATGCAAACTAATTTCCGTTGTGTTTGTCGTTTTAGAACGTTCCTTGGCACATTGTTTTGTATGTTTCAAATACGACAACATTCTGATGGAGGAGTCCGCACAAATTCTTGAAATAGAGACCTTCATACCACTGCTGCTGCAGAACCCTCAAGATGGTAGGTCCCGGTTGAAGAGGTGGATAATGATCGGCGACCACCACCAGCTACCGCCGGTGGTGAAGAACATGGCTTTCCAGAAGTACTGTAATATGGAACAAAGCCTTTTCACGAGGATGGTGAGACTCGGTGTGCCGTATGTGGAGTTGGATGCTCAGGGAAGAGCCAGATCTAGCATATGCAACCTGTACCGCTGGCGCTATCGTAACCTGGGAGACCTGCGACACGTCTGCCAGCTGCCAGAGTACCGCGCGGCCAATGCCGGCCTCAGGCACGATATACAACTCATCAATGTAGACGACTTTAATGGAGCTGGAGAGACGGAACCCAGCCCGTACTTCTATCAGAATTTGGCAGAAGCGGAATATGTCGTGGCCGTGTTTATGTACATGCGTCTGATAGGCTGGCCAGCTGAGAAGATCTCGATCCTCACCACTTACAACGGACAGAAACATCTCATTAGGGACGTTATTAACAAACGGTGCGCCGACAACCCGCTCATTGGGAGACCACATAAGGTGACGACAGTAGACAAGTATCAGGGTCAGCAGAACGACATCGCTCTCATATCGCTGGTGCGGACGAAGGCGGTGGGTCACGTGAGAGATCTGAGACGTCTTATAGTAGCGACCTCTAGGGCTCGCCTCGGACTGTACATCTTCGCCAGAGCCAGCCTCTTCAGGAACTGCTTCGAATTGCAGCCGACATTTAATCAGTTGTTAGAGCGGCCGTTACAGCTGGAGTTGATCCCGGGTGAGTCATACCCGGCCCAGAGGACGCTCAGTGCTGCCGTGCCCGAGGAGCTAGTGCTGCGTGTAATGGACATGCCGCACATGGCGCGATACGTTTACGATATGTACATACAGAGAGTCAGAGACTCAGCTCAGGATTCCACATGGAGCGCCCCCGGATCTGATCGTTCAGCTCGTTCCAAGGAGGCGGATCATCACGTGGCGGTGCACCCGGGGGGTGACAGCGACGAGGACGACGCCACCGCCTTCCAACCCACGGATATAGTGAACGAGATCGAGGAACAGGAGTGA

Protein sequence:

>DPOGS211310-PA
MLKFYARFEISDETGDPMTDRDMTLQHYSRITSLQKAAFTKFPDLRLFSLANVASVDTRESLQKHFGNLSDKALRAIATYLNLVPTEGKEDEAPWHRLDKDFLRELLISRHERRISQLEELNSMPLYPTEKVVWDEHVVPTEVYSGERCLALPKLNLQFLTLHDYLLRNFNLFRLESTYEIRQDIEDAVYRLSPWKSEDGTVIFGGWARMAHPIQSFAVVEVAKPNIGEKAPSRVRADVTVTLSVRNEIKHEWESLRKHDVCFLITVRPSEGIGTKYDYKKSMVDQAGIVYIRGCEVEGMLDAGGRVIEDGPEPRPELEGDSRTFRLLLDPNQYRLDLDEASKGKEAGIVYIRGCEVEGMLDAGGRVIEDGPEPRPELEGDSRTFRLLLDPNQYRLDLDEASKGKEDVYETFNIVVRRKPKENNFKAVLETIRELMNTECVVPEWLHDIVLGYGDPGQAHYTRMPNEIPTLDFNDTFLDMEHLRNSFPGHEIKVQTDDPRKLVRPFKLTFENVLRKQRGETDMDEEEPKKVIVVEPHVLPKRGPYLYNEPKKNNILFTPTQVEAIRSGMQPGLTVVVGPPGTGKTDVAVQIISNLYHNFPSQRTLVVTHSNQALNQLFEKVAELDVDERHLLRLGHGEEALQTDKDFSRYGRVNYVLAKRLELLGQVSRLQTTLGAGGEAGGFIIIGHVIIEGSCENICIFLPRSGSSLSIQLHIRHTESHHPREKALFHITVLLESHYNFNNYPVLILISLKIKCKLISVVFVVLERSLAHCFVCFKYDNILMEESAQILEIETFIPLLLQNPQDGRSRLKRWIMIGDHHQLPPVVKNMAFQKYCNMEQSLFTRMVRLGVPYVELDAQGRARSSICNLYRWRYRNLGDLRHVCQLPEYRAANAGLRHDIQLINVDDFNGAGETEPSPYFYQNLAEAEYVVAVFMYMRLIGWPAEKISILTTYNGQKHLIRDVINKRCADNPLIGRPHKVTTVDKYQGQQNDIALISLVRTKAVGHVRDLRRLIVATSRARLGLYIFARASLFRNCFELQPTFNQLLERPLQLELIPGESYPAQRTLSAAVPEELVLRVMDMPHMARYVYDMYIQRVRDSAQDSTWSAPGSDRSARSKEADHHVAVHPGGDSDEDDATAFQPTDIVNEIEEQE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: