MonarchBase - Protein-coding gene

DPOGS210111
Transcript	DPOGS210111-TA	2838 bp
Protein	DPOGS210111-PA	945 aa
Genomic position	DPSCF300017 + 1278571-1285766
RNAseq coverage	336x (Rank: top 34%)

Annotation
*Heliconius*	HMEL005061	70.51%
*Bombyx*	BGIBMGA000220-TA	71.59%
*Drosophila*	CG31121-PB	41.52%
EBI UniRef50	UniRef50_D6X0C6	51.84%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X0C6_TRICA
NCBI RefSeq	XP_968472.1	51.84%	PREDICTED: similar to GA16025-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91091096	51.84%	PREDICTED: similar to GA16025-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91091096	52.58%	PREDICTED: similar to GA16025-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	9e-09	membrane
	GO:0005524	2e-05	ATP binding
	GO:0016887	2e-05	ATPase activity
KEGG pathway	cfa:474571	9e-45
	K05684 (ABCG8)	maps->	ABC transporters
InterPro domain	[702-833] IPR013525	9e-09	ABC-2 type transporter
Orthology group	MCL15682		Insect specific

Nucleotide sequence:

>DPOGS210111-TA
ATGATGCAGGATCCAAGGGGAATGCATTCAGAAGATCTACACGCCTGGTCCATATACAGGCAAAACTTAAACTCCGATTTCACTGACAGTGCCTTAGGCAGTACCGATAAAAGTCCTCTACCGTACGGAAATTTCCAACTTCGCGATACTACAGTACAGTCTATCCTTTCACATCCCAGATATGGACCTAAGTCGGCTCTTGGATCTAATATGTATACATATCTTAAGTTCGGATTGCCACGTGTTTTTCCACCGAATCACAATGGATCACAACGATCAGGGACACCGAAGCCCAAAACATCGATTGGAAGCGGAATGAAATCCGTTCCAAGAATTCAAAGACAACCTCGTGGTGCCAGAGAAAACTCCTCCGGATACGATAGCTCTGATAACGAGACGTCAACCAATTATAAATACAGTCGCAAGTATCGATCGGACCCCGATTTTAGAATGCAAAACCTACATCCATCTTATCAGCATGCGACTGGAGTTCCCCTAGTGGCGATGCAGCAAGCAGGAATACGTGGCGAGTCTCATTGGACCAGCACAAGAAACAAGTCAGTGAGTGAGGCCAACCTGCTGGGGATAGACTCGAGACCCACTCGGTCCTACGGCCATCGGAGAAGTAGTGTCGTGGATTACGTGCCCGACAATGACCACCAAAGTTATCTCATGCCGTCCTCTCACCTCGGAGGTCGAATGTCCAAAGCAGGGAGTCATATGTCCTTAGCTCACTCCAGGAAACATTCAACTCTCCGACCTGGTGATCATTTAGATGGATACACGCATTCTGCATACATCTATCCTAATTACTACGTAAATAACTTAGAAATAACGTCGCCGGAAAATAAATCGACGCTGCTTGTGTCGGGGCTCAGTTTCGAAGTGAAATCTGGCGAAATATTAGCAGTGCTGGCGACATCACACCAGGAAGCGACTGGCTTACTGGACGTACTGGCTGGAGTCAGGAAAAAGCTGTCGGGCGATATAATCCTGAACGGTCAGCCGGTGGCGTCGTCGACTCTCCGTAAGGTGAGCGCGTACGTTCGCTGCGACACGTGTCTGTGCGGGGCCATGTCCGTGGAACACACGCTGAGGTTCCACGCCACGCTACGAGCTCCCCGACACCGACACGCCAAGATGGACGACAGGGAGCGGATAAACCTACTTATCGAGGAGTTAGGTCTGGAACAAGTAAGAGACACTAACGTAGAGCGACTGACTCGTTCCGAGATCAGGCGGTTGAATGTGGCGTGTCAGCTGCTGTTAGACACGGCGGTCCTCATACTCGACCAGCCCACCAAGGAGATGGACATCTTCGACACTTTCTTCCTGGTGGAGTACTTGAGGAACTGGGCGAGCACCGGACGTGTCGTCATAATGTCTCTACATCCACCCACTTACGAAATATTTGCTATGTTAACTAAGGTGGTGCTCATCTCCGCGGGTCGGACGATGTTCAGCGGCTATAGAAGGGATATGTTGCCATATTTCGCCTCCATAGATTATCCGTGTCCCGCCTATAAGAACCCTTCTGATTACTATCTGGACCTGGTGACCCTGGACGACCTGTCGGCGGCGGCCATGTTGGAGTCGTCAGGTCGTATCGAGTCGCTGGCCGGAGTGTTCTTGGGCGCGCACTCCGCCCCCGAGCCCCCGCCCCCCGTCCCCCTGCCGGCTCCTGTCCGCCGAGCCAACGTCCTCGTCCAGGTGTTCGCTATGCTGGAAAAATCGTTGCTGTACACTCAAATGACGACGTTGTCAAACGTAATTACAAGAATTCTTATAGCAGCCATCATGTCGATCGTCACGGGCGCCGTGTTCTGGGACCTGCCCTCCACCGACCCCAAGTTAACGCTCAACGACCGCGTGGGGTTCCACTACTCGGTGATGTGTGTGTCGCTGTTCCCGTGCCTGGTGTGGTCGTGTCGCGAGGCGGCCGCGGCCCGGCCTCACGTGGAGAGAGACATCGCCGTGGGGCTTTACTCACGGACGCTGTTCATACTGTTCGATTTAACGCTCAACGACCGCGTGGGGTTCCACTACTCGGTGATGTGTGTGTCGCTGTTCCCGTGCCTGGTGTGGTCGTGTCGCGAGGCGGCCGCGGCCCGGCCTCACGTGGAGAGAGACATCGCCGTGGGTCTTTACTCACGGACGCTGTTCATACTGTTCGATCAATTCATGGAGTTGTGGTCGGCTACGTTGACGTGGTTGGCGTATTTAGTCCCGAGTTACGCTATGAGCGGTCTGTACGCGCAGACCGCGGGCTCCTTCGACGGGTTCTACATTTATTTAGGTTATATGTTGTTGTACCTAATAAGTACTCAGATGTTGTGTCGCGCGGCGGTGTTTGTCGTGCCGAAGGAGAAGTCTTCCGCCGCGTTGGCTTGTTTCTGTTTGTTCCTAACAACTCTCGTGAACGGCGTGACGCTGCACCAGCTCGACTTACCCTTTTACGTCAAATGGTTGGAATACGTGTCGCCTTCGAAATGGACAATACCGGAGATATTGAGGCGGGAACTGAGTGACGTCGCGCTGAGATCTAGTATAAGCAAGGATTTGAGATGTACAAATAAACAGCGACAGCATCTGGAGATCATAGTCCAGTCGTCGTGTCCGCTGCCCAATGGCACCCAGGTGCTATCGAACTTTGACTTCCTCCGCTCAGATCACATCTGGGAGTGGACCGAGGACAGTTTCCTCGTGGCTCTGTCTATTTTCTATGCGGTTTTCGCTCTAGTCGCCATATTTGCGTTTGTTTTCGATTGTACCGACTACGTCAGGAGTAAGGAACGAGCGTCGCGGAAAGGTTACAAAGTGACCGCCAACACGCCCTAG

Protein sequence:

>DPOGS210111-PA
MMQDPRGMHSEDLHAWSIYRQNLNSDFTDSALGSTDKSPLPYGNFQLRDTTVQSILSHPRYGPKSALGSNMYTYLKFGLPRVFPPNHNGSQRSGTPKPKTSIGSGMKSVPRIQRQPRGARENSSGYDSSDNETSTNYKYSRKYRSDPDFRMQNLHPSYQHATGVPLVAMQQAGIRGESHWTSTRNKSVSEANLLGIDSRPTRSYGHRRSSVVDYVPDNDHQSYLMPSSHLGGRMSKAGSHMSLAHSRKHSTLRPGDHLDGYTHSAYIYPNYYVNNLEITSPENKSTLLVSGLSFEVKSGEILAVLATSHQEATGLLDVLAGVRKKLSGDIILNGQPVASSTLRKVSAYVRCDTCLCGAMSVEHTLRFHATLRAPRHRHAKMDDRERINLLIEELGLEQVRDTNVERLTRSEIRRLNVACQLLLDTAVLILDQPTKEMDIFDTFFLVEYLRNWASTGRVVIMSLHPPTYEIFAMLTKVVLISAGRTMFSGYRRDMLPYFASIDYPCPAYKNPSDYYLDLVTLDDLSAAAMLESSGRIESLAGVFLGAHSAPEPPPPVPLPAPVRRANVLVQVFAMLEKSLLYTQMTTLSNVITRILIAAIMSIVTGAVFWDLPSTDPKLTLNDRVGFHYSVMCVSLFPCLVWSCREAAAARPHVERDIAVGLYSRTLFILFDLTLNDRVGFHYSVMCVSLFPCLVWSCREAAAARPHVERDIAVGLYSRTLFILFDQFMELWSATLTWLAYLVPSYAMSGLYAQTAGSFDGFYIYLGYMLLYLISTQMLCRAAVFVVPKEKSSAALACFCLFLTTLVNGVTLHQLDLPFYVKWLEYVSPSKWTIPEILRRELSDVALRSSISKDLRCTNKQRQHLEIIVQSSCPLPNGTQVLSNFDFLRSDHIWEWTEDSFLVALSIFYAVFALVAIFAFVFDCTDYVRSKERASRKGYKVTANTP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: