MonarchBase - Protein-coding gene

DPOGS208294
Transcript	DPOGS208294-TA	4887 bp
Protein	DPOGS208294-PA	1628 aa
Genomic position	DPSCF300079 + 481080-496147
RNAseq coverage	1208x (Rank: top 10%)

Annotation
*Heliconius*	HMEL008369	0.0	75.48%
*Bombyx*	BGIBMGA006461-TA	0.0	75.66%
*Drosophila*	Doa-PP	2e-165	74.30%
EBI UniRef50	UniRef50_E2BX10	0.0	52.44%	Serine/threonine-protein kinase Doa n=6 Tax=Formicidae RepID=E2BX10_HARSA
NCBI RefSeq	XP_970822.2	0.0	54.78%	PREDICTED: similar to Darkener of apricot CG33553-PG [Tribolium castaneum]
NCBI nr blastp	gi\|189241909	0.0	54.78%	PREDICTED: similar to Darkener of apricot CG33553-PG [Tribolium castaneum]
NCBI nr blastx	gi\|383862481	0.0	51.31%	PREDICTED: uncharacterized protein LOC100880767 [Megachile rotundata]

Group
Gene Ontology	GO:0016772	7.8e-82	transferase activity, transferring phosphorus-containing groups
	GO:0005524	6e-74	ATP binding
	GO:0004674	6e-74	protein serine/threonine kinase activity
	GO:0006468	6e-74	protein phosphorylation
	GO:0004672	9.4e-60	protein kinase activity
KEGG pathway
InterPro domain	[1265-1627] IPR011009	7.8e-82	Protein kinase-like domain
	[1279-1596] IPR002290	6e-74	Serine/threonine-protein kinase domain
	[1279-1596] IPR017442	9.4e-60	Serine/threonine-protein kinase-like domain
Orthology group	MCL12012		Single-copy universal gene

Nucleotide sequence:

>DPOGS208294-TA
ATGAGCGATCTAAAAGATCTCATCACCGGCGCTCACCGACATCACACCGGCGGAGGAGACATCACCGCGACGATTCATCAGCGCGCTCCCCACCCGAACAGTACGCGCCGCGGGCGGCCCGCGCGAGCCATGGCTGCCCAACCGCCGCGCCTTCCCCCTAACAACCTGCTCTTCAGCGGACCTCCTCCATCTTTACCGCGCGTGGTTTTCTTGCCAAGTGACACCGCTGCAAATAATCCCGTTATAGAAAGCGCATGCGATGATGACCTTGACCAGAAAAACGATGCGGATGTCTCCGACGAAATAAACAACGAGACAGTGCCTGTGAATGGTGAAGATCACAATCAAAAAGTTTACAAACCATCAGACCAAGAACAGTTCTATACATTAAATAATTTAAGAAGAACTCGAAGTTTTGATGTGTTAGATATTTATACTTGTAGAGATGATAGTGTCATAGAAGGAGGTGTAATTGGCTTAAAACATCGGAGGTCTGAACCGGACTTGAATAAATATGGTCTTTTTGTTGAAACTGAAATTGAATGTGAACCAATACAACCACCTCCGCTCGTTCTAAACAATCCGTTTTATGATGCTTCATATGCTTTAATTGGTGATGATGTAAACGAAAATATTGTTATGTTGCCCGAAAATTACTTGGCCTTTGAAGATTCGTTTGATCCCACATGGAATTACAAAACAAATGTTGTGGGTGATCAGGGATTATACTATGACGGTCAACCTCTCATACCACCCAATGATCCATGGTCGATATATAGCGACAATAACAATAGTTTTGAATATTATACACCCCAATTTGAAATACCTACGGAAGATGGAGTACAATATATGCGCCTCAGTGACTTAGATTACGCCATACCTCAGTATATGAGCCTTCCGTTAGTCGAAAAAAAGATTCATAGTGAACCGTGCTCAGATTGTTGTAGTCAAATGGAGAAAGAACAGGAAATAAGGAAAACTAAAGTGGATGAAGACGCAGAAAAAAATGAAAATGTTTGCAGTGAATTAGTAACAGAGAATATTCAACCTTTAACCGCTACTGTTGTAAATACATTAAGCTTAGATAAAACTGATAGTGTAGACTCTTTACCGAACAGAGAATCCTCATGCAGTGAATCCTTTAATGCGGATATATCTATTGATGTGACGTCCAGTTTAGCTTTCATGCCTAGTAGTAAAAGCTCCCGACGTTCCCAAGGAACTGACAATACTAGTGATAACACGTCACCATGTTCCACTGATTACCACGAAGCTTCGGCTCTTGACATAGCTCAAAGCTTAGATGAACTTTCATGTTCTGGCAGCACAGACTTTTCGCAGAGTCGAGAGGAAGTCTCTCCTATACCGGAGGATCAAACAACTAGTTGTAAACAACAAAGCAGAGTAAATAGTAACAATAACAACGAACCCAACAACATTGAAACAAATAAGCCACTGGCCAGTTTACCACTATGTAAACTACCTTCCATTCCATTACACGAGCAAATGCCACCAAAGCTCCCCCCTCAGAGGAATAATGTGATGTGTAATAATAAAAATGTACATAATAATTCATTTACAAATACAGACGCTAGTGTTGTCCAGTGTGAATCGACAATTCAAAGTGATAAAACAACTAAAGATAATAATGTCAAACATGCTGCAAAAACAACTGCTCCTAACGCAGTTAATGTAAACGACTCATCAAAATGTATGAGAGCGGCACCTCAACCGCCGTCTGTGCCGCCAGCGTGGTTGACAAAAAATACAACAGGTGGAAATAAACAGAAAGTTACCAAAGACGTGCCTCAAATACTTATAAATAATGTAGATGAGACCAAACACGACAAGAGTACTGCGTCCACACAAATAACAACTAAGTCGACTGATCCTGGAGACCCTCAGCCCTCATGCTCTTATGCACCGCCAGTACCTCCGCCTCCAGCCCAGCTGAAGCCCAAAGATGTAGAGGTCAAGTTCGTGTTATCCGTGGCTGGTCCCATTTCTGGTGGTCTTCTCCTAAGGTCACTTCTCCGAGCTCCGGCCGCCTTAGTTCACCTATTCGTTAAGACCCTGCTGCTTCCGGCCGGCCTTGTATTGCCGCCAGCGTTGCAACAACCGTCCCGCTCCGATGATTTACGAACGGCGATCATGCACATGTTTTCACAGATTGTTTTAAAAAACGTTCGCCACCACGTGCCGCTACGCCTGTCCTCGTTCTACGACCTGTATAAGAGATTCCTTAAGGATCACGGTTGCAAGTGGCACGATGTCGCTAAACTTTTATCTGTTCTGGCGGATTTACTGTTTGATGTGGACGGTGCATGTAGTAAGATAGCGGGCAAGTTCTTGGAGTGGGTCGCATTTTTTATTCGTTCCATGTGCAGCAGTGGCAACATGACCACCAGCCCTCGTCGTCGATACACACGAGCGTCCACGACCAGCGTTACTCAGCTGTTATCAGATGGATACTCCAACATCATGAATCGACTCACTCGAAGAGGACCCTCCGAGAAAAATGATCATATAATTGATACGAAGTTAACAGCTGCTCGTAATCGCTACGACGACAAATTACTATCGAACAATAATTCAGTATTAACAAATGTCCGACGTTACGAAAACAATAGAAAAATATCCCCATACAAACCGTTCACTTCCCCTATAACAGTGACTGCGAAAAAGTTTGGAGACGATCGCGGATACTCAAGTTACCTGAGCTCGCCCAAGACCCGGATAGACACATCACCTGTGCTATCGAATCCCAGTATGAGCGCTCTCACTCGCAGTGACTCATTTCGCAGGGCTTCCAAGAAAGATAATAAATCATCACCGTTCACCAAACGATATCCTCTCAAGGAAACTAATAATAACACATTAGAAAGTACAATTGCTTTAGGTAGTACACGCAGCCGTTTAGAGGATAAATACTCCTCGGTTTTAGACAAAATAGCTATTCAGAAGAAAGAGAGAGCTAAGAAAGAGAAAGAAGACCGTGACAAAACTTTAGAACCTGAACCGGCTTCTTTTTCTAGAGGGTTAATGAGAAGTTTTACGACCGCTGTATTCGGAGAGAATTCTTTTAAAAGAAATAATTATTCGCGAGAAAAAACAAGGGATAAGACGCCGTTCAGAAATACGACTGATCGTCGTTTACCGTCTAGTCATAAACAAAGCTCTAAAAACGAATTAAAAAATGGCTTCGATGCGTCTCTAAGAGATGGAAACCAATTTATGAAAGATAGGGATAGTATTTATAGAAAACACCACAGGAGATCACTGAAAGTAGAAAAAAGCAGTAGTGATAAGAGAAGTGGCAAGTTATCTTTAAGGCCGATTGATATCAGCTTACAATCTGGTACAAGAGATTTAATCTCACCCATACAACCAGAAATCAAATATAAGCCGACAAAAACGCCTGCTTCTTCCCCGGTCTGCGAAGGCCGGCAAAAACAAATATACTTCCCTTCGAGTGACGAGGACGACGATAAGACTCCGGTGGGCGACCGCGCTCTCACGGAACGAGAGACGCGAAGGAAAGAAATACAGGGACTGATCATGAAATATGCACATCTGGATGAGGTATACGCTCGGATTACTGAAAAGGAACCCAACGGAGTCACCAAAGACTTAGTGCCGAGGAAATTGGAGCCTATCGGAGTCGGCGATGTGGTAGCGTTGCCACCAGAGCTAAGGAGTCGCCATCGACCACAACGGCCGCGACACCTCATGAGGCACGCGGCCACGCCGCCTAGCTCCCGGGCACGCTCCTCCGTCAAGGACGACAAGGACGGACATCTGGTGTACTGGCCCGGATATGTCATGGGAGCGAGATACAAAATCATCGAGACGCTCGGTGAGGGAACCTTCGGGAAGGTGGTCGAAGTGAAGGATCTCGAAATGGAGCACAGAATGGCTCTGAAGATAATAAAAAATGTGGAGAAATACAGAGAGGCTGCGAAATTAGAAATAAACGTATTAGAAAAATTAGCTGACATTGACCCCGATTGTAAGAATCTGTGCGTGAAGATGCTAGACTGGTTTGAATATCACGGACACATGTGTATCGCGTTTGAAATGCTCGGACAAAGTGTATTTGACTTCCTGAAAGACAACAACTACCAGCCATATCCCCTGGAGCAGGTGCGACACATCTCCTACCAGCTGATACACAGCGTGCTGTTCCTACACGACAACAAACTCACACACACCGACCTCAAGCCCGAGAACATACTGTTCGTGGACAGCGACTACGAGGTCGTCAGTGTGTACAACACCTCCAAGAAGAAGCACGACCTCCGTCGCGTGAAGCGCAGTGACGTCCGCCTGATAGACTTCGGCAGCGCGACCTTTGACCACGAACATCACTCGACAATAGTCTCCACGAGACATTACAGGGCACCAGAGGTCATACTCGAGCTGGGTTGGTCTCAGCCGTGTGACGTGTGGTCCATCGGCTGCATCATGTTCGAGCTGCACCTGGGCATCACACTGTTCCAGACACACGACAACAGAGAACACCTCGCCATGATGGAGAGGATACTAGGACCGATACCATACAGAATGGCAAGAAAAACAAGGACGAAATATTTCTATCATGGCAAATTAGACTGGGATGAAAAGTCATCGGCGGGGAGATACGTTAGAGAGAATTGTAAACCGTTATTAAGGTATCTCCAGACTAACAGCGAGGAGCTCCGTCAGCTGTTCGAGCTGATCGGCCGCATGTTGGAGTACGAGCCCTCACAGAGGATCACGCTCAGGGAGGCGCTGCAGCATCCCTTCTTCAGCAAACTACCGCACAACCAGAGACTAGGCAATGACCGCGCGCGCTGCAACGGCGAGAGCTCGGCGTCCCGCGAGCGATCTCACTCACTGAGCCGGTGA

Protein sequence:

>DPOGS208294-PA
MSDLKDLITGAHRHHTGGGDITATIHQRAPHPNSTRRGRPARAMAAQPPRLPPNNLLFSGPPPSLPRVVFLPSDTAANNPVIESACDDDLDQKNDADVSDEINNETVPVNGEDHNQKVYKPSDQEQFYTLNNLRRTRSFDVLDIYTCRDDSVIEGGVIGLKHRRSEPDLNKYGLFVETEIECEPIQPPPLVLNNPFYDASYALIGDDVNENIVMLPENYLAFEDSFDPTWNYKTNVVGDQGLYYDGQPLIPPNDPWSIYSDNNNSFEYYTPQFEIPTEDGVQYMRLSDLDYAIPQYMSLPLVEKKIHSEPCSDCCSQMEKEQEIRKTKVDEDAEKNENVCSELVTENIQPLTATVVNTLSLDKTDSVDSLPNRESSCSESFNADISIDVTSSLAFMPSSKSSRRSQGTDNTSDNTSPCSTDYHEASALDIAQSLDELSCSGSTDFSQSREEVSPIPEDQTTSCKQQSRVNSNNNNEPNNIETNKPLASLPLCKLPSIPLHEQMPPKLPPQRNNVMCNNKNVHNNSFTNTDASVVQCESTIQSDKTTKDNNVKHAAKTTAPNAVNVNDSSKCMRAAPQPPSVPPAWLTKNTTGGNKQKVTKDVPQILINNVDETKHDKSTASTQITTKSTDPGDPQPSCSYAPPVPPPPAQLKPKDVEVKFVLSVAGPISGGLLLRSLLRAPAALVHLFVKTLLLPAGLVLPPALQQPSRSDDLRTAIMHMFSQIVLKNVRHHVPLRLSSFYDLYKRFLKDHGCKWHDVAKLLSVLADLLFDVDGACSKIAGKFLEWVAFFIRSMCSSGNMTTSPRRRYTRASTTSVTQLLSDGYSNIMNRLTRRGPSEKNDHIIDTKLTAARNRYDDKLLSNNNSVLTNVRRYENNRKISPYKPFTSPITVTAKKFGDDRGYSSYLSSPKTRIDTSPVLSNPSMSALTRSDSFRRASKKDNKSSPFTKRYPLKETNNNTLESTIALGSTRSRLEDKYSSVLDKIAIQKKERAKKEKEDRDKTLEPEPASFSRGLMRSFTTAVFGENSFKRNNYSREKTRDKTPFRNTTDRRLPSSHKQSSKNELKNGFDASLRDGNQFMKDRDSIYRKHHRRSLKVEKSSSDKRSGKLSLRPIDISLQSGTRDLISPIQPEIKYKPTKTPASSPVCEGRQKQIYFPSSDEDDDKTPVGDRALTERETRRKEIQGLIMKYAHLDEVYARITEKEPNGVTKDLVPRKLEPIGVGDVVALPPELRSRHRPQRPRHLMRHAATPPSSRARSSVKDDKDGHLVYWPGYVMGARYKIIETLGEGTFGKVVEVKDLEMEHRMALKIIKNVEKYREAAKLEINVLEKLADIDPDCKNLCVKMLDWFEYHGHMCIAFEMLGQSVFDFLKDNNYQPYPLEQVRHISYQLIHSVLFLHDNKLTHTDLKPENILFVDSDYEVVSVYNTSKKKHDLRRVKRSDVRLIDFGSATFDHEHHSTIVSTRHYRAPEVILELGWSQPCDVWSIGCIMFELHLGITLFQTHDNREHLAMMERILGPIPYRMARKTRTKYFYHGKLDWDEKSSAGRYVRENCKPLLRYLQTNSEELRQLFELIGRMLEYEPSQRITLREALQHPFFSKLPHNQRLGNDRARCNGESSASRERSHSLSR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: