MonarchBase - Protein-coding gene

DPOGS201500
Transcript	DPOGS201500-TA	3429 bp
Protein	DPOGS201500-PA	1142 aa
Genomic position	DPSCF300006 + 886850-897326
RNAseq coverage	236x (Rank: top 43%)

Annotation
*Heliconius*	HMEL015504	0.0	66.90%
*Bombyx*	BGIBMGA002591-TA	0.0	64.01%
*Drosophila*	Pask-PA	8e-72	50.38%
EBI UniRef50	UniRef50_E3X9T6	2e-148	36.28%	Putative uncharacterized protein n=4 Tax=Pancrustacea RepID=E3X9T6_ANODA
NCBI RefSeq	XP_001865012.1	2e-147	37.55%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|312373602	8e-148	36.28%	hypothetical protein AND_17229 [Anopheles darlingi]
NCBI nr blastx	gi\|312373602	3e-145	36.55%	hypothetical protein AND_17229 [Anopheles darlingi]

Group
Gene Ontology	GO:0016772	2.7e-51	transferase activity, transferring phosphorus-containing groups
	GO:0005524	1.9e-37	ATP binding
	GO:0004672	1.9e-37	protein kinase activity
	GO:0006468	1.9e-37	protein phosphorylation
	GO:0004674	2.2e-33	protein serine/threonine kinase activity
	GO:0004713	1.3e-05	protein tyrosine kinase activity
KEGG pathway
InterPro domain	[806-1005] IPR011009	2.7e-51	Protein kinase-like domain
	[820-974] IPR017442	1.9e-37	Serine/threonine-protein kinase-like domain
	[820-1003] IPR002290	2.2e-33	Serine/threonine-protein kinase domain
Orthology group	MCL17481		Patchy

Nucleotide sequence:

>DPOGS201500-TA
ATGGAATCTGCTAGAGTACTGAACTTAAATAGAATCGCTGCTACAGATTCATTGGGTTTTACACCCATAAAACCGAGACTACGAAGATTTGTGGATGTTTATTCTCCAGAACATCTGAATTTGACGCCTAAGCCTAAACAGAAGCTTGATTTGGTATCCAATGTTGGTAAATTGTATTCAACGCCCGATAAACCCTTAAGCATTGATAAAGAATGCAGGACAGTCAAAGCTCATCCAAATGTTTGCAATGCCTGGGGGAATTGTTCTTTTGAAGGAAATCAAAGCTTTCCAAGATTAAGTAGAAAACTAAGGCCTTTAAGAATGGATCTTGAGACTCCAACGAAAGCAAAGCCAGCTGTTGATTTAGTTAGAGTTGATGGGCCAAATGGATTGCGTTTCAATAGCTCCTTGGCAACTGGAGATGCAGCATCCACACCTACGCAGATGGACAGATTACAGCAATCTATCAACCATAGTAAAGCAGTCTTCACCATTGAACCAAACACTTCAAAGATTCTCATTGTGAACAACAAGGCTTGCTCTCTACTGGGTTACTCTTCCGGGGAATTATGTGACCTAAGATTCTCAGATCTTCTGAGGAAGAGGAATAGCAAGGCTTTTAGCATTCATGAGGCAGAAGATGGTGATATCTCAGAAGATGGTACAATGATTTTGTTAAGTGGCAAGGTTGTAGAATTGCTGACGAAGGACGGCAGTTCAGTTCAAGTGTCTCTCTGGATACGACAATTAGACAGTGATGGTCCCTGTCTGGTGGTTGCTGAGCCTATAATCTGTAAAAATGTTGTGCTGACTATAGACGGCGATGGTATAATAACATCCTGTGAGGGAGAAGATGGAGCTTTGTTGTTCCAAGCTGAATCATCGGACAAGCTGATAGGCCTCCCGGTCTCATCTTTGATACCTTCCATACATCTTCCACACGACGTTCCCATGTCTAAGAGTGTTTCAAAGCAGAAGGCCACAGGTAGGACCCTTGACGGTGGCTCATTCCCACTGTGTCTTTGGATATCAAAGGCCCATGTGGAAAACACGTGGTCGTCGTTGAAGACTAAAGACAAACCTGCTAATAAAGAGAAGCCTGTATTTATAGTGAATGTCAGGATAACATATAACGTAAGCGGACTTCTTGTTGTCGACGAAAGCGGAGTGATAACAGCATGCAACCAACACTTTGCCATGTTGACCTTCGGCAAAGCACAGTCAGAGGTGATAGGTCATCAAATAGAAGATGTCATACAGAACTTCTGTCGGGAATCCGATCTGGTGAAGATTCAAGATAGAAATAGAAATATGACTCTATCACCTGTCAACAATGATAACAATGATTCGGCTTCAGAAACCGGCGAGGACTCGTGTGGAGCGTTCAACGGAAGTCAGAAATCTGCATGCACATCCCTAAATGTACAACAGTCGATGTTATCCACAACTAGAGAGAAATCCTCTAGCGCGCTGTGCCTCGACAAATCATACAGCATGGTGACACACACACCGACGCCCACACAGGATATGGTGTCAAGCATAAGCACGACGGAGCAGAGGAATGATATATCAGCCCTCCCAGACGTCACTTCCGGCATGTCAGGAATTTCCATAGACGATGAAAACTACTGCCAAAGCAGCATATCCAAGTCGAGGTCCGAAAACATCCTTCGATCTGAACAGGCTATTATAAAGCAGTCGCCCAAAGTCAACGAGAAATCTGACTCGATTTATTACACGTCCCAACACTCCCAGGAGGTCACGCCGACGGGAAACTCATCCAGAACTAGATTAAATGACACGTCACTAAGACTATCGTTCGACTTCACCAAATGTAAAACGATCAAAGTCAAAGAGGACAAAAGCAGTGCGTCCCTAGATTTTTGTGACTCCAACGAGACGAGCGCTGATTTCTTGACCCCCATCAACGAAATGCCGCCACCGGGCTGTGAAATTGAGGATTTACCGAAACATAACGGAAATGACGAGAGCATGGACAGTTTAAGCAATGACAATGATCTGGAAACACAGACGGAATCCGCACCCAGGAGGAAGTTTGACGACGAGCCAGAGACTCCTTGTATGACGAAGCGCCTGGTCCGCGCCCACGTGACTTCGACACCGGCACAATCACGCCGCGACCTGGACGACTGGCGCCGCGCCGACGGCACATACAGCGGCATTGTGCGGCACAAGGACGGCACTGAGCTCAACGTAGTGTACACGGTGTCCAGTATGCAGCTGTCATCTCGTCGTATCGTGAGGTGTGTGTGGCTCGGAGTGAGGGCGCACGAGCCGCGACATACAACACTCGCCTCCAGTCTCGCCTCCACGCTGGCGTCAACTGCTGATAACTCACTGGTCGCGGGTAACAAGTCAGCGAGCAGCAGACATCAATCCGTGTCTCTGATGAGCCAGTGTGGCGAAGAACAAATTGCGGGGGAGTACACCAAGCATTACGTCACTCTTAAACAAATAGGTAAAGGAGCTTATGGGTGTGTCAAAATGGCGTACCGAAGATCAGATAGATTACTAGCTGTTGCAAAATTCATTTTAAAGGAAAAGGTTGGAGCTGCATTCTGGAGCGACGCTCCTGACGGGAGGAGGGTGCCGCTAGAACTAAGCCTGTTGATGACCCTCTCTCATCCTAATATAGTGTCCGTCATTGATGTGTTCGAAAACGACAAATACTTCCAGATGGTAATGGAAAAGCATGGAGCCGGTATGGACCTGTTTGAGTTTATAGAACGGCGACCGAGGATGGATGAACCGCTCGTCAGTTATATATTCAGACAGATAGGCCAGGCGGTGGAGTATCTTCATTCCCTTAACATCCTCCATCGTGACATCAAGGACGAAAACGTCATAATTGACAACAAGTTTCACGTGAAACTCATCGACTTCGGCTCAGCCACGTTCATGAACCTGGAACAGCTGTTACGTCGCATGCTCTGCAAGGAGCCAGGAGCCCGCTGCACAGTGCCACAGCTGATGGCACACCCCTGGATTCGACAACCTGTAAATCTCGCCTCATACAACTTCCAGGAGATCGTGGATTGTGATCGTCATGAAGCAAATCCCGAGATGTACTTCAGCGGCAGTCTAGAATCTCCGAGAAGTAACTCTCCCGTATCCTTAGCCGATCCTCTCGCTAAAGAGCGGTCGATGCGTTCGGAGGCGGAAGCGGCAGGAAGGTCGGAGAAGGTGTCTAAATCAGACGCGCGCCGTCCAGCACACCAGCTGTCCGACAACTACAGCCTGCGATCGTCCGCTGACATACTAGATATATCTTCGAAGCCGGTGTCGGAAGCGGCATTGACGGATATAAGTTCAGACGCGACCGGCCACGCGGCCTGCGACATCGACTACGACTGTGACCAGTACGAGTGCGACAGCTGGGATGAGTGCGAGCAGGACAGCTTCTCATAG

Protein sequence:

>DPOGS201500-PA
MESARVLNLNRIAATDSLGFTPIKPRLRRFVDVYSPEHLNLTPKPKQKLDLVSNVGKLYSTPDKPLSIDKECRTVKAHPNVCNAWGNCSFEGNQSFPRLSRKLRPLRMDLETPTKAKPAVDLVRVDGPNGLRFNSSLATGDAASTPTQMDRLQQSINHSKAVFTIEPNTSKILIVNNKACSLLGYSSGELCDLRFSDLLRKRNSKAFSIHEAEDGDISEDGTMILLSGKVVELLTKDGSSVQVSLWIRQLDSDGPCLVVAEPIICKNVVLTIDGDGIITSCEGEDGALLFQAESSDKLIGLPVSSLIPSIHLPHDVPMSKSVSKQKATGRTLDGGSFPLCLWISKAHVENTWSSLKTKDKPANKEKPVFIVNVRITYNVSGLLVVDESGVITACNQHFAMLTFGKAQSEVIGHQIEDVIQNFCRESDLVKIQDRNRNMTLSPVNNDNNDSASETGEDSCGAFNGSQKSACTSLNVQQSMLSTTREKSSSALCLDKSYSMVTHTPTPTQDMVSSISTTEQRNDISALPDVTSGMSGISIDDENYCQSSISKSRSENILRSEQAIIKQSPKVNEKSDSIYYTSQHSQEVTPTGNSSRTRLNDTSLRLSFDFTKCKTIKVKEDKSSASLDFCDSNETSADFLTPINEMPPPGCEIEDLPKHNGNDESMDSLSNDNDLETQTESAPRRKFDDEPETPCMTKRLVRAHVTSTPAQSRRDLDDWRRADGTYSGIVRHKDGTELNVVYTVSSMQLSSRRIVRCVWLGVRAHEPRHTTLASSLASTLASTADNSLVAGNKSASSRHQSVSLMSQCGEEQIAGEYTKHYVTLKQIGKGAYGCVKMAYRRSDRLLAVAKFILKEKVGAAFWSDAPDGRRVPLELSLLMTLSHPNIVSVIDVFENDKYFQMVMEKHGAGMDLFEFIERRPRMDEPLVSYIFRQIGQAVEYLHSLNILHRDIKDENVIIDNKFHVKLIDFGSATFMNLEQLLRRMLCKEPGARCTVPQLMAHPWIRQPVNLASYNFQEIVDCDRHEANPEMYFSGSLESPRSNSPVSLADPLAKERSMRSEAEAAGRSEKVSKSDARRPAHQLSDNYSLRSSADILDISSKPVSEAALTDISSDATGHAACDIDYDCDQYECDSWDECEQDSFS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: