MonarchBase - Protein-coding gene

DPOGS210338
Transcript	DPOGS210338-TA	4410 bp
Protein	DPOGS210338-PA	1469 aa
Genomic position	DPSCF300025 - 390268-400714
RNAseq coverage	428x (Rank: top 29%)

Annotation
*Heliconius*	HMEL007255	0.0	73.16%
*Bombyx*	BGIBMGA011979-TA	0.0	68.50%
*Drosophila*	Smg1-PA	5e-11	22.33%
EBI UniRef50	UniRef50_E2C545	0.0	35.36%	Serine/threonine-protein kinase SMG1 n=3 Tax=Formicidae RepID=E2C545_HARSA
NCBI RefSeq	XP_001122895.1	1e-180	34.93%	PREDICTED: similar to PI-3-kinase-related kinase SMG-1 [Apis mellifera]
NCBI nr blastp	gi\|307194694	0.0	35.36%	Serine/threonine-protein kinase SMG1 [Harpegnathos saltator]
NCBI nr blastx	gi\|307194694	0.0	35.25%	Serine/threonine-protein kinase SMG1 [Harpegnathos saltator]

Group
Gene Ontology	GO:0016772	2.5e-06	transferase activity, transferring phosphorus-containing groups
	GO:0016773	3e-05	phosphotransferase activity, alcohol group as acceptor
KEGG pathway
InterPro domain	[126-173] IPR011009	2.5e-06	Protein kinase-like domain
Orthology group	MCL18911		Insect specific

Nucleotide sequence:

>DPOGS210338-TA
ATGGAACTTCACTTGCATCTGACTGCTGTTTCTCGTGCTTTGGACTACAAATGGGGAACACCTGTGGACCTGGAAACTTCCCAGGACATGAGGACGTGTTCTCCGGCCGTCATAGATTTACCAACGACCACGTTCTCCTCCGAAGAATATTTAAGGAGCATAAGAAGGAAAACATCTGAATGTGCACCAAGAAAACCGAACCTCCTAAGAAAGGACACGTTCGCTAATATTTCAAGTTCGAGATTATCCTGTGAAGAAATTATCTGTGACGTTTTGGATCAAACCATTTACTTCTCGGACGACACTGTAGATTCAAAGTATGATTTAGATAGCTCTGGATTTATCGACAATTACACTAAAAATAATCTTCGGAACAAAGACATCGAATACTTTATGAAAGAAAAAACTAAGGGTATATTCCGCCTGGCGTGTGAGCACGTAGTCCGCACCATGCGTCGCGGCCGGGAGACCCTCCTCACACTGCTGGAGGCGTTCGTGTACGACCCTCTGGTGGAGTGGGGTGGTGGGCGTCGTAAGCGCGGAGCCCGCCACGTGCGGGCAGCCAAGGCCATGCTTGCGGTTCGCGTGAGGGAATTGAAACACTCCGCCACCGATATCACAAATCAGCTGTTGGCCGCACTACCTGAAGTAAAGCACTGTGCGGATAAGTGGTTAGAAGAAAACGAACAGTTACATACTGTGGAGGAAAAACTTGACATGTGTCATAAACAGATGGCCCTCATCAAAGAGGTCGAGGCGTGCGGCAGCAACCTCAGCGACCATCCTCTGTATGCCATCTCACAGAAATATACGTCACATAAACAGGCCAAAAACGCGGTCGAGGACTCGATGAAAGCTCTCGTAAAAATCCTCAACGACTTCGATACTCAGATAGAAAGTTTTGCAAACACTAATGACATATTGAACGGGCCGCAGTTGATGACCTGGGTGCAAGAGTTCTCGGGGCCTCATTACGACGACGAGAAACCCATATTCGAACCCATAAAAGAGTTTTTAACCAACGCCGGAAAAGGTTCCATGATATCACAATTCGAACAGGCGGAAGTAGAGTTGAACCAGACCATGCAGCAGACAAACCTACTGGTGAGGTCCTGCCTCGAGCTGTTGACACAGTACGTGGCCGTCTCTCAGTACTATCCACAGAGTCGGACGGAATACCACCGCTTAGTGATGTTCCGCAAGTACCTGGCGACAGCTTTAGAAAGTAAATCCCCGGAGGTCTGTCGGGAGGTGGCCGGCCAAGTCACGGCTCTGGTGGAGTCGGACAACGTCACCGGTGACTCGCAGCAAATTATCGCTTACAACTATCGTTTACACCAAGTCAACGCGGAGGCGAACGCGTACCTCAACAAATGCCACGAAAGATTGCAACTAGAGGGCGGGCCCGACGCCATCGCTCTGGCACAAGACAGCTACATGGAAGCGAAAAATAATATAAACAACTGGCTGCGAACGGAAGAGGGCGCCGGAGCGGCTCTGGAGAACGCCGCTATCGGGATGCTGTGTAATTTGAACAGGAGATATCTAATGTTGGAGAACGGCGCACAGAGCGCAGGAGACTGCCTACTCGACCTAACGTCCAGGGACGGGGAATGGTTCCTGGACGACATGAACTCGCTGTCGATGCAGGCCATCGAGTTGCTGACTCTGCTGCCCTTGCCTTCGACCACGGCGGACGACGCCGCCCTGTCAGTGGCCGTGGAATGTGTCAAGAATGCTAATCTTCTAATAGCTGACTTGGTTCAACTGAACTACAACTTTAGTACAATCATTTTACCAGAGGCCGTTAAGAAAGTGCACTCCGAGGATCCCTCGACCTTGCACATGATAAACGAACTGAACGCGCTCATCACCAACACGCCCGTGACCCTCAACGACCTGCTCACACAACTCGAAATGCACTTCCGCTATCTGGTGATGGACATGGAGTCCCCAGCTGCCGGTGCACAAATACTAGCGGCCGAGCTCCGTAGTCGCTACGAGGAGCTCTTGTCTCCGTCGGAGGGCGAGGCCCCGGGACAAACCCCAGGCCGCATGTTGCTGATGGGGTTCAGCGGACTGTTCGCGGCCGTGGAGCTCCGAGCGAGGGAGCTGGCCGACCACCTCGCCGCCCCGCTGCAGCCCGCCTGGAGGAAGATCGACCAGATCAATGACGCCATGCACATGTCGGCTGCCATGCAGAATCCCGCGCTGCGCTCCGTGCTGGAGGATATCTTCACGGTGCGGCGCGTGCAGACCGTGGCGGAGGTGTTCTCTCTGTGCCTGCAGCTCGCCCGCGCCTTCCGCGGCTCTCCCCCGCCCGCCGCGCCTCCTCCGCCCCCCGCCGCCTCACAGCCCCTCCTGGACGACGCCGCGCTGTGTAAACCAGTCAGACGTTTTACGGCGGAGTACGTGTCCCGCTGTTTCCTGGGCGTCCACTCCCTGTCTCTGGGCCGCGCGCTGTGCCTCCTGCTGCGGCGGGCGCGGCTCGATCTGCGCGCCGAGGTCGAGCAGAAGGAGATCGGCGCCTCCTGGAGCGTGTCCCTGGAGTCTCTGGTGGAGAAGGCCTGCGGGTCCGTGTCGAGTCGCGCGGGGTCCCTCGCCGGAGCCTTGCAGGCGTCCCGGGCCCGCACGCTCCGCGCCGCCGCCGCCGTGCGCGCCCTGGACCGTGCCCGCGCCTCGGCTCGCGCCGCCCGTCTGCGCGCCGCCGCCCACGCCAGTCTACACGCTGAAATCGTGTCCGGAGCCCCCGAACCAGGCCCGGCGTTGTTCCGCGCGGCCCGGGACCTCACCGCCGCCCGGGGACGACTAACTGACGCCTTGGAGAAGGCACAGGCTCTCCTCACACCCGCACATCAGAGTAAAGTGGGGCGCGGGGCGAACCCCGACCTGCTGGGGGCGGTGGTGGCGCTAGAGTCGGGCTGGGCGGCGCGGGCCGGGAGGGCGCATGCTCTGTGTCGCGCAGGGGCCGTGCTGGCGCCACACGCGCGCTCCGCCTCCGCCCTGGCCGCGGCCAGGCCCGCGAGACACGCCAGGGCCCTGCGACACGCCCGCACGCTCAGGACCGCGCTCGCGCACTGGGAGAAGGCGTGTACGCTCGCTCAGAAGTACTCGCTGCACGTGTCGCCCGTCGAGGAGTCGCTCATGGAGATGCTGCACCCCGAAGGAAACATCGACACACACTGGGTGGGAGACGTGTCGGCGCTGGTCCAGGATACGCTAGGATCCCGGGCGTCGGCCGCCAGCTCAGCGCGTGCCCGCCTGAGCGTCGCCAGCGACGCCCTCAGCGCCGCCGCCGCCCGCCTCAGGGACGCAGCCGCCGCCCGGGAACATCTGCTGCACGACCTGGCCGGGCCGCTGCACGCGCTCGCCCCCTACAACGAGGACATAAAACGGAGACAGCAATCGAGGAAAGTTGGTATTTTGAATAAACACGAGCAGCGGGGCCTGTGGTCAGCATTTAGTTTTGGTGACAATCCGTCCCAGGAGTTCCTGTCTCTGTGGCGCGCGGTGTCCGAGCGCCTGGCGGCAGTCTGCGGCCTCCTAGACCTTGACCTGGACCTGGAGCGCGTCGCTCGGACAGCTGCAGAAACACACGCACTGCTCACAGACCTGCCGCTGCTGCTGGATATGATGCTCCAATTGCCCGGAAACACGGACACGAGCCGGCGACTCACGCGGCAGGCGGCCGTCGGCAGACCGCCCGCCAGGCACGGTCACGAGCAGCGGAGTGCGACCGGCGCCGGCGTGTGGCGGCGCGTCAGACTCAAACTGGAGAAACGAATGACGCCGCAGGAACAGGTACTCGCGCACTCCACAGGAGATGTGTACCCTTGTGGAGTACATTATATCGGAAGCGACCAGCGCGGACAACCTCTGCCTCATGTACGAGGGCTGGATGGCGTGGGTGTGAGTCCCGGGCGGTGCTCCGCCCTTCGCCGTGTGCGGACGGGCGCTCCCGTGCCGTTCGGCCCGCGGGCGCCCTCCCGAGAGCCCCACGAGCCGGACCGAAGCCCCCGGGCTCGGCCCCGACGACGACGTCAGCTACGGAAGACACCCCGCACGGGGAACTCTCCGTATCACGATTCGATGTTAGATTTAAAGTATCGCGACTCCGACGACGACTCGCGCGTTCTCCAGGAGCCGCCGAGGCCCAGGCTCCCTCCACCAGCACAGGGACACGCTCCCGGCCGAGCGACGTCGACTCACGGATCGTCTTCATTGAAATATTCATATATATGTATCTCAGCTACCGAGTATGTTGTAAGGTTACCGTGTTTGGACCCCAGCTTGTTTTCTCCACGCGACCATCGCTCTCCCCCGCTCCCTCGGGCTGCCGCGATCCTGACCTGTCACCGCGGACTCCCGGGCCTCGCCCTGGCCGGCCGCGGACAGGGGATCATGCGATAA

Protein sequence:

>DPOGS210338-PA
MELHLHLTAVSRALDYKWGTPVDLETSQDMRTCSPAVIDLPTTTFSSEEYLRSIRRKTSECAPRKPNLLRKDTFANISSSRLSCEEIICDVLDQTIYFSDDTVDSKYDLDSSGFIDNYTKNNLRNKDIEYFMKEKTKGIFRLACEHVVRTMRRGRETLLTLLEAFVYDPLVEWGGGRRKRGARHVRAAKAMLAVRVRELKHSATDITNQLLAALPEVKHCADKWLEENEQLHTVEEKLDMCHKQMALIKEVEACGSNLSDHPLYAISQKYTSHKQAKNAVEDSMKALVKILNDFDTQIESFANTNDILNGPQLMTWVQEFSGPHYDDEKPIFEPIKEFLTNAGKGSMISQFEQAEVELNQTMQQTNLLVRSCLELLTQYVAVSQYYPQSRTEYHRLVMFRKYLATALESKSPEVCREVAGQVTALVESDNVTGDSQQIIAYNYRLHQVNAEANAYLNKCHERLQLEGGPDAIALAQDSYMEAKNNINNWLRTEEGAGAALENAAIGMLCNLNRRYLMLENGAQSAGDCLLDLTSRDGEWFLDDMNSLSMQAIELLTLLPLPSTTADDAALSVAVECVKNANLLIADLVQLNYNFSTIILPEAVKKVHSEDPSTLHMINELNALITNTPVTLNDLLTQLEMHFRYLVMDMESPAAGAQILAAELRSRYEELLSPSEGEAPGQTPGRMLLMGFSGLFAAVELRARELADHLAAPLQPAWRKIDQINDAMHMSAAMQNPALRSVLEDIFTVRRVQTVAEVFSLCLQLARAFRGSPPPAAPPPPPAASQPLLDDAALCKPVRRFTAEYVSRCFLGVHSLSLGRALCLLLRRARLDLRAEVEQKEIGASWSVSLESLVEKACGSVSSRAGSLAGALQASRARTLRAAAAVRALDRARASARAARLRAAAHASLHAEIVSGAPEPGPALFRAARDLTAARGRLTDALEKAQALLTPAHQSKVGRGANPDLLGAVVALESGWAARAGRAHALCRAGAVLAPHARSASALAAARPARHARALRHARTLRTALAHWEKACTLAQKYSLHVSPVEESLMEMLHPEGNIDTHWVGDVSALVQDTLGSRASAASSARARLSVASDALSAAAARLRDAAAAREHLLHDLAGPLHALAPYNEDIKRRQQSRKVGILNKHEQRGLWSAFSFGDNPSQEFLSLWRAVSERLAAVCGLLDLDLDLERVARTAAETHALLTDLPLLLDMMLQLPGNTDTSRRLTRQAAVGRPPARHGHEQRSATGAGVWRRVRLKLEKRMTPQEQVLAHSTGDVYPCGVHYIGSDQRGQPLPHVRGLDGVGVSPGRCSALRRVRTGAPVPFGPRAPSREPHEPDRSPRARPRRRRQLRKTPRTGNSPYHDSMLDLKYRDSDDDSRVLQEPPRPRLPPPAQGHAPGRATSTHGSSSLKYSYICISATEYVVRLPCLDPSLFSPRDHRSPPLPRAAAILTCHRGLPGLALAGRGQGIMR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: