MonarchBase - Protein-coding gene

DPOGS211050
Transcript	DPOGS211050-TA	3717 bp
Protein	DPOGS211050-PA	1238 aa
Genomic position	DPSCF300202 + 277556-286500
RNAseq coverage	298x (Rank: top 37%)

Annotation
*Heliconius*	HMEL004332	0.0	60.64%
*Bombyx*	BGIBMGA003800-TA	0.0	61.64%
*Drosophila*	InR-PC	9e-62	42.71%
EBI UniRef50	UniRef50_D6WJG8	1e-159	34.63%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WJG8_TRICA
NCBI RefSeq	XP_397038.3	2e-160	34.08%	PREDICTED: similar to Insulin receptor precursor (IR) [Apis mellifera]
NCBI nr blastp	gi\|328782524	1e-159	33.60%	PREDICTED: hypothetical protein LOC413596 [Apis mellifera]
NCBI nr blastx	gi\|91082203	1e-149	34.39%	PREDICTED: similar to melanoma receptor tyrosine-protein kinase [Tribolium castaneum]

Group
Gene Ontology	GO:0004713	1.4e-112	protein tyrosine kinase activity
	GO:0004672	1.9e-81	protein kinase activity
	GO:0006468	1.9e-81	protein phosphorylation
	GO:0016772	7.5e-76	transferase activity, transferring phosphorus-containing groups
	GO:0005524	2e-38	ATP binding
	GO:0004674	2e-38	protein serine/threonine kinase activity
KEGG pathway	tca:661524	5e-69
	K04527 (INSR)	maps->	Aldosterone-regulated sodium reabsorption
			Insulin signaling pathway
			Adherens junction
			Type II diabetes mellitus
InterPro domain	[904-1171] IPR020635	1.4e-112	Tyrosine-protein kinase, catalytic domain
	[905-1170] IPR001245	1.9e-81	Serine-threonine/tyrosine-protein kinase
	[876-1194] IPR011009	7.5e-76	Protein kinase-like domain
	[904-1178] IPR002290	2e-38	Serine/threonine-protein kinase domain
	[432-754] IPR001828	2.1e-10	Extracellular ligand-binding receptor
Orthology group	MCL15553		Insect specific

Nucleotide sequence:

>DPOGS211050-TA
ATGTGTCGAGTGTCGTTTGTAGTGCTCGTTGTTCGCAGTTCAGTGTGCAGTGTTTACGCAGTAGTGAATAGTGACTGGGGATGTTGTGTGTGGACGGAGACAAAAGGACAGACTTACGGCGGACAGAATACAGCGGTTGGGCCCACGAGACCGGACCTGGACTCGGTATTTTGGAGACACATCATCTGCATCGTATTCATCTTCCTCGTCTATAGTTGTTCAGGCCAGCACGAGGAATTCGTCGCTAGCGGAAATGAAGATGCCGGACCGGTGCTGTCGGTGACAGCGTGTGTTCCGGGAGGCGGTGCAGCAGCTCTGGTGCAGGTCGCTGTGTTGTTGCTGCAGGCAGCAGGGGTGCCGGCTCGAGGCCTGCCGCCGCCCGCCTCCTGCCTGCCTCCTCATGCCGCGGACGGAGCCTCCTGCCGCGACGCCGTCGTGTCCGCACTCACTCACGGCCGACTGCACGTGTCGCTGCTGAGCGTGGCCGCCGCCAGTGCCTCCCGCCTGCGCCCTCTCCGGGACGCTAACGTGGACGAGCTGGGTGACGTGACCCCACCGAGCCGGCGCTTGTGTCTAGCTCCGGCCCCCTTACACTCCATTCTGGACCTCGCAGACCCGTCTATAGCAGGTCACTACTACCTGCGACCGGACGAGGTCGGCTCCATTGAATACTCTTTCACAAATGACTCTTCTTCGAGATACGATGGATCCACAGTTCTAAGCCCCGAGTGGTGTAAACCTTCTATCAAATGTGCCGCTATTTTGACAAGTGATATGGGAGAAGCTCTTATACTTTATAATACTATACAAGAGCAAAATCTGTACGCTGTTGTTTATGTACTTGGAGATAACTTAGCAACAGTAGCTACTAAACTAAAAGGAAAATTTATAATTTGTGATTGGGCTCCCGACACCAAGGAGCTATTGGGAACCAGAAGTCTTGGCCCACCACCATGTACACAGGACGCCGACAGTTGCCCTTTCGAAAGCCGTCGACTAGTTAAACTTGTCAACACCAGAGCCTTGGCCTTGCTACCGGGTGCAGTACAGGCTTTATTTCGACTCAGTATAAGTACAAATGAAATGCTAGAATTAAGAAAATTAGCTCGTTTTTCGGAGCCCAAAACTGCAGCTCTCAGATTTCTCTTCGCTCACCCTACTAAAAGAGTGATTAGGGAAGTACGAGTCGTGGTCCTTATACCAAATCCGACACCACGGGAAGCTTACGATGCACCATCACTGGTTGCCGCGTCAGCTTTAGCGGAAGCCGACTTGGAGGCTCACTGGTCTAAGGCTTCCAGATTTAAGGTGATAACTCACGACGATCACTGTGATGCGACGCATTCCTTCCAATACATAAGTGACGCACGCGTTTCTTCCGATTACTTGGAGTTGTCTGCGGTGGCGGGACCCGCTTGTGGAGCAGCCTTCGCTGATGTCGCCCGCCAGTCCACGTCTCACGGCCTGCTCGCCATTTCGTACACACCACAGGCTCCTCCACCCTCACCTGCCGCTGCCCTTACTCTGCTGGCGGCTGGTGATTCACGCATGTATGCGTCCGCGCTTGGCTCGCTGTTTGCCGAGCTAGGGTGGAGGCGGCTGGCAGCCCTCAGCGAACCGGCCACACGAGCGTCTCTGGCTTCCGCTCGTCTTCAAGCAGACATCGTTGCCCACTTGGAGTTGCCGGATGACCGCGCTGATTACGAACCTGAAATCTTTATACAGTGGGCAGAGCGCGTGGTGAGAGCTGACGGCCGCGTCGTATGGTTGTGTGTCGAAGATGCACGGGCAATGCGAGCTGCGCTTTGTGCAGGGCTTGCAGCCGGTCTGGAGCCGAGATCTGGAATCGCCTGGTTGCTGCCAGCGGCGCTGCCACCCTCCGCGTATAGAGTTGGACCTCGTGATGGGTGCTCCCAAGACCAGCTCGACATGATGCTAGAAGGTCACATAAGTGTCGCTCCAAACTGGTTGTTGCCTTGGCTCCAGAATGCTCATGGACGGAATTCTTCTGTAACTACAGACTTGAAGGAATCGAGCGGAGACAGTGTGTCTAATTGGACGTCCCGATGGCGAACTCAGTGCGGGTTCATAGACGGTGGGTGCACAACTCCGGGACCACACGCGGCCCTCCTCTACGATGCCCTTACATTGTGGGCTAATACGCTCACCGATCTTTTCCAGACTAACTCCACCAAATTCTACGACCTGCATAATCGACAACTTCTCCGATCCCTCGTCAGGAAAGCTACTAAAACCAGTTTCGTGGGAGAGCTGACCGGACGGTTTGAATGGATGGCTGTGAATAATGAGGACGACAACGGTACGGCGTACGCTCGCTCTGCTCCGCTGGTCATACTGCAATGGAACGGAGGAGTTAGACGCGAGGTTGCACATTGGAACCGTGGTCGACTAGAACTAGTCTTGGGTGCTCTGCGGTGGAGTACGGCCGACGGACGCGCCCCGCGTGACAGTTCCGACCACTGTGCTCTTCAAACCATCGCAGACATCCTTGGAGGAGATTGCCGCACAGCTTTTATCGTTTTAGGAGTTCTCATGTTGTTATCGGTCACTGTAGCCCTGAGTACCGCCGCATTTTATTGCAAGAAACGAGCGGAAAGAGAATATAAATCTCGGCTAGAAGCATTAGGACTACATCCATTAGTTCCGAAGACTGTAGGACTTGATCGATGGGAAATATCAAGAGAACGGGTGGTTATAAATCGTAAATTAGGCATGGGTGCCTTTGGAACCGTTTACGGGGGTCATGCACTTCTTGCAGAGGATCGAGGATGGACTGCAGTGGCGGTCAAGACTCTGAAAGCGGGAGCAACGACCGAAGAGAAACTCGATTTCCTTTCGGAAGCCGAGGCAATGAAGCGTTTCGATCACAGAAATGTCATTCGACTTCTGGCCGTCATAACGAAGACGGAACCTGTGTGTACGGTCATGGAGTTCATGTTGTACGGGGATCTCAAAAATTACCTGCTGGCTCGACGGCATCTGGCGTGCGGTGGAGAGGACGCAGACGAGCAGGTCTCAGCGAGGCGCTTGACGGCAGCGGCACTGGACGTGGCGCGGGCTCTTGCTTATCTGGCACAGCTGCGGTATGTGCACCGTGACGTTGCCGCCCGAAACTGTCTCGTCAGTGCCCGCCGGGTCGTCAAGCTGGCTGACTTCGGGATGACCAGACTTGTATTCGAGAATGATTACTATCGATTTAGTAGAAAAGGAATGTTGCCAGTACGCTGGATGGCACCAGAGAGTCTAGCTCTCGGAGTATTCTCACCAGCGTCGGACATCTGGTCATTCGGCGTTCTTCTCTATGAGATCGTGACGTTCGGGTCTCTTCCCTTTCAGGGACTTAGCAATGCCGAGGTACTCACGAAAGTGAAGGCTGGACACACGCTCGATCTACCACCAGGACTGAAGCCTCAGTTGGAGGCGCTCATCAAGTCATGCTGGCAGCAGGACAGCAAGTCGCGACCGACGGCGGACGAAGTGGCAGCGACGCTGGAGGACGCGCCACGACTATTGGCGCCGTGTCTGGACGTACCTCTGGACGCCCTGCCTCTAGACGCTGAACCACCGTGGCGTCTCCCGCGCGACCGCGCTGAGGCTCGCTGGTTGTCTTGGGCCGCTCCTACCTCGGCCGCCACCGATACCACCTACCTCAGTGCTGAAACGCAGCCACGGGACACAGACGCCTTTCTACCCTGA

Protein sequence:

>DPOGS211050-PA
MCRVSFVVLVVRSSVCSVYAVVNSDWGCCVWTETKGQTYGGQNTAVGPTRPDLDSVFWRHIICIVFIFLVYSCSGQHEEFVASGNEDAGPVLSVTACVPGGGAAALVQVAVLLLQAAGVPARGLPPPASCLPPHAADGASCRDAVVSALTHGRLHVSLLSVAAASASRLRPLRDANVDELGDVTPPSRRLCLAPAPLHSILDLADPSIAGHYYLRPDEVGSIEYSFTNDSSSRYDGSTVLSPEWCKPSIKCAAILTSDMGEALILYNTIQEQNLYAVVYVLGDNLATVATKLKGKFIICDWAPDTKELLGTRSLGPPPCTQDADSCPFESRRLVKLVNTRALALLPGAVQALFRLSISTNEMLELRKLARFSEPKTAALRFLFAHPTKRVIREVRVVVLIPNPTPREAYDAPSLVAASALAEADLEAHWSKASRFKVITHDDHCDATHSFQYISDARVSSDYLELSAVAGPACGAAFADVARQSTSHGLLAISYTPQAPPPSPAAALTLLAAGDSRMYASALGSLFAELGWRRLAALSEPATRASLASARLQADIVAHLELPDDRADYEPEIFIQWAERVVRADGRVVWLCVEDARAMRAALCAGLAAGLEPRSGIAWLLPAALPPSAYRVGPRDGCSQDQLDMMLEGHISVAPNWLLPWLQNAHGRNSSVTTDLKESSGDSVSNWTSRWRTQCGFIDGGCTTPGPHAALLYDALTLWANTLTDLFQTNSTKFYDLHNRQLLRSLVRKATKTSFVGELTGRFEWMAVNNEDDNGTAYARSAPLVILQWNGGVRREVAHWNRGRLELVLGALRWSTADGRAPRDSSDHCALQTIADILGGDCRTAFIVLGVLMLLSVTVALSTAAFYCKKRAEREYKSRLEALGLHPLVPKTVGLDRWEISRERVVINRKLGMGAFGTVYGGHALLAEDRGWTAVAVKTLKAGATTEEKLDFLSEAEAMKRFDHRNVIRLLAVITKTEPVCTVMEFMLYGDLKNYLLARRHLACGGEDADEQVSARRLTAAALDVARALAYLAQLRYVHRDVAARNCLVSARRVVKLADFGMTRLVFENDYYRFSRKGMLPVRWMAPESLALGVFSPASDIWSFGVLLYEIVTFGSLPFQGLSNAEVLTKVKAGHTLDLPPGLKPQLEALIKSCWQQDSKSRPTADEVAATLEDAPRLLAPCLDVPLDALPLDAEPPWRLPRDRAEARWLSWAAPTSAATDTTYLSAETQPRDTDAFLP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: