MonarchBase - Protein-coding gene

DPOGS201775
Transcript	DPOGS201775-TA	2622 bp
Protein	DPOGS201775-PA	873 aa
Genomic position	DPSCF300404 + 24801-29592
RNAseq coverage	148x (Rank: top 54%)

Annotation
*Heliconius*	HMEL009397	0.0	54.25%
*Bombyx*	BGIBMGA008597-TA	2e-159	47.28%
*Drosophila*	InR-PC	1e-58	29.64%
EBI UniRef50	UniRef50_E2A530	2e-73	32.44%	Tyrosine-protein kinase receptor n=2 Tax=Formicidae RepID=E2A530_CAMFO
NCBI RefSeq	XP_320130.3	1e-73	27.95%	insulin receptor (AGAP012424-PA) [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|307185461	9e-73	32.44%	Insulin-like receptor [Camponotus floridanus]
NCBI nr blastx	gi\|350536827	6e-82	27.02%	insulin-like receptor-like [Apis mellifera]

Group
Gene Ontology	GO:0016020	2.9e-21	membrane
	GO:0007169	6.7e-10	transmembrane receptor protein tyrosine kinase signaling pathway
	GO:0005524	6.7e-10	ATP binding
	GO:0006468	6.7e-10	protein phosphorylation
	GO:0004714	6.7e-10	transmembrane receptor protein tyrosine kinase activity
KEGG pathway	aga:AgaP_AGAP012424	3e-73
	K04527 (INSR)	maps->	Aldosterone-regulated sodium reabsorption
			Insulin signaling pathway
			Adherens junction
			Type II diabetes mellitus
InterPro domain	[277-386] IPR000494	2.9e-21	EGF receptor, L domain
	[133-263] IPR009030	2.7e-12	Growth factor, receptor
	[513-700] IPR008957	3.7e-11	Fibronectin type III domain
	[143-262] IPR006211	6.7e-10	Furin-like cysteine-rich domain
	[630-695] IPR013783	8.6e-06	Immunoglobulin-like fold
Orthology group	MCL25513		Lepidoptera specific

Nucleotide sequence:

>DPOGS201775-TA
ATGGCAAATATAAAAAAGTTACAAAACTGCACAGTTGTGGTTGGGGATCTGATAATAACACTTCTAGAGAGAACTAAACCAAAAGACTTTCGGGATATAAGTTTTCCTAAATTAAAAGAGGTTACAGGATTTATGGTTGTTTACCGAGTGTCGGGATTGGAGTCTCTGGGGGACCTCTTTCCGAATTTAGCGAGAATCCGCGGTAACACGCTTCTATACAACTACGCGCTCATTGTTTATGACATGCCCCGTTTGAGAGAGATAGGTTTCTATAACCTGCTCAAAATCGATAGAGGCGGAGTCATCATATGGGGCGGTAAACTTACTTGCTTCATTGATTCCATTGATTGGAACGTTATTGCGCCCAAATCTCGTCACGTTCTCAGCATACCAGACAAAGGGACACGGTGCATGTTTGTTTGCACTTGTACAAGAAACGCTGTCTCCAATCGCTGTTGGAATAATAAGAAATGCCAACGTTTCCTTGAGGGTCCGGATGCAGAAGATTGTGATGTGAATTGCTTTGGATGCCGCAAGACCAACCCGAAGAGCTGCACATTATGTAGGAACTACACCATCAATAATACATGTGTGAACCGCTGCCCTAACAATACCATAATATTAACGGAGAGCAATTATTGCGTGACGATTGACGAATGTAAACATTTAAATAGATTTGAATTCAATAATACATGCGTGGAAAAGTGTCCGAATAATTATGAAATGGTGACCATTGGAAGAGATACATCATGCAAACCCTGCGTTAATTGCGATAAGACTTGTAAAAGCCTCATTATTCAAACATTGGCTTCCATACAAGCTACAGAAAAGTGTGTATATGTGAATGGCTCATTGACAATACACGTTAGATCAGTTCCCGGAGCGATGGATGAATTGAGATATTATTTGAAAAATATCAAAGAAGTTTCTGGATACATTCTAATTTATGGTTCTATTTCAGTTACATCACTAGATTTTCTATCATCGCTAAAAAGTATCAAGGGCAATACACTATTAAACGGAAAGTATAGTTTAGTCGTTTACGATATGCAAAACCTTCAGATGCTATTTTCAGACAATGTTACCAAAAAACTTAAAATAAACAAGGGTTCAATGAGATTTTACCGAAACCCCATCCTTTGTATGAGCCAAATCGAAAAGTTAAAGCCATTATTTCCGGTGGCTCCTAATGAAATTGATTTACCTCAGGGACTCAATGGTTATAGCGGGGGTTGTAAAGAAATAAATTTGGGTCTAAAAATTAACGTCAAGAATCAAACGTTTGCAGTTGCCACTTTTGATGGTGAGACTGGAACTGACGTGTTTTACACTATTTTATATATCGAAATATCTCACGATACAAAAGTGCCCATTGGACCGGAAGCATGTAGTGAGTCAGAATGGAATGCTATAAGCGTTTCATATTCTTCAAATAGGCTAATTGAAGTTCCCCTACACTCTCTTCGACCGGCTTCGATGTATGCTGTTTGTATAGAAAAGTATGAACCTTCCACACGTCATCTCGCTCGCAGTGCTATAGTAAATTTTACAACGCCACCTGGTAAACCAGAGCCGCCATTCATAACAGAACTTGTGGCTTCTTCCTCTGACGTAGTTGTAGTAAGATGGGTTGATCACAAAAACTATGAACGGCACATTACTAGATACGAGTTAGACGTGTACTTAATAGAAAAGAATCAAAACCATATAAATACAAGAGATTATTGCCAAAATTATAATGATATTGATGAAATTGACTATTCACGTCACGCGAAAGTTATGAGACCACCGCGTAATTATGGAAAAGGTTGTGAAAGTATGTGCGGTATTTTATCATCTTTTACTTTTGGTGCAATGGTCGATGAGTATTTTGATATATGCAATTCAATAAAAGGCTGTGAGAAAGAAGTGGATCGTCCTAAAGTTGATTATATCAAAGGATTACTTAAAACGGTATCGTTAGACATTACTGCCCCAAGAAAAGTTTATCAAATTGGAGGATTAGCACCTTTTAGAGATTATAGATTTCACCTTCGGGCTTGTATTAAAGATTTGTGTAGCCGTTCTGCTAGAGAGGTAGTGCGGACCTTAAGGTTAGAAAACATTGATATAGCCTCTATTACATTTACAAGCGCTGAAGAGAATGGTTTAATAGTCGTGAACTGGGATCCACCGGCAATATCAAACGGAGTTATATTGTCATACACTGTGGAAATTTGTCCAGATAATAATTTAAATGACATGAGTCATTTATTGCCTCAAGTTATGTGCGTTTTTGGAAACGAGACAAGTCTCACAGTAAAATCTCATAAAGCAAATATTTATCTTATAAGAGTGTGTACAACGACGCTGGCTTATTCGTATGTTTGTAACAATTGGACTAAAGTGATGGTTATTCAACAAAATTATCTTTCCATATGGATTGGTGGTGTAGTCTTCGGAATATTACTGTGTGTTATATCCATAAAATTTGGATGGCACTGGAAACAAACTACTATCAAATCGGACGATATACCGTTGGTAGACGCTACTTCTGCTAATCGCAATGAATCTGAACCACCAGCAATTATGATGTCGGATTTTATGCCACTGTATAGCATAGATTTTGGACATTCAGAATAG

Protein sequence:

>DPOGS201775-PA
MANIKKLQNCTVVVGDLIITLLERTKPKDFRDISFPKLKEVTGFMVVYRVSGLESLGDLFPNLARIRGNTLLYNYALIVYDMPRLREIGFYNLLKIDRGGVIIWGGKLTCFIDSIDWNVIAPKSRHVLSIPDKGTRCMFVCTCTRNAVSNRCWNNKKCQRFLEGPDAEDCDVNCFGCRKTNPKSCTLCRNYTINNTCVNRCPNNTIILTESNYCVTIDECKHLNRFEFNNTCVEKCPNNYEMVTIGRDTSCKPCVNCDKTCKSLIIQTLASIQATEKCVYVNGSLTIHVRSVPGAMDELRYYLKNIKEVSGYILIYGSISVTSLDFLSSLKSIKGNTLLNGKYSLVVYDMQNLQMLFSDNVTKKLKINKGSMRFYRNPILCMSQIEKLKPLFPVAPNEIDLPQGLNGYSGGCKEINLGLKINVKNQTFAVATFDGETGTDVFYTILYIEISHDTKVPIGPEACSESEWNAISVSYSSNRLIEVPLHSLRPASMYAVCIEKYEPSTRHLARSAIVNFTTPPGKPEPPFITELVASSSDVVVVRWVDHKNYERHITRYELDVYLIEKNQNHINTRDYCQNYNDIDEIDYSRHAKVMRPPRNYGKGCESMCGILSSFTFGAMVDEYFDICNSIKGCEKEVDRPKVDYIKGLLKTVSLDITAPRKVYQIGGLAPFRDYRFHLRACIKDLCSRSAREVVRTLRLENIDIASITFTSAEENGLIVVNWDPPAISNGVILSYTVEICPDNNLNDMSHLLPQVMCVFGNETSLTVKSHKANIYLIRVCTTTLAYSYVCNNWTKVMVIQQNYLSIWIGGVVFGILLCVISIKFGWHWKQTTIKSDDIPLVDATSANRNESEPPAIMMSDFMPLYSIDFGHSE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: