MonarchBase - Protein-coding gene

DPOGS209173
Transcript	DPOGS209173-TA	2769 bp
Protein	DPOGS209173-PA	922 aa
Genomic position	DPSCF300061 + 29283-38619
RNAseq coverage	304x (Rank: top 37%)

Annotation
*Heliconius*	HMEL015522	77.83%
*Bombyx*	BGIBMGA011528-TA	45.09%
*Drosophila*	clumsy-PB	45.08%
EBI UniRef50	UniRef50_E0VK11	48.83%	Predicted protein n=1 Tax=Pediculus humanus corporis RepID=E0VK11_PEDHC
NCBI RefSeq	XP_311343.4	48.49%	AGAP000803-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158289672	48.49%	AGAP000803-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|157129703	50.34%	glutamate receptor, ionotropic kainate 1, 2, 3 (glur5, glur6, glur7) [Aedes aegypti]

Group
Gene Ontology	GO:0016020	2.8e-96	membrane
	GO:0004970	2.8e-96	ionotropic glutamate receptor activity
	GO:0005234	2.8e-96	extracellular-glutamate-gated ion channel activity
	GO:0006810	6.8e-22	transport
	GO:0030288	6.8e-22	outer membrane-bounded periplasmic space
	GO:0005215	6.8e-22	transporter activity
	GO:0004872	2e-10	receptor activity
	GO:0006811	2e-10	ion transport
	GO:0005216	2e-10	ion channel activity
KEGG pathway	mdo:100020889	2e-167
	K05202 (GRIK2)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[430-804] IPR001320	2.8e-96	Ionotropic glutamate receptor
	[76-391] IPR001828	2.3e-36	Extracellular ligand-binding receptor
	[456-802] IPR001638	6.8e-22	Extracellular solute-binding protein, family 3
	[440-508] IPR019594	2.5e-21	Glutamate receptor, L-glutamate/glycine-binding
	[473-501] IPR001508	2e-10	NMDA receptor
Orthology group	MCL10026		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209173-TA
ATGCCCGTAAATAAAGCTGAAGGAAGCTTAACGTGGGGGCTAAAATTGTCACTTCTAATTATTGTGCTATGTGGCGGTGTGCAATGTGCTTTTCGGAATTTTCAAGCATTGAAAACGAATATATATATCGGTGTTATACTACCCAACAACTCTGTGACCGAAGTAGCTTTTGCCTCGGCACTAGCGAGAGCCTCGATGGAAAGCGAACAATATCGTTATTCAATGAAAATAGTCTACGTGCCCTACGGCGACAGCTTCGCAGCTTCAAAAGCCGCTTGTGAGCTTTTATCAGCTGGTGTGATTGCGATCTTCGGACCCACTGACACCACTTCAGCTGCGGCTGTCGAAGCACGCTGCAGGTCTGCAGGTGTTCCGCACATTCAAGCATTATGGCGCCCACCTCACGTCCGAGGTTTGGAACGTCTCTCGCCCCCTAGCATTAATTTACACCCAGAATCCGTAGCGCTCTCAAAGGCAGTCGCCATCTTTATAAAAGACAGCGATTGGAACACTTATACGCTTCTTTATGACGATGATCAAGGACTGATTCGGTTGCAAGAAATATTAAAGAATGCCCAACCAGGACACAAATGGTTAGCACGCCGTCTGCGTCCAGGGGAAGATAATAGACCCTTGCTCAAATTATTAAAAGCCTACGGTGAAACAAGAGTTATAATAGATTGTCCCGCTAACAGAGTGCTCGAATATTTGCGACAGGCGCATGAAGTTAAATTCTTTGAGGACTACATGAGTTACATCCTAATGTCACTCGATGCTCATACGTTAGATCTACAAGAGCTGAGGTATGGTCTATCAAATGTCACATGCTTGAGAATCTTTGACCATTCAGACGGTCGAACTAAGTCCTATCTGGCTGATTGGAAGGCGAGAACTTCAAATGACATCAAAATGCCAAAGAAAACGCACGAGATTACTATCGAAGCAGCCCTTGCTGGTGACGCAGCAAGACTGATAACAGATTCTGTGGAAAATGCACCAAAACAGTTTAAAATAGCAGCACAGTCGATTGAATGTAACACAAAATCTAAATGGGAAGATGGAGAGACATTCACAAATCACCTTTTGACGAATCCAATACAAGGCATAACGGGACGTGTGCAAGTAGATAATATAACTGGGGAGAGAACAAACTTCAACGTAGAAGTTATGGAGCTATCTAACAGCGGATTTAACAGCATAGCAAAATGGAACGCGAAAACGGGCTTCGACTATGCACGGACGGCAACCGAGGTTTCCGATCTATTAGCAGAAAAATGGCAGAACAAAACATTCAAAGTGGTTTCTAGGATCGGTGCTCCTTATCTCGTCGAGAAAACACCAGCTGAAGGCGAAGTGTTGGTCGGGAACGATCGATACGAGGGTTATTCGAAGGATCTCATACACGAAATCTTAAAAGAAACGCTTCACTTAAATTACGTAATAGAAATAGTTCCTGGCAACGAGTACGGAAAGTATAATAAGGACACCAAGAAATGGAACGGCCTTATTGGACATCTCCTCGAAAGGAAAGCTGATTTAGCTATTTGTGATCTGACTATAACGTACGAAAGAAGAGCCTTTGTGGATTTTACGACGCCTTTTATGAGTTTAGGGATCAGTATTCTATATTCAAAGGCAACTCCGCCAGAGCCGGAACTTTTCTCATTTCTAAAGCCATTCTCCGTGGATGTCTGGATTTATATGGCCGCTGCATATTTGATGGTTTCATTATTGCTACATATTTTAGCAAGATTCGCTCCAAACGACTGGGAGAACCCGCATCCCTGTGACAAATCCCCTAAGGAATTGGAAAATATTTGGCATATCAAGAACTCTTGCTGGCTTACCGTCGGATCGATTATGACCCAAGGATCTGATATATTGCCCAAAGGATACTCCACAAGATGGGTGTGTGGCATGTGGTGGTTCTTTGCCCTCATCATGTGTTCCTCCTATACCGCCAATCTCGCGGCTTTCCTCACAAACGCTGCCATGGACGACTCCATTAAAAATGTTGAAGATCTTGCTTTGCAAACTAAAATCAAATACGGAACTGTAGATGGAGGTTCTACTTATTCATTTTTTAAGAGATCCAACGTGTCCACATATCAGAGGATGTGGACTGCAATGGAAGCAGCAAGACCATCAGTCTTTGTAAAAAATAATGATGAAGGTGTAGAAAGGGTTGTTAAATCAAAACGAGGATACGCTTTCCTAATGGAGTCAACCGCTATCGAATATCAACTTGAACGAAACTGCAATTTAATGCAAGTTGGCAACGAACTCGATTCTAAGGGATATGGTATTGCCATGCCTTTTTTGTCGTCTTACAGAACAGCGGTTGATAATGCCCTTCTAAAATTAGCTGAAGGTGGTAAATTGTTGGAACTTAAAAATCGTTGGTGGAAGCCAGCAGAGAAACGGTGTACGTCAGAAGAGGTTGGAGATAAGGGAGGTAGTGCCGTGGAGCTTGGTGTAGACAACGTGGGTGGAGTCTTTGTTGTTCTGGCTGTTGGTTGCGGCCTAGCAGCTTGTATGGGAGGATTCGAATTCCTCTGGCACGTTAGAGATGTTGCTGTTGAACAGAAGATTACTCAATCGGAAGTTTTTTGGGCGGAATTGAAATTCGCTTTGAGCTTTTGGGAAACTGAGAAGCCTGTCAACATTTCTCGATCATCGTCAGCTAAATCAGAAAACATTGCTTCTAGAGCATCGTCGGTGTTACGCTCTGTACTGGATTTAGCCCATCTTGATGTTTTTAATAAATGA

Protein sequence:

>DPOGS209173-PA
MPVNKAEGSLTWGLKLSLLIIVLCGGVQCAFRNFQALKTNIYIGVILPNNSVTEVAFASALARASMESEQYRYSMKIVYVPYGDSFAASKAACELLSAGVIAIFGPTDTTSAAAVEARCRSAGVPHIQALWRPPHVRGLERLSPPSINLHPESVALSKAVAIFIKDSDWNTYTLLYDDDQGLIRLQEILKNAQPGHKWLARRLRPGEDNRPLLKLLKAYGETRVIIDCPANRVLEYLRQAHEVKFFEDYMSYILMSLDAHTLDLQELRYGLSNVTCLRIFDHSDGRTKSYLADWKARTSNDIKMPKKTHEITIEAALAGDAARLITDSVENAPKQFKIAAQSIECNTKSKWEDGETFTNHLLTNPIQGITGRVQVDNITGERTNFNVEVMELSNSGFNSIAKWNAKTGFDYARTATEVSDLLAEKWQNKTFKVVSRIGAPYLVEKTPAEGEVLVGNDRYEGYSKDLIHEILKETLHLNYVIEIVPGNEYGKYNKDTKKWNGLIGHLLERKADLAICDLTITYERRAFVDFTTPFMSLGISILYSKATPPEPELFSFLKPFSVDVWIYMAAAYLMVSLLLHILARFAPNDWENPHPCDKSPKELENIWHIKNSCWLTVGSIMTQGSDILPKGYSTRWVCGMWWFFALIMCSSYTANLAAFLTNAAMDDSIKNVEDLALQTKIKYGTVDGGSTYSFFKRSNVSTYQRMWTAMEAARPSVFVKNNDEGVERVVKSKRGYAFLMESTAIEYQLERNCNLMQVGNELDSKGYGIAMPFLSSYRTAVDNALLKLAEGGKLLELKNRWWKPAEKRCTSEEVGDKGGSAVELGVDNVGGVFVVLAVGCGLAACMGGFEFLWHVRDVAVEQKITQSEVFWAELKFALSFWETEKPVNISRSSSAKSENIASRASSVLRSVLDLAHLDVFNK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: