MonarchBase - Protein-coding gene

DPOGS209941
Transcript	DPOGS209941-TA	2769 bp
Protein	DPOGS209941-PA	922 aa
Genomic position	DPSCF300148 - 407055-413448
RNAseq coverage	338x (Rank: top 34%)

Annotation
*Heliconius*	HMEL009992	2e-163	79.88%
*Bombyx*	BGIBMGA011486-TA	5e-176	40.34%
*Drosophila*	CG5621-PB	3e-157	38.83%
EBI UniRef50	UniRef50_UPI0002060F5A	4e-156	37.62%	UPI0002060F5A related cluster n=2 Tax=unknown RepID=UPI0002060F5A
NCBI RefSeq	XP_001655460.1	1e-164	41.38%	ionotropic glutamate receptor subunit ia [Aedes aegypti]
NCBI nr blastp	gi\|157129695	3e-163	41.38%	ionotropic glutamate receptor subunit ia [Aedes aegypti]
NCBI nr blastx	gi\|157129695	8e-159	41.25%	ionotropic glutamate receptor subunit ia [Aedes aegypti]

Group
Gene Ontology	GO:0016020	1.2e-68	membrane
	GO:0004970	1.2e-68	ionotropic glutamate receptor activity
	GO:0005234	1.2e-68	extracellular-glutamate-gated ion channel activity
	GO:0006810	4.8e-22	transport
	GO:0030288	4.8e-22	outer membrane-bounded periplasmic space
	GO:0005215	4.8e-22	transporter activity
	GO:0004872	7.3e-09	receptor activity
	GO:0006811	7.3e-09	ion transport
	GO:0005216	7.3e-09	ion channel activity
KEGG pathway
InterPro domain	[392-760] IPR001320	1.2e-68	Ionotropic glutamate receptor
	[402-467] IPR019594	3.1e-27	Glutamate receptor, L-glutamate/glycine-binding
	[394-758] IPR001638	4.8e-22	Extracellular solute-binding protein, family 3
	[50-344] IPR001828	2.6e-10	Extracellular ligand-binding receptor
	[524-549] IPR001508	7.3e-09	NMDA receptor
Orthology group	MCL25826		Lepidoptera specific

Nucleotide sequence:

>DPOGS209941-TA
ATGGAGAGTGTATGTTCAGGAGTGGCTGAAGGCATTCCTGAAGTTGCCGTCCTTCTGGAGCAGGCCGTAGCCGCGGGTGGAGGAGCTGCGGCCGGGGAGCGCGGACAGAGCCTCGAACCCTATGAACCCTTAGCGGTACCAGAACATATCTGCACTCAGGCCAGTGAAGGCTTACTGGCCAGTGTCGGCGGTGTGGAGGCCGCGGATGCCGCGGCGCGGGCAGGCTTGCTGTTGTTGCTGGCGTCTCCTGTCGCCGTCCCGTCCCCGGCGATGACCATCGCCTCCACCGAGCCGGACCATCCCTTGTCAGCAGCTCTTGAATTTTATCCACGATATGATGTTCTCGCAGAGGCCTGCGCAGCTCTGTGTGAAGCGAAAGGTTGGAAGCACGCCGTGTTACTGCACGACGGAAGCGGCAGCGCGGCGCCGCTCATAGTGCCCGATCACGACACCCTCGCGCTCCGTGTCCGCCAGCTGCCCTCGAGAGAGGACGACGACGCCTTGAGGAATCTTCTCCTCGTACTGAAGAAGTTCGGTGCTGTAAACTTTATCGTATGGTGTTCGGCGGAGTGCTCGGTGCGAGTGCTGGACGCGGCCCAGCGCGTGGGGTTGCTTTCCGAGCGACACTCGTATTTGATGCTCTCGCTGGACCTGCATACACTGCCGCTCGAGGACTTCAGCTACGGTGGAGCCAACATCACCTCACTGCGTTTATTTGACCCTGAATCTTCTGCAGTAAATGTGTCTATGGAAAAATGGCAGCAACAGTATATAAATCTTCTAGGAAACGAAGCAAATGAAGAAATTGATAAGATTATTTCGAATCCTCCGACTTCATTACTTTTATCATATGATGCTGCAAAAATTGTATCCGAAGGAATGGAGTACCTCGACCTTCCATTCATGGAAGACTCTCCGTCTTGCCAGCAAGGCACTGCCGCCTTCCACGCCGACACACTTCTGAACTATTTACGATCGGAAGAAAACAGTGGCGCAACCGGACCTCTTTGGTGGGAAGCGACGGGAGCTCGCGGTGGTGTGCGACTACACGTGGCGGAACTGGAGCGAGGCGGGTTTCTGAGAGCCGCAGGCGACTGGTCCCGGACGGGGGGACTGACGTGGCGGCCTCGACCACCCGCACCCCCGCCACCACCCGACGCCATGACCAACCGCACCTTCACCGTCCTCATCGCTCAGAATCAACCGTACGTCATGAGACAGCAGTCCTCCGAACGACTCTCAGGCAATGCGCGTTATGAAGGCTTTTGTATAGAGCTGGTGGACCGTTTGGCTCAGCTGTTGCACTTCAACTACACGTTCATAGAGCAAGCGGATCGCGCCTACGGGTCCCTCAACAAGACCACCAAGCAATGGAACGGCATGATGAGGCGCCTCATGGATGATAAGAATGTAGACTTCGCTATAACGGATCTCACGATAACGGCGGAGCGAGAGGAAATCGTGGACTTCACGACGCCCTTCATGACATTAGGTATAAGCATCCTATTTCACAAACCTCAGCCTCCTGCACCGGAACTACTGGCCTTTCTGTTGCCCTTCTCTAACGGGGTTTGGATGTGTCTGGGGCTGGCGTACGTGGGTTCGTCCTTGGTGCTGTACGTAGTGGGTCGGCTGTGCCCCGAGGAGTGGCAGAATCCCTACCCCTGTATCGAGGAGCCATCTGCACTCGAGAATCAATTCACTTTAGCTAATGCTCTGTGGTTTAACCTGGGAGCTGTACTTCAACAAGGTTCTGAAATCGCACCGATTGCTTACGGTACTCGTGCAGTGGCCAGTATTTGGTGGATGTTCGCGTTGGTGATCACGAGTTCCTACACAGCCAACTTAGCCACGTTGTTGGCCTCTAAGACCTCCACCGAGCTCATCCGCAACGTGCGCGAACTCGCCGAAAACGACCAGGGCATCACTTACGGGGCGAAATCTAGTGGCTCAACTTACACTTTCTTTGAAATGTCAAGCAGCGAACCATACAAAAGCATGTTCCAAAAAATGAAAGACGTCACAATGCCTTCGACTAATGAGGAAGGAATAGAAAAAGTAATGAATGAAAAATATGCGTTCTTCGCGGAGTCCACGACTATCGACTACACGACGGAACGTAACTGTGAGGTCACAAGAGTGGGAGATCTCTTAGATAGTAAAGGATATGGCATTGCAATGAAAAAGAACTCACCGTACCGACAGGCGTTGAATCTAGCACTGCTGAATCTGCAAGAGGCGGGGATTCTTAGGGAGATGAAACATCGCTGGTGGAAAGAAATGCATGGGGGCGGTGCCTGTCAGGACAAGGAAGACCACGCCACCGAGAGACTAACAATCGACAACTTCAAGGGTTTGATTCTCGTGTTGACGGTGGGCTGCGCTCTGGGTATAGTCATGTCTTGTTGTGACTTAGCGTGGAGCGCCTGGCGTCATCCGCGCGATCCGACGCGGTCCTTTGCTGCGAGCTTCTGGTCTGAGCTGCGATTCGTGTTCCGTTTCGAGCAATCAGAGAAGCCAGTCCGCGGTGCCCTGACCCCAGCTCCCAGCTCGCACGATTCGCCTCCTTCGGCACACTCCGAACGCTCGGAGTTGACAACGGGGAGTGGAGTCGACGGGAGGGGTAGGGGGAGAGAGGAGGACGACAACCACGGAGAAGACGATGTGGGCTCACGCTTCTCAGCGCGCTCGCGACGGACCAGCGCACGGCGATGTTCCATGCACGCCGCCAGTTTGAGACTGGCGAGACACACCACACCCCGGCGATGA

Protein sequence:

>DPOGS209941-PA
MESVCSGVAEGIPEVAVLLEQAVAAGGGAAAGERGQSLEPYEPLAVPEHICTQASEGLLASVGGVEAADAAARAGLLLLLASPVAVPSPAMTIASTEPDHPLSAALEFYPRYDVLAEACAALCEAKGWKHAVLLHDGSGSAAPLIVPDHDTLALRVRQLPSREDDDALRNLLLVLKKFGAVNFIVWCSAECSVRVLDAAQRVGLLSERHSYLMLSLDLHTLPLEDFSYGGANITSLRLFDPESSAVNVSMEKWQQQYINLLGNEANEEIDKIISNPPTSLLLSYDAAKIVSEGMEYLDLPFMEDSPSCQQGTAAFHADTLLNYLRSEENSGATGPLWWEATGARGGVRLHVAELERGGFLRAAGDWSRTGGLTWRPRPPAPPPPPDAMTNRTFTVLIAQNQPYVMRQQSSERLSGNARYEGFCIELVDRLAQLLHFNYTFIEQADRAYGSLNKTTKQWNGMMRRLMDDKNVDFAITDLTITAEREEIVDFTTPFMTLGISILFHKPQPPAPELLAFLLPFSNGVWMCLGLAYVGSSLVLYVVGRLCPEEWQNPYPCIEEPSALENQFTLANALWFNLGAVLQQGSEIAPIAYGTRAVASIWWMFALVITSSYTANLATLLASKTSTELIRNVRELAENDQGITYGAKSSGSTYTFFEMSSSEPYKSMFQKMKDVTMPSTNEEGIEKVMNEKYAFFAESTTIDYTTERNCEVTRVGDLLDSKGYGIAMKKNSPYRQALNLALLNLQEAGILREMKHRWWKEMHGGGACQDKEDHATERLTIDNFKGLILVLTVGCALGIVMSCCDLAWSAWRHPRDPTRSFAASFWSELRFVFRFEQSEKPVRGALTPAPSSHDSPPSAHSERSELTTGSGVDGRGRGREEDDNHGEDDVGSRFSARSRRTSARRCSMHAASLRLARHTTPRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: