MonarchBase - Protein-coding gene

DPOGS213730
Transcript	DPOGS213730-TA	3063 bp
Protein	DPOGS213730-PA	1020 aa
Genomic position	DPSCF300278 - 27220-39582
RNAseq coverage	27x (Rank: top 77%)

Annotation
*Heliconius*	HMEL013710	94.50%
*Bombyx*	BGIBMGA011528-TA	92.50%
*Drosophila*	CG3822-PA	65.63%
EBI UniRef50	UniRef50_Q9VDH5	65.63%	CG3822 n=54 Tax=cellular organisms RepID=Q9VDH5_DROME
NCBI RefSeq	XP_974911.2	78.24%	PREDICTED: similar to CG3822 CG3822-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189234774	78.24%	PREDICTED: similar to CG3822 CG3822-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189234774	77.77%	PREDICTED: similar to CG3822 CG3822-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	5.5e-95	membrane
	GO:0005234	5.5e-95	extracellular-glutamate-gated ion channel activity
	GO:0004970	5.5e-95	ionotropic glutamate receptor activity
KEGG pathway	mmu:14806	0.0
	K05202 (GRIK2)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[469-912] IPR001320	5.5e-95	Ionotropic glutamate receptor
	[95-431] IPR001828	5.6e-63	Extracellular ligand-binding receptor
	[479-544] IPR019594	3.2e-33	Glutamate receptor, L-glutamate/glycine-binding
Orthology group	MCL10026		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213730-TA
ATGGTTGACACTGGGTTATGCAAGAAACCTCGCATCCGGTTTCCTAGTCTGATGAAGGTGGTGTCTGCTAGTGAGACCGCTGACTTGATCGTTGACGCTGTAAGGAGAGACATCTTGGAGATCACCGTCCCACAGGAACTGCACTTCATGAACAGAGTGAGTATCTCTATAATGACAGGAACGAAAGCTTTACTATTAGTGCTCTTGATTGGACATTTGTCCGCCCTACCGGACACAATTCGTATCGGAGGTCTCTTCCACCCTGAGGATGATAAACAAGAGGTTGCATTTCGTTACGCTGTTGAAAGGGTAAACGCTGACCGCGCTGTCCTTCCCAGAGCCAAATTACTAGCTCAAGTTGAAACAATATCTCCGCAAGACAGTTTCCACGCGTCCAAAAGAGTATGCCACCTTCTTCGAAGTGGAGTGGCGGCTATATTTGGCCCCCAATCTGCTCCAGCGGCTGCCCACATCCAATCCATCTGTGATACAATGGAACTGCCCCATCTGGAGACGAGATGGGATTATCGAACGCGACGTGAATCCTGTCTTGTCAACTTGTATCCTCACCCAGCTGCTTTGAGTCGGGCGTACGTTGATCTCGTACGAGCTTGGGGATGGAAGTCATTCACTATAGTATACGAGAACAGTGATGGATTGGTTCGTTTACAAGAACTATTGAAAGCCCATGGTCCATCAGAATTACCTGTTGCTGTCCGACAACTACCAGATTCATATGACTACAGGCCGCTATTGAAACAAATAAAGAACTCGGCCGAGTCTCATATAGTACTTGACTGCGCTACTGAGAGGATTAGGGATGTGCTTCAACAAGCACAGCAGATCGGAATGATGTCGGATTATCACAGCTACCTTATAACGTCGTTGGACTTACATAGCGTAGATTTAGAGGAATTTAAATATGGCGGTACAAATATAACCGCGTTGCGCCTTCTCGATCCCGAACGAGCCGAGGTACAAAGAGTCGTTCGAGATTGGGTTTACGACGAAGCCAGAAAGGGAAGGAAGCTGCAACTAGGGCACACATCGGCTAAGACTGAAACCGCTTTAATATACGATGCGGTTCATTTATTTGCGAAAGCGTTACACGACCTTGACACTTCGCAACAAATCGATGTAAGACCCTTGTCATGCGAAGCCGAAGACACATGGCCCCACGGGTACAGCCTCATTAACTACATGAAAATCGTCGAAATGAGGGGCTTAACAGGAGTTATAAAGTTTGACCACCAGGGGTTCAGAAGTGATTTTACTCTCGATATCATTGAACTAACTAGAGATGGACTTCAGAAAGCCGGTGTTTGGAACTCTTCGGAGGGTGTCAATTACACGAGATCTTACGGAGATAACCAAAAACAAATAGTCGAGATACTTCAAAACAAAACCCTTGTCGTCACAACGATCTTGAGCGCTCCATATTGCATGCGGAGAGAAGCGAGCGAAAAATTGACAGGCAACGCTCAGTTCGAAGGCTACGCTGTTGATCTCATTCATGAGATATCTAAAATTCTGGGTTTCAATTACACATTCAAGCTTGCGCCCGACGGTCGATACGGGTCTTACAACAGGGAGACTAAAGAGTGGGATGGCATGATCAGGGAACTGCTCGAACAGAGAGCTGATGTTGCTATAGCTGATCTCACAATAACGTATGACAGGGAACAAGTGGTAGACTTCACGATGCCCTTCATGAATCTTGGCATCTCAGTGCTCTACCGCAAACCTATTAAGCAGCCTCCAAACTTATTCTCATTCCTGTCACCCCTCTCCCTTGATGTATGGATATATATGGCCACGGCGTACCTGGGCGTCTCTGTACTGCTATTCATTTTAGCCAGGTTCACTCCATACGAATGGCATCAAACGCATACGCCGGACGGAGAAAAAATGGAAAATATTTTCTCCCTCTCCAACTGCTTGTGGTTTGCAATTGGATCTCTTATGCAGCAAAGTTGTGACTTTTTACCCAAGATTATAGTGACCTCAGCGAAGTCCACAGAAAACTTTATCGGGGATATGGGAACATCTAGAATATTTGTATTTTCGACAATTCGGTTCAGCCCGTACGAGTGGGACAGCCCCCGGAACTGTCTAGACGAGCCGCAGGTGTTGGAGAATCAGTTCACACTGTTGAACTCGCTGTGGTTCACAATCGGATCCTTGATGCAGCAAGGTTCGGATATCGCACCGAAAGCGGTGTCAACAAGGATGGTGGCAGGAATGTGGTGGTTTTTCACTTTGATCATGATATCTTCATATACTGCTAACTTGGCCGCATTCCTGACAGTGGAACGTATGGACTCACCCATTGAAAGCGCCGAAGATTTGGCCAAGCAAACAAAAATTAAATATGGTGCCCTTAAAGGAGGATCTACAGCAGCTTTCTTTAGGGATTCAAATTTTTCGACATACCAACGGATGTGGTCGTTCATGGAGTCGGCTCGACCTTCGGTATTCACAAGCAGCAATAAAGAGGGGGAAGAGAGGGTTATGAGGGGGAAAGGTGCTTATGCATATCTCATGGAGTCCACCACCATAGAGTATGTTGTGGAAAGAAACTGTGACCTCACTCAAGTAGGGGGCATGTTGGATTCCAAAGGATATGGCATTGCTATGCCACCCAATTCACCTTACCGTACCGCTATAAGCGGTGCTGTTTTGAAGTTACAAGAGGAGGGTAAACTTCACATATTAAAAACAAAATGGTGGAAAGAGAAACGCGGCGGAGGATCGTGTAGAGATGAAACATCAAAGTCCTCATCCACCGCCAATGAGTTGGGTTTGGCGAACGTGGGCGGCGTGTTTGTTGTTTTGATGGGCGGCATGGGCGTCGCCTGTGTAATCGCTGTCTGCGAATTTGTATGGAAATCAAGGAAAGTCGCTGTTGATGAACGGGCGTCTCTTTGTTCGGATATGGCCTCTGAGCTGCGTTCCGCTTTGAAGTGTCCGAGTGGAGCCGGCGGGGGCTCTGGGGGGGCGAGAGAGGGAGCGGATTCCCCCTACTTGCATTACGGTTTTAGTACTAAGAGCCAGCTACACTAA

Protein sequence:

>DPOGS213730-PA
MVDTGLCKKPRIRFPSLMKVVSASETADLIVDAVRRDILEITVPQELHFMNRVSISIMTGTKALLLVLLIGHLSALPDTIRIGGLFHPEDDKQEVAFRYAVERVNADRAVLPRAKLLAQVETISPQDSFHASKRVCHLLRSGVAAIFGPQSAPAAAHIQSICDTMELPHLETRWDYRTRRESCLVNLYPHPAALSRAYVDLVRAWGWKSFTIVYENSDGLVRLQELLKAHGPSELPVAVRQLPDSYDYRPLLKQIKNSAESHIVLDCATERIRDVLQQAQQIGMMSDYHSYLITSLDLHSVDLEEFKYGGTNITALRLLDPERAEVQRVVRDWVYDEARKGRKLQLGHTSAKTETALIYDAVHLFAKALHDLDTSQQIDVRPLSCEAEDTWPHGYSLINYMKIVEMRGLTGVIKFDHQGFRSDFTLDIIELTRDGLQKAGVWNSSEGVNYTRSYGDNQKQIVEILQNKTLVVTTILSAPYCMRREASEKLTGNAQFEGYAVDLIHEISKILGFNYTFKLAPDGRYGSYNRETKEWDGMIRELLEQRADVAIADLTITYDREQVVDFTMPFMNLGISVLYRKPIKQPPNLFSFLSPLSLDVWIYMATAYLGVSVLLFILARFTPYEWHQTHTPDGEKMENIFSLSNCLWFAIGSLMQQSCDFLPKIIVTSAKSTENFIGDMGTSRIFVFSTIRFSPYEWDSPRNCLDEPQVLENQFTLLNSLWFTIGSLMQQGSDIAPKAVSTRMVAGMWWFFTLIMISSYTANLAAFLTVERMDSPIESAEDLAKQTKIKYGALKGGSTAAFFRDSNFSTYQRMWSFMESARPSVFTSSNKEGEERVMRGKGAYAYLMESTTIEYVVERNCDLTQVGGMLDSKGYGIAMPPNSPYRTAISGAVLKLQEEGKLHILKTKWWKEKRGGGSCRDETSKSSSTANELGLANVGGVFVVLMGGMGVACVIAVCEFVWKSRKVAVDERASLCSDMASELRSALKCPSGAGGGSGGAREGADSPYLHYGFSTKSQLH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: