MonarchBase - Protein-coding gene

DPOGS213629
Transcript	DPOGS213629-TA	3255 bp
Protein	DPOGS213629-PA	1084 aa
Genomic position	DPSCF300033 + 1094864-1100805
RNAseq coverage	64x (Rank: top 68%)

Annotation
*Heliconius*	HMEL006650	94.08%
*Bombyx*	BGIBMGA011691-TA	93.67%
*Drosophila*	Nmdar2-PC	66.25%
EBI UniRef50	UniRef50_Q8MM14	68.26%	Glutamate NMDA receptor subunit variant NR2-a n=42 Tax=Arthropoda RepID=Q8MM14_DROME
NCBI RefSeq	XP_971730.2	71.40%	PREDICTED: similar to glutamate receptor, ionotropic, n-methyl d-aspartate epsilon (nmda epsilon) [Tribolium castaneum]
NCBI nr blastp	gi\|340716966	61.75%	PREDICTED: glutamate [NMDA] receptor subunit epsilon-2-like [Bombus terrestris]
NCBI nr blastx	gi\|189235687	71.40%	PREDICTED: similar to glutamate receptor, ionotropic, n-methyl d-aspartate epsilon (nmda epsilon) [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	1.1e-63	membrane
	GO:0004970	1.1e-63	ionotropic glutamate receptor activity
	GO:0005234	1.1e-63	extracellular-glutamate-gated ion channel activity
	GO:0006810	2.8e-26	transport
	GO:0030288	2.8e-26	outer membrane-bounded periplasmic space
	GO:0005215	2.8e-26	transporter activity
	GO:0004872	4.5e-13	receptor activity
	GO:0006811	4.5e-13	ion transport
	GO:0005216	4.5e-13	ion channel activity
KEGG pathway
InterPro domain	[504-866] IPR001320	1.1e-63	Ionotropic glutamate receptor
	[526-864] IPR001638	2.8e-26	Extracellular solute-binding protein, family 3
	[154-402] IPR001828	2.1e-16	Extracellular ligand-binding receptor
	[515-571] IPR019594	1.1e-15	Glutamate receptor, L-glutamate/glycine-binding
	[542-570] IPR001508	4.5e-13	NMDA receptor
Orthology group	MCL10194		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213629-TA
ATGCATGCGCGTACCGCGCTAATGGCGCTGGCTGCGCTGGGGGCGCTGGCGTGGAGCGAGGCGGAGCGTGGCGCTGGCATCAAAGTCGGCGGCGGAGTGACGGGTGCTGGTCGCGAGGCAGCCCGGGGGGGCGGAGTACGGATCGGTGGCGACGGGCTGCGGCGACCTCGGACCTCTCCCGCCCCACAGGCTCCGCGCGCGCCGTCTGTTATCACCGCTGCCCTCGTTGTGCCTCACAAGGCCTTCGGTGCACGTGATTATACCAGAGCTGAGAAGGCTGCTCTGTCCAAACTGCCGCGCAAACTTAAACTTTTTTCACAAGTGCGCCTAAACGTTACGCTTTCGATGCAAGGCCTTACGCCTAGTCCCATGTCTATCTTGGACTCGCTATGTAAGGAATTTTTAGCAGTTAACGTATCTGCTATACTTTATCTTATGAATCATGAACAATACGGGCGATCTACTGCCTCTGCACAATATTTTCTACAACTCGCCGGATATCTTGGCATACCGGTCATTGCATGGAATGCTGACAATAGCGGTCTTGAAAAGCATGCGTCTCACGCGTCACTGCGGTTGCAATTAGCGCCCACTATCGAACACCAGACGGCCGCTATGCTCTCTATACTAGAGAGATACAAATGGCATCAGTTTAGTGTCGTCACATCAGCTATTGCTGGTCACGACGACTTCATACAAGCCGTGCGGGAGAGAGTCTCGGCTCTTCAAGACCGCTTTAAATTTACGATCCTCAATGCTGTGGTTGTGAAAAAACCAGCAGATTTAAACGAGCTGGTAACGAGTGAAGCGCGCGTGATGTTGTTGTACGCGACACGGGAGGAAGCGGCTGACATACTATCTTCAGCTGGTGATCTTCACCTCACTGGAGAAAATTTCGTTTGGATTGTGACGCAAAGTGTGCTGGGCTCTATGCAACAGCCAAACAAATTTCCTGTTGGCATGCTAGGTGTACACTTCGACACATCAAGCTCGTCAATTATATCTGAGATTGCGACCGCTGTCAAAGTTTTCGCTTACGGTGTGGAGTCCTACGTGTCTGAACCGGAAAACATTAGATATCCTCTGGGAACTAGGTTGTCTTGTAGCGGAGTGGGCACGGGTGAAGCGCGCTGGTCTACTGGTGAAAGATTTTATCGGCATCTACGTAATGTCAGCGTGGAGGGAGAGTCGGGAAGACCGAGTATAGAATTTACTCCAGATGGCGAACTTCGGGCTGCTGAGTTAAAAATAATGAACTTAAGACCAACTCTCGGTGAACAGCTTGTTTGGGAAGAAATTGGAACTTGGAATTCATATCCCAAGGAACGGTTGGTAATTAAGGACATTGTTTGGCCTGGTGGGTTACACACTCCACCACAGGGTGTACCAGAAAAGTTCCATATGCGTATAACGTTTCTAGAGGAACCGCCTTACATTAATCTAGCACCACCGGACCCCGTCAGTGGGAGATGCTCTTTAGATCGTGGAGTCATTTGTAGGGTCGCACCAGAGATTGAAGTAGCAGGACTAGAAGCGGGGACGGCGCACAGAAACAGTTCGCTGTATCAGTGTTGTAGTGGATTTTGCATAGATTTACTTCAACAGTTAGCGGAACATCTCGGATTCACTTACGAACTCGTTCGGGTAGAGGACGGCCGCTGGGGTACCTTACACCATGGAAAATGGAACGGCTTGATCGCGGAACTTGTAAACAAAAAAACTGACATGGTTTTAACATCATTGATAATCAATTCAGACCGAGAAGCTGTTGTAGATTTTAGTGTGCCGTTCATGGAAACTGGTGTGGCCATAGTGGTTGCTAAACGAACTGGAATTATTTCACCCACCGCATTCCTTGAACCATTCGATACAGCTTCTTGGATGCTGGTCGGAGCGGTTGCCATTCAAGCCGCCACATTTTCTATATTTTTTTTCGAATGGCTATCGCCTAGCGGGTTTGATTGCTCAACGGGAACTAATTCCAAACGAATTCCACAGAATAGATTTTCCCTGTGTCGGACTTACTGGATCGTGTGGGCGGTGTTGTTTCAGGCATCAGTCCACGTGGACTCGCCGAGAGGATTCACTGCGCGGTTTATGACGAATATGTGGGCGATGTTCGCGGTGGTGTTCCTAGCTATATACACGGCCAACCTGGCCGCGTTCATGATCACCCGGGAAGAATTCCATGAGCTGAGCGGGCTGGACGACCCGCGCATCGCCCGCCCTCTCACTCAACGACCCGCACTCAAGTTCGGGACAGTACCGTGGTCCCATACCGACGCTACGCTCGCGAAATACTTTCCCGAGCCCCACGCTTATATGGCTTCATACAATAGAAGTACTGTGAGTGCCGGTGTGACCAGCGTCCTGACGGGGGATCTCGATGCGTTTATCTATGATGGCACAGTGTTGGATTATCTCGTCTCCCAAGATGAGGACTGCCGATTATTAACCGTAGGCTCGTGGTACGCGATGTCGGGTTATGGGTTGGCATTCACCAGAAATTCTAAATATCTAAGCATGTTTAATAAAAGATTACTCGATCTACGCTCCAATGGAGACCTAGAGCGGTTACGAAGATACTGGATGACGGGGACGTGTAAGCCAAACAAGCAAGAGCACAAATCATCTGACCCGCTGGCGTTGGAGCAGTTCCTCTCCGCGTTCCTGCTGTTGATGGCGGGCATTCTGTTGGCAGCACTACTGCTGCTGCTGGAACACGTATACTTCAGATACATGAGAGAACACCTGGCTGCGTCTAGCGCCAGTGCGTGCTGCGCTCTCGTGTCATTATCAATGGGACAATCATTAACCTTCCACGGGGCAGTAGTTGAAGCGGCAGCACGGGGCTTCGGTCCCGGGAAGCGTGGACACTGCCGTTCCGCCGTATGCGCTGCACAGGTGTGGCGAGCTCGTCACGAGCGTGACGCCGCGGTGGCTCGTGCTCGTCAGCTGGCGGCGGCACTGGCGGCTCACGGGCTGCAGCCGCCTCCTCGGCGCCTGGCCTCGGCCGCCGCGCTGCTCGCCGCTGGACGAGCTCATGACGCGACTCGGCCGCGGACTCTACACGCTCCCGCCGATTTGTTGCCCGACCTCGAGCGACCGCTCTCCTGCGGCGATCTGCGCGCCAGAGAGATGGACGTAGATAGCGAAGTTGTTGTGGGAAGCGCGCGCGGGGCGGGCTGGGCGCCGGGCGCGCCTCCTCGTGTTGTCTACTACAATAAAATATATTTTTTGGACAATACAGTGTAG

Protein sequence:

>DPOGS213629-PA
MHARTALMALAALGALAWSEAERGAGIKVGGGVTGAGREAARGGGVRIGGDGLRRPRTSPAPQAPRAPSVITAALVVPHKAFGARDYTRAEKAALSKLPRKLKLFSQVRLNVTLSMQGLTPSPMSILDSLCKEFLAVNVSAILYLMNHEQYGRSTASAQYFLQLAGYLGIPVIAWNADNSGLEKHASHASLRLQLAPTIEHQTAAMLSILERYKWHQFSVVTSAIAGHDDFIQAVRERVSALQDRFKFTILNAVVVKKPADLNELVTSEARVMLLYATREEAADILSSAGDLHLTGENFVWIVTQSVLGSMQQPNKFPVGMLGVHFDTSSSSIISEIATAVKVFAYGVESYVSEPENIRYPLGTRLSCSGVGTGEARWSTGERFYRHLRNVSVEGESGRPSIEFTPDGELRAAELKIMNLRPTLGEQLVWEEIGTWNSYPKERLVIKDIVWPGGLHTPPQGVPEKFHMRITFLEEPPYINLAPPDPVSGRCSLDRGVICRVAPEIEVAGLEAGTAHRNSSLYQCCSGFCIDLLQQLAEHLGFTYELVRVEDGRWGTLHHGKWNGLIAELVNKKTDMVLTSLIINSDREAVVDFSVPFMETGVAIVVAKRTGIISPTAFLEPFDTASWMLVGAVAIQAATFSIFFFEWLSPSGFDCSTGTNSKRIPQNRFSLCRTYWIVWAVLFQASVHVDSPRGFTARFMTNMWAMFAVVFLAIYTANLAAFMITREEFHELSGLDDPRIARPLTQRPALKFGTVPWSHTDATLAKYFPEPHAYMASYNRSTVSAGVTSVLTGDLDAFIYDGTVLDYLVSQDEDCRLLTVGSWYAMSGYGLAFTRNSKYLSMFNKRLLDLRSNGDLERLRRYWMTGTCKPNKQEHKSSDPLALEQFLSAFLLLMAGILLAALLLLLEHVYFRYMREHLAASSASACCALVSLSMGQSLTFHGAVVEAAARGFGPGKRGHCRSAVCAAQVWRARHERDAAVARARQLAAALAAHGLQPPPRRLASAAALLAAGRAHDATRPRTLHAPADLLPDLERPLSCGDLRAREMDVDSEVVVGSARGAGWAPGAPPRVVYYNKIYFLDNTV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: