MonarchBase - Protein-coding gene

DPOGS209174
Transcript	DPOGS209174-TA	2793 bp
Protein	DPOGS209174-PA	930 aa
Genomic position	DPSCF300061 + 46356-53427
RNAseq coverage	62x (Rank: top 68%)

Annotation
*Heliconius*	HMEL009742	0.0	68.92%
*Bombyx*	BGIBMGA011528-TA	3e-143	34.44%
*Drosophila*	CG3822-PA	2e-141	33.22%
EBI UniRef50	UniRef50_D6WAN3	1e-145	36.88%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WAN3_TRICA
NCBI RefSeq	XP_309276.4	2e-154	37.72%	Anopheles gambiae str. PEST AGAP012447-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158287191	3e-153	37.72%	Anopheles gambiae str. PEST AGAP012447-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|270002209	3e-153	36.44%	hypothetical protein TcasGA2_TC001185 [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	4e-67	membrane
	GO:0005234	4e-67	extracellular-glutamate-gated ion channel activity
	GO:0004970	4e-67	ionotropic glutamate receptor activity
	GO:0006810	8.8e-25	transport
	GO:0030288	8.8e-25	outer membrane-bounded periplasmic space
	GO:0005215	8.8e-25	transporter activity
KEGG pathway	mdo:100020889	3e-124
	K05202 (GRIK2)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[444-811] IPR001320	4e-67	Ionotropic glutamate receptor
	[458-809] IPR001638	8.8e-25	Extracellular solute-binding protein, family 3
	[72-390] IPR001828	5.5e-23	Extracellular ligand-binding receptor
	[452-516] IPR019594	7.1e-06	Glutamate receptor, L-glutamate/glycine-binding
Orthology group	MCL34792		Lepidoptera specific

Nucleotide sequence:

>DPOGS209174-TA
ATGTTTGTAATAATGTTGTGGTTATTTATTGTTTGTTTCGTTCAGCCGTCAACCTCTGAGATCCGTTATACGGAAACTAGACAGAGTTTTTATCAAATAGCTGGCATTTTTGAAAACAATACGCTCACACAACGGCTTGCTTTTAATGAGAGTATACGTTACGCCAATTTGGGAAAAGCTGAATTACAATCAATGTCTGATGCTCAAGGCGGCAAAGTATGTTCAAACACAACTATGCAACCGATAGCTATATTCGGTCCTCAGAATTCCGTCACCGACAACATCATACGCGATCAGTGCTACGTATCAAATATTCCGCATATTCAAGCTAACTTGCAGTTAGCGGACCCTGATATGGAGCTGAACCCAGTTGAAGCTACAGACGAAGAATCCACTGAAGATCAGGGGCTTAAGTTTAAAAAGATATCCATAAACTTTTACCCGCCGGCAGAGGATATATTGTACGCTTACGCCATGTTACTAAAGTACTACAAATGGAAAAACTTCGCAGTTCTCTACGAAGATGACTTAGGTCTGTTGAGAATACAGAAGATACTCTCTGAATATACAGAAGACTATCCCCTCACTATCAGAAGACTAGACCCGAACGCCGATAACCATAACATATTTAAAGATCTCAAGAAATTCAACGAATATCGGGTCATAATTGATTGTGATGTCGACCGCGTTGTCCAATACCTCACGGAAGCCAGAGAAGTGAACATGGTCAACCATTACGAGCATTACATTTTAATAACGATGGATGCGTCGGTGGTTGCGGAAGAACTGCGACAATTCCAATCGAATATAACTTGGCTCAGTATAACGGAATATGACAAGCTACAAAATTCCCAACATTTCCTGACGCCGAGGGTTGGAAGGTGGACGAGTGAAACGAGCGTCGTCTATCCACCTGTCACTGATATCAAAACGTCAGCGCTGCTAATGGATGACATAGCGAACCACGTATTAAAAGCGTTGCAAAAAGTGGAAATGGTGGAGAGCATTGAAAACAGAACAATGAGTGATATATGTGGACCGGAAAGCGAGCCGTGGGAGTTCGGGGCCTTGCTTCAGGATGAAATATTGAAGACAAAAACAACAGGCGTCACTGGAAATATAGAATTCAACGAATTAGGACAAAGAGTTAATTACACTCTTTATGTAAACGAAATTTATGTTTCAACGTTGGATACAATCGGCACTTGGGACTCGACAGCAAGAGGTGAAATTATTGAAGATAGACCTGAATCTGAAAATTATGATAAAAAGAAAAATGTTAAACATTTCTATATTATATCTAAAAAAGCGAAACCGTACTTTTACGATAAAATAAAATGTGCGGAAGATGATCCAGATTGTGTTGAAGAAAAAGCTGATGAAAATTACGAAGGATTTTCTGTGGACCTCGTCAAAGAAATCTTTGATACGTTGCGAAAACATAATTTTAATTTTACATATTCTTTTTTGCCAAAAACATACACTGATTACGGCAAATACAGACCGGAAGAAAAGAAATGGGATGGCTTGATAGGAGATCTCTTAGATAAGAGTGCCGATTTAGCTGTGTGCGACCTAACTATCACTGAGGAAAGAAAAAAAGTGGTCGACTTTTCAGTACCATTTATGTCTCTGGGTATTAGCATTCTGTATATTAAAGAAAAAGAAGTTGAACCAGCTATGTTCTCCTTTCTCAATCCATATACATTTGATGTTTGGATCCACACGGCAACAGCGTTTTGTGTTGTATCAATTATTCTTTTTGTGTGTTCGAGAATATCTCCAGCAGATTGGGAAAACCCACAGCCGTGTGATAAAGATCCAGAGGAATTGGAAAACATATGGAATTTCAAGAACTGTACGTGGCTCGCTATGGGGTCCATTATGTGTCAAGGATGCGACATCTTACCGAAAGCAATCGGCACACGTTGGGTTTGTTCTATGTGGTGGTTTTTCGCAGTTATCGTATGTCAGACATACATAGCACAACTTTCAGCTTCAATGACCGAAGCTTTGGAAAATGAACCTATTACCAAGGTAGAAGACTTGTCCACACAAACCAAGGTCCTATATGGTGCGATCGATGGTGGTTCCACCCTTGGTTTTTTTAAGAATTCCAAGGATAAAATGTTCAATAAAATGTATGAAAATATGGTACAAAATTCAGCGGTTTTAGTTAAAACTAATAAAGAAGGTGTTAAGAGGGTTATAAAAGGCAACGGAAAATATGCCTTCTTTATGGAATCCACGTCCATAGAATACGAACTGAAAAGGAACTGTGACCTTAAAAAAGTTGGTGAGGAATTGGATTCTAAAGACTACGGCATTGCCATGCCCGCTAACTCTCCGTTCAGGAAGTATATCAACCGAGCTATTTTGGAACTGAAAGAATTCATGGTGTTAGATAAGATCAAACGAAAGTGGTGGGAGGAGAAGAATGTGATTCAACCGTGTGAGGTTGAAGAAGACAAAAACGATGTGGAGGGAGATCTTGAAATGAAAAATTTGAAAGGAGCTTTTGTTGTTCTCATAGTTGGGCTTGCTATCTCCATGGTAATTACTGCGTTTGAATTCATGAACGAAGTCAGAAATATTGTCGTGCGAGAACAGGTGTCTCACAAAGAAGTTTTTATTAAAGAACTGAAATCTTCGCTGAATTTCTTCCAACTTCAGAAACCGGTTATAAGAAACCCAAGTCGTGCGCCATCTGTAGCATCTTCTGGCAGTGAAAAGAAGAACAATAGAAATAATGCCATTGAGAACTTGTTAGAATTTGAAAAAGTGCAACAGTAA

Protein sequence:

>DPOGS209174-PA
MFVIMLWLFIVCFVQPSTSEIRYTETRQSFYQIAGIFENNTLTQRLAFNESIRYANLGKAELQSMSDAQGGKVCSNTTMQPIAIFGPQNSVTDNIIRDQCYVSNIPHIQANLQLADPDMELNPVEATDEESTEDQGLKFKKISINFYPPAEDILYAYAMLLKYYKWKNFAVLYEDDLGLLRIQKILSEYTEDYPLTIRRLDPNADNHNIFKDLKKFNEYRVIIDCDVDRVVQYLTEAREVNMVNHYEHYILITMDASVVAEELRQFQSNITWLSITEYDKLQNSQHFLTPRVGRWTSETSVVYPPVTDIKTSALLMDDIANHVLKALQKVEMVESIENRTMSDICGPESEPWEFGALLQDEILKTKTTGVTGNIEFNELGQRVNYTLYVNEIYVSTLDTIGTWDSTARGEIIEDRPESENYDKKKNVKHFYIISKKAKPYFYDKIKCAEDDPDCVEEKADENYEGFSVDLVKEIFDTLRKHNFNFTYSFLPKTYTDYGKYRPEEKKWDGLIGDLLDKSADLAVCDLTITEERKKVVDFSVPFMSLGISILYIKEKEVEPAMFSFLNPYTFDVWIHTATAFCVVSIILFVCSRISPADWENPQPCDKDPEELENIWNFKNCTWLAMGSIMCQGCDILPKAIGTRWVCSMWWFFAVIVCQTYIAQLSASMTEALENEPITKVEDLSTQTKVLYGAIDGGSTLGFFKNSKDKMFNKMYENMVQNSAVLVKTNKEGVKRVIKGNGKYAFFMESTSIEYELKRNCDLKKVGEELDSKDYGIAMPANSPFRKYINRAILELKEFMVLDKIKRKWWEEKNVIQPCEVEEDKNDVEGDLEMKNLKGAFVVLIVGLAISMVITAFEFMNEVRNIVVREQVSHKEVFIKELKSSLNFFQLQKPVIRNPSRAPSVASSGSEKKNNRNNAIENLLEFEKVQQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: