MonarchBase - Protein-coding gene

DPOGS204648
Transcript	DPOGS204648-TA	3423 bp
Protein	DPOGS204648-PA	1140 aa
Genomic position	DPSCF300462 + 5922-18863
RNAseq coverage	1x (Rank: top 93%)

Annotation
*Heliconius*	HMEL005530	0.0	51.83%
*Bombyx*	BGIBMGA001848-TA	6e-97	48.84%
*Drosophila*	Ir75d-PA	3e-58	33.42%
EBI UniRef50	UniRef50_E5FIA9	4e-104	40.35%	Putative chemosensory ionotropic receptor IR75p n=2 Tax=Obtectomera RepID=E5FIA9_SPOLI
NCBI RefSeq	XP_975640.2	2e-89	39.53%	PREDICTED: similar to ionotropic glutamate receptor-invertebrate [Tribolium castaneum]
NCBI nr blastp	gi\|379070088	1e-168	78.57%	putative ionotropic receptor IR75p, partial [Cydia pomonella]
NCBI nr blastx	gi\|379070088	9e-163	78.57%	putative ionotropic receptor IR75p, partial [Cydia pomonella]

Group
Gene Ontology	GO:0016020	7.7e-10	membrane
	GO:0005234	7.7e-10	extracellular-glutamate-gated ion channel activity
	GO:0004970	7.7e-10	ionotropic glutamate receptor activity
KEGG pathway
InterPro domain	[347-582] IPR001320	7.7e-10	Ionotropic glutamate receptor
Orthology group	MCL34558		Lepidoptera specific

Nucleotide sequence:

>DPOGS204648-TA
ATGCAAAGATTAAAAAATTGCTATAAATTTAGAACGCAGACGTTACAGGCGCAGACTATTATTGTGGATCTCATTAGAATAGGCAATTTCACAACAGAAGCTATAAAATCATTAAACCACAATCCCAAATGTAAACTGCAAATGCAGAGGTTTGATGCGAACCACTGCGATGCATACATTAACAAAGAGGACGTGAACCCCATACAAGAGATCGTTATAGAGGAACAGGTTAAAATTGAAAAGGAATTTATTAACGAGCAAGACACAGTCGCTATGGGCTACACAACAGACGACAGTCTGCCACTAGAGACGCAGAGAACCAAAGCCAAGAAGACAAAGAAGAAGAAAGAGAAGAAGATACAGGAACCGAAGGTAGATAGGAGGAGAAAGCCGTTCCTTAACGATGACCTGAATGAGAGTCTGTTCACTATCACCGATCTGACCTTGGAGGAACAAATAGCTGATATCCAGAAGAGACAGGAGAGTTCTAACTTCAAGAATTCAGTGTACAAGTGTATGGAGTGCTTTAAGGGTTTCCTTGATGAAGGAGCGTACAACGGACATATGACAAGGCATACTACTTCTGTGTACGGTGTTATGGAGGATTATAGAGGTGTCAGAATGTTGCCAGTATCAGCGAGACGCAGGGATTTGAGGAAGCACAATCTGACTATGGCCAACGTCATCACAGATAGCAATGAGACCAGACAGCACCTCGACGATAGGCTAAACCTGCACCAGGATTCCATAACCAAGATGTCGTATGTCGTGGCGAAGATCTGCTTCGATATGCTGAACGCTACCGAGAACAGAATCTTCACGCACACTTGGGGCTACAAGGACAAAAACGGCAACTGGCAGGGCATCATCGACCATCTGCTCAAGAAGAAGGCGGATCTTGGTACCCTGACTATATTTACCCAGGAGCGCATGAAGGCCATAGACTACATAGCCATGGTAGGTTCTACCGCGGTCCGGTTCGTGTTCAGAGAGCCCCCGCTGGCTCTATTGGAGAATATCTTCACTTTGCCATTCACATCGGCTGTATGGATAGCGATCGGCATCTGCGTGCTTGGTTGTGCTGTATTCTTATACATAACATCTAAATGGGAAGCCACGGTGGGAATGCATCCGTTACAGCTAAGCGGTTCATGGGCGGATGTGTTGATACTGATCATAGGAGCCGTCCTTCAACAAGGATGTACGCTTGAACCAAGATACGCCGCTGGTCGATGTGTGACCTTACTGTTGTTCGTGTCTCTCACCGTGTTGTTCGCGGCGTACTCCGCCAATATCGTGGTGCTGCTCCGAGCCCCCAGCAGCTCTGTGCGCTCGCTGCCCGACTTACTGAACTCACCGCTGAAGCTGGGTGCCAGCGACTTTGAATACAACCGGTATTTCTTTAAGAAACTCAACGATCCCATACGCAAGGCAATTTATAGCAAGAAAATAGCTCCGTCAGGCAAGAAGCCAAACTTCTACAGCATGAAGGAGGGAGTCGAGAAGATAAGGAAGGGATTATTCGCTTTCCACATGGAACTTAACCCCGGATATCGCTTAATCCAGGAGACTTATCAGGAAGAGGAGAAATGTGATTTGGTTGAGATCGATTACATTAATGAAATTGATCCCTGGCTGCCCGGACAGAAGCGATCGCCTTACAAGGATTTGTTTAAAATAAGCTTCATCAAGATTCGTGAGTCGGGCGTGCAGTCGTGTGTGCACCGCCGGCTGCACGTGGGTCGGCCGCGCTGCTCCGGCAGCGTGTCCACCTTCAGCAGCGTGGGCATCACGGACATGTACCCCGCGCTGCAAGCCACGCTCTACGGCGCTGTCATGTCCGTAGCCGTGCTCATGATGGAAAAAGTTCACTACAAACTTTTCATTGACAACGAGAAAAAGTCAACAATAGTTATTCTTGATAACATTTGTTGGGACAAAAGTTTTTATCGCGAGATATTTTTAAACTTTATTGTTTCAGCGGAGATGTTGAAATTGATAAAGGCTTTGTCGCGTAATAATGTTCGAGTGTCGTGTAAGACTTGGAATAAAAATAACCTACAGGATCACATGCTCTTATTTTTAACTGATTTAGATTGTCCAGGTGCTGAAGAATCGCTGAAGTTATCTCCTTATCTACGATATCCTTTCCGATGGCTAGCACTCACTAAGAGATCTGATGATATAAAATATATTTGGAAACTTCCACTGTTTGTTGATAGCGATTTTGTGCTAGCAAAAGAAATGGTAGACCACTTCTCTCTCACAGAACTGTATAAACCCTCGACATTTGGACCTATGAGCTCAATCGCTCGAGGTTATTATAATGGAAGTCTAATTGACACGAGGGAAAATAGAGAAATCTTTAGACGTAGGAAGGACATTATGGGACATCCCTTAACCATCTCCAACGTCATACAGGACAGCAACACTTCGCAATATCACATAATAAAAGAGAACAGATTGGAGCTTCATTACGATGGTACGACAAAACTATCCTATGTACACGTGCAAATAGCCTTCCAAATGCTAAACGCTACACCGAGACATGTCTTTAGTCATCGATGGGGTTACAAGAAAAACGGACAGTGGTCAGGAATGATTAATGATATAAATACAGGAAGAGCAGACCTAGGCACAAACTGCGTTCCGGCTGTCGAACGCCTCAGCGTAGTTGTCTTCACGGACTGCATCGCCAACTTCGAAGTTAAATTCATCTTTCGCCAACCACCACTCTCTTACGTGTCCAACATCTTTACTTTGCCATTTTCGAAAAGTGTTTGGATCGCCATAGCGACGTCATTTGCCATATCTACAATAACAATATATATAGCAACTAAATGGGAGGTCAGGACATTTAAAACGGCACAAAAAGATCCAATAAGGAAAGCAATATATAGGAAAATTAGTCCGGAAAAGGGCAAGGAGAATTTTTATAATTTCAATGAAGGAGTTGAACTCTTACGTCAGGGCTTATTTGCATTCCACGCAATTTTGGAACTGGTGTACTTACGCGTCGAGGAAACATTCTTGGAGAATGAGAAATGTGATTTGATGCAATTGGATTTTATTAACTCACACGACCCCTTTGTGCCAGTTTATAAACATTCCCCGTATTTGGAGCTGCTGAGAGTTGTGTTCAAACGTATCCGCGAATCAGGCATTCAGATGGCCAACCACAGGAGGTTTCAAGTTCCAAAGCCGCGATGCACCGAGAAGATATCAACCTTCAGTAGTGTGGGTATTGTTCACATGAAGCCAGTGCTGCTGTTTATAACTTACGGTTTCCTGGCGGCATTTCTCATAATGGTGGCCGAGATTTTCGTGTTTAGGATGAAAATGTTCAAGAGAAAGGAGTTGAAATACTTTTCTTTGAGGAATAGGCCCTCAAAAGAAAATTTGACCATAAAGTATCCTAATTAA

Protein sequence:

>DPOGS204648-PA
MQRLKNCYKFRTQTLQAQTIIVDLIRIGNFTTEAIKSLNHNPKCKLQMQRFDANHCDAYINKEDVNPIQEIVIEEQVKIEKEFINEQDTVAMGYTTDDSLPLETQRTKAKKTKKKKEKKIQEPKVDRRRKPFLNDDLNESLFTITDLTLEEQIADIQKRQESSNFKNSVYKCMECFKGFLDEGAYNGHMTRHTTSVYGVMEDYRGVRMLPVSARRRDLRKHNLTMANVITDSNETRQHLDDRLNLHQDSITKMSYVVAKICFDMLNATENRIFTHTWGYKDKNGNWQGIIDHLLKKKADLGTLTIFTQERMKAIDYIAMVGSTAVRFVFREPPLALLENIFTLPFTSAVWIAIGICVLGCAVFLYITSKWEATVGMHPLQLSGSWADVLILIIGAVLQQGCTLEPRYAAGRCVTLLLFVSLTVLFAAYSANIVVLLRAPSSSVRSLPDLLNSPLKLGASDFEYNRYFFKKLNDPIRKAIYSKKIAPSGKKPNFYSMKEGVEKIRKGLFAFHMELNPGYRLIQETYQEEEKCDLVEIDYINEIDPWLPGQKRSPYKDLFKISFIKIRESGVQSCVHRRLHVGRPRCSGSVSTFSSVGITDMYPALQATLYGAVMSVAVLMMEKVHYKLFIDNEKKSTIVILDNICWDKSFYREIFLNFIVSAEMLKLIKALSRNNVRVSCKTWNKNNLQDHMLLFLTDLDCPGAEESLKLSPYLRYPFRWLALTKRSDDIKYIWKLPLFVDSDFVLAKEMVDHFSLTELYKPSTFGPMSSIARGYYNGSLIDTRENREIFRRRKDIMGHPLTISNVIQDSNTSQYHIIKENRLELHYDGTTKLSYVHVQIAFQMLNATPRHVFSHRWGYKKNGQWSGMINDINTGRADLGTNCVPAVERLSVVVFTDCIANFEVKFIFRQPPLSYVSNIFTLPFSKSVWIAIATSFAISTITIYIATKWEVRTFKTAQKDPIRKAIYRKISPEKGKENFYNFNEGVELLRQGLFAFHAILELVYLRVEETFLENEKCDLMQLDFINSHDPFVPVYKHSPYLELLRVVFKRIRESGIQMANHRRFQVPKPRCTEKISTFSSVGIVHMKPVLLFITYGFLAAFLIMVAEIFVFRMKMFKRKELKYFSLRNRPSKENLTIKYPN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: