MonarchBase - Protein-coding gene

DPOGS203809
Transcript	DPOGS203809-TA	3327 bp
Protein	DPOGS203809-PA	1108 aa
Genomic position	DPSCF300010 + 2007149-2017195
RNAseq coverage	46x (Rank: top 71%)

Annotation
*Heliconius*	HMEL013313	93.22%
*Bombyx*	BGIBMGA003715-TA	91.74%
*Drosophila*	nAcRbeta-64B-PA	89.02%
EBI UniRef50	UniRef50_G6CM84	99.31%	Nicotinic acetylcholine receptor subunit beta 1 isoform 1 n=6 Tax=Endopterygota RepID=G6CM84_DANPL
NCBI RefSeq	NP_001166819.1	93.23%	nicotinic acetylcholine receptor subunit beta 1 isoform 1 [Bombyx mori]
NCBI nr blastp	gi\|290560948	93.23%	nicotinic acetylcholine receptor subunit beta 1 isoform 1 precursor [Bombyx mori]
NCBI nr blastx	gi\|290560948	94.74%	nicotinic acetylcholine receptor subunit beta 1 isoform 1 precursor [Bombyx mori]

Group
Gene Ontology	GO:0016021	6.2e-305	integral to membrane
	GO:0006811	6.2e-305	ion transport
	GO:0016020	1.9e-75	membrane
	GO:0006810	1.1e-71	transport
	GO:0005230	1.1e-71	extracellular ligand-gated ion channel activity
	GO:0004889	5.7e-22	nicotinic acetylcholine-activated cation-selective channel activity
	GO:0005216	5.7e-22	ion channel activity
	GO:0045211	5.7e-22	postsynaptic membrane
KEGG pathway
InterPro domain	[13-497] IPR006201	6.2e-305	Neurotransmitter-gated ion-channel
	[821-1097] IPR006029	1.9e-75	Neurotransmitter-gated ion-channel transmembrane domain
	[616-820] IPR006202	1.1e-71	Neurotransmitter-gated ion-channel ligand-binding
	[649-665] IPR002394	5.7e-22	Nicotinic acetylcholine receptor
Orthology group	MCL16326		Insect specific

Nucleotide sequence:

>DPOGS203809-TA
ATGGCGGGCCGCCGGGCGCGCCGCTCGCTGCTGGCGGCGCCCGCGGGCCTGCTGCTACTGCTCGCTCTGCTCTGGCCGGGGGAGGTAAGCTGCGGCTATCACGAGAAGCGGCTGCTGCACCATCTGCTGGACCATTACAACGTGCTGGAGCGACCCGTAGTCAACGAGAGCGATCCACTCCAGCTCTCCTTCGGCCTCACGCTTATGCAGATCATTGACGTGGAATGGAATGACATGAATTTGAGATGGAACACTTCGGACTTTGGCGGAGTCAAAGATTTACGCGTTCCACCACATAGATTATGGAAACCAGACGTGCTTATGTACAACAGTGCAGACGAAGGTTTTGATAGCACCTACCCTACAAATGTAGTAGTGCGAAACAACGGCTCCTGTCTCTACGTACCGCCTGGAATCTTTAAAAGCACTTGCAAAATAGACATAACCTGGTTTCCTTTTGACGACCAAAGATGCGAAATGAAGTTTGGGAGTTGGACATACGATGGTTATCAACTGGATCTTCAATTGCAAGATGAAGCCGGCGGAGATATAAGTAGTTTTGTTACAAACGGAGAATGGGAACTTATAGGAGTACCAGGAAAACGTAATGAGATCTACTACAACTGTTGCCCCGAGCCATATATTGACATAACCTTCGCAGTAGTTATTCGGCGGAAGACTTTATACTATTTTTTCAATCTTATCGTGCCGTGTGTTCTTATTGCTTCCATGGCATTGTTAGGGTTCACGTTGCCACCGGATTCTGGTGAAAAACTCTCGTTAGGTGTTACAATATTGCTGTCTCTGACAGTATTTTTGAACATGGTAGCAGAGACGATGCCAGCAACGTCAGATGCAGTACCTCTACTAGGCACATATTTTAACTGCATTATGTTTATGGTGGCATCTTCTGTCGTATCAACAATACTTATCCTTAATTACCATCATAGACATGCGAATACACACGAAATGAGTGATTGGATTCGGTGCGTGTTTTTGTATTGGCTACCTTGGATTCTTCGAATGTCGCGACCGGGTTCAGCGACTACTCCACCGCCAGCTCGCGCGCCTCCTCCCCCAGACTTGGAATTGCGCGAGCGATCTTCAAAGTCGCTATTAGCCAATGTGCTCGACATCGATGATGACTTCCGGCATACCCACGCGCAACAACCACCCTGCTGCCGATACTACAGGTCCCTCGACGATCTACACGAACACTACTCTCCAAGTGGTGAAGAAAATGGCGCGGGTTTAGCAGCGCATAGCTGTTTTGGTGTCGACTACGAACTCTCTTTGATACTAAAAGAGCTTCGAGTCATCACAGATAAGATGCGCACAGACGACGAAGAGGCGGACATTTCGCGCGACTGGAAATTCGCTGCCATGGTCGTGGACAGACTGTGCCTTATTATCTTTACCCTGTTCACAATCATTGCCACGCTAGCCGTGCTACTGTCCGCACCACACATCATGGTGTCCGGTGCGGGTGTCGAAGCCGCGACGTTGGAGTTGCCGCCGCCTGCCTCGTCACCCACGCCCCCCTATAGAAATAAGTTACCGCTGACTGCCAACCTAATGCATTCCACCAAAGAACTGCCTATCCAGTTTCTTGTCTTCTTCTTCCTGGCCTCTCATTCAGCGGCTCAATCTATGCTCTTCTATATACATGACTGTGTAGGTTCTAGCTGGAAGGGTGTAGGCTGTATAGGTTTGGGCGCGGCACGGGAGGAATCGCGTTTGCCGCGTGCGGCAGTGACCGCCGCCATGACGGCTAGGTCGCGCGCTCCCTTACTCGTCGTCTTACTTTTAGCGGCACTATATTCAGGATGGTGTTCCGAAGACGAAGAACGACTTGTCCGAGATCTTTTCCGAGGTTACAACAAGCTCATACGACCCGTTCAGAATATGACACAGAAAGTGGACGTTAGATTCGGCCTCGCCTTTGTACAGCTCATTAACGTTAATGAAAAAAATCAAATAATGAAATCGAACGTATGGCTAAGGCTGGTTTGGATGGATTACCAGCTGATGTGGGATGAGGCTGACTACGGCGGCATCGGTGTGCTGCGGCTACCACCTGATAAGGTCTGGAAACCAGATATAGTGTTATTCAACAACGCCGACGGTAATTACGAAGTGAGATACAAATCTAACGTGCTCATTTATCCAAACGGCGAGGTTCTTTGGGTTCCACCGGCAATTTACCAAAGCTCGTGCACCATTGACGTCACATACTTTCCATTCGATCAGCAGACTTGCATAATGAAGTTCGGATCGTGGACATTCAACGGCGATCAAGTGTCACTTGCACTCTACAACAATAAAAACTTTGTAGACCTCTCGGATTACTGGAAGTCGGGCACTTGGGACATTATAGAAGTACCAGCTTATTTAAATATCTATGAGGGCAATCATCCGACTGAAACAGACATCACTTTCTACATAATTATCCGAAGAAAGACATTATTTTATACCGTTAACTTAATCTTGCCGACAGTTTTAATATCATTTCTCTGTGTACTTGTGTTCTACTTGCCCGCCGAGGCTGGTGAAAAAGTGACATTGGGCATCAGTATTTTACTGTCACTGGTCGTGTTCCTGCTGCTTGTTTCAAAAATTCTTCCTCCCACGTCCCTGGTTCTGCCGTTAATAGCAAAATATTTACTGTTTACATTTATTATGAACACCGTCAGTATCCTCGTTACAGTAATCATAATCAACTGGAACTTTAGGGGACCTCGGACTCATAGAATGCCTCTCTGGATAAGGAGCGTCTTTTTACACTACTTACCAGCAGCTCTGCTTATGCGACGACCGCGCAAAACAAGGCTGCGTTGGATGATGGAAATGCCGGGAATGGGCGCTCCGCCACATCCAACAGCCACTCATGACTTGCCCAAACATATAAGCTCAATTGGTTCTAAACAAGGTAAAATGGAGGCTATGGAACTTTCGGACTTACATCATCCCAACTGTAAAATAAACCGCGCGTCGGGTGGAGGCGAGGTGGGCGCGCTGGGAGGACTCGGAGCGCTCGGCCTCGACAACCGAAGGGAATCCGAGAGTTCCGACTCACTACTCTTATCTCCCGAAGCGGCCAAGGCCACGGAAGCTGTGGAATTCATCGCAGAACATTTACGGAATGAAGATCTCTATATTCAAACTAGAGAAGATTGGAAATATGTGGCTATGGTCATAGATCGATTACAACTATACATATTCTTCATAGTGACCACAGCAGGGACCGTCGGTATATTAATGGACGCGCCTCACATCTTTGAATATGTCGATCAAGACCGCATCATTGAAATATATAGAGGAAAATAA

Protein sequence:

>DPOGS203809-PA
MAGRRARRSLLAAPAGLLLLLALLWPGEVSCGYHEKRLLHHLLDHYNVLERPVVNESDPLQLSFGLTLMQIIDVEWNDMNLRWNTSDFGGVKDLRVPPHRLWKPDVLMYNSADEGFDSTYPTNVVVRNNGSCLYVPPGIFKSTCKIDITWFPFDDQRCEMKFGSWTYDGYQLDLQLQDEAGGDISSFVTNGEWELIGVPGKRNEIYYNCCPEPYIDITFAVVIRRKTLYYFFNLIVPCVLIASMALLGFTLPPDSGEKLSLGVTILLSLTVFLNMVAETMPATSDAVPLLGTYFNCIMFMVASSVVSTILILNYHHRHANTHEMSDWIRCVFLYWLPWILRMSRPGSATTPPPARAPPPPDLELRERSSKSLLANVLDIDDDFRHTHAQQPPCCRYYRSLDDLHEHYSPSGEENGAGLAAHSCFGVDYELSLILKELRVITDKMRTDDEEADISRDWKFAAMVVDRLCLIIFTLFTIIATLAVLLSAPHIMVSGAGVEAATLELPPPASSPTPPYRNKLPLTANLMHSTKELPIQFLVFFFLASHSAAQSMLFYIHDCVGSSWKGVGCIGLGAAREESRLPRAAVTAAMTARSRAPLLVVLLLAALYSGWCSEDEERLVRDLFRGYNKLIRPVQNMTQKVDVRFGLAFVQLINVNEKNQIMKSNVWLRLVWMDYQLMWDEADYGGIGVLRLPPDKVWKPDIVLFNNADGNYEVRYKSNVLIYPNGEVLWVPPAIYQSSCTIDVTYFPFDQQTCIMKFGSWTFNGDQVSLALYNNKNFVDLSDYWKSGTWDIIEVPAYLNIYEGNHPTETDITFYIIIRRKTLFYTVNLILPTVLISFLCVLVFYLPAEAGEKVTLGISILLSLVVFLLLVSKILPPTSLVLPLIAKYLLFTFIMNTVSILVTVIIINWNFRGPRTHRMPLWIRSVFLHYLPAALLMRRPRKTRLRWMMEMPGMGAPPHPTATHDLPKHISSIGSKQGKMEAMELSDLHHPNCKINRASGGGEVGALGGLGALGLDNRRESESSDSLLLSPEAAKATEAVEFIAEHLRNEDLYIQTREDWKYVAMVIDRLQLYIFFIVTTAGTVGILMDAPHIFEYVDQDRIIEIYRGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: