MonarchBase - Protein-coding gene

DPOGS214534
Transcript	DPOGS214534-TA	2679 bp
Protein	DPOGS214534-PA	892 aa
Genomic position	DPSCF300287 + 137200-165460
RNAseq coverage	5x (Rank: top 88%)

Annotation
*Heliconius*	HMEL010054	5e-138	96.34%
*Bombyx*	BGIBMGA010995-TA	3e-134	92.74%
*Drosophila*	mAcR-60C-PB	2e-134	63.02%
EBI UniRef50	UniRef50_Q7Q8W8	0.0	59.91%	AGAP010513-PA n=2 Tax=Endopterygota RepID=Q7Q8W8_ANOGA
NCBI RefSeq	XP_314486.1	0.0	59.91%	putative muscarinic acetylcholine receptor 1 (AGAP010513-PA) [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|31211039	0.0	59.91%	AGAP010513-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|189234226	0.0	64.20%	PREDICTED: similar to putative muscarinic acetylcholine receptor 1 (AGAP010513-PA) [Tribolium castaneum]

Group
Gene Ontology	GO:0007186	1.4e-78	G-protein coupled receptor protein signaling pathway
	GO:0016021	1.4e-78	integral to membrane
	GO:0016020	5.7e-31	membrane
	GO:0004981	5.7e-31	muscarinic acetylcholine receptor activity
KEGG pathway	aga:AgaP_AGAP010513	0.0
	K04131 (CHRM3)	maps->	Salivary secretion
			Regulation of actin cytoskeleton
			Neuroactive ligand-receptor interaction
			Calcium signaling pathway
			Gastric acid secretion
InterPro domain	[341-859] IPR000276	1.4e-78	GPCR, rhodopsin-like, 7TM
	[326-338] IPR000995	5.7e-31	Muscarinic acetylcholine receptor
Orthology group	MCL14000		Single-copy universal gene

Nucleotide sequence:

>DPOGS214534-TA
ATGCTCATCGCTTTTAACCAAACAGCTAACTTGTCAGACCTGGCGTTCGATTCCGACCGTCCTGCCAGTCCCTTCAGCCTCGCCCAGAAGATCGTCATAGCCATCATCGCCAGCGTCCTCTCCGTACTCACAGTAGTCGGCAACTCCATGGTCATGATAAGCTTTAAGATCGACAAACAGCTGCAGACAATCAGCAATTACTTCCTGTTCTCGCTAGCGGTCGCCGACTTCGCTGTTGGTTTGATATCTATGCCACTATTCACAATGTTCACGATATACGGCTACTGGCCGCTGGGACCTCATATTTGCGACACCTGGCTAGCGTTGGATTACTTAGCGTCGAACGCATCCGTACTTAACCTTTTAATAATAAGTTTCGATCGATATTTTAGTGTGACGCGGCCCTTAACGTACAGGGCTAAGAGGACTACACGCCGCGCGATGGTTATGATAGGATGTGCGTGGGGTTTCAGTTTGGTGTTATGGCCGCCGTGGATTTACGCATGGCCGTATATAGATGGCGAGAGGAAGGTACCACCTCACGAATGTTACATACAGTTCATAGAGACAAACCAGTTTATCACGTTCGGAACAGCCATAGCTGCGTTTTATGTGCCAGTGACAGTGATGTGTATATTGTACTATAAAATTTGGAGGGAAACCAAAAAAAGACAGAAGGATCTGCCTAATCTACAAGGCGGCAAGAAACACGATTCATCGAAGAGATCTAATTCTAGAGCGGTTCTTCCAATCGAACGTGATATCGTCGGACGGGTCGGCCATGGACACGTCGGGCGCGGGCGTGGGGTCGGTGGGACGCGTCCGCTGTCGGTCGGCGAACGAGCGGCGGGGCGGGTGCCGCGGACTCGCCGAGTTGACGTCATGCTCATCGCTTTTAACCAAACAGCTAACTTGTCAGACCTGGCGTTCGATTCCGACCGTCCTGCCAGTCCCTTCAGCCTCGCCCAGAAGATCGTCATAGCCATCATCGCCAGCGTCCTCTCCGTACTCACAGTAGTCGGCAACTCCATGGTCATGATAAGCTTTAAGATCGACAAACAGCTGCAGACAATCAGCAATTACTTCCTGTTCTCGCTAGCGGTCGCCGACTTCGCTGTTGGTTTGATATCTATGCCACTATTCACAATGTTCACGATATACGGCTACTGGCCGCTGGGACCTCATATTTGCGACACCTGGCTAGCGTTGGATTACTTAGCGTCGAACGCATCCGTACTTAACCTTTTAATAATAAGTTTCGATCGATATTTTAGTGTGACGCGGCCCTTAACGTACAGGGCTAAGAGGACTACACGCCGCGCGATGGTTATGATAGGATGTGCGTGGGGTTTCAGTTTGGTGTTATGGCCGCCGTGGATTTACGCATGGCCGTATATAGATGGCGAGAGGAAGGTACCACCTCACGAATGTTACATACAGTTCATAGAGACAAACCAGTTTATCACGTTCGGAACAGCCATAGCTGCGTTTTATGTGCCAGTGACAGTGATGTGTATATTGTACTATAAAATTTGGAGGGAAACCAAAAAAAGACAGAAGGATCTGCCTAATCTACAAGGCGGCAAGAAACACGATTCATCGAAGAGATCTAATTCTAGTGACGAAACCAAAGAAATAGATGGTCGAGCAAGATCCGAGTCCGGGGATGCTGATTCAGTGTATCACGTGAGGGGTGCACTCCACGACGCCAGGTGGAGAGACAATCAGGCCTTATCCCAACGTCCAAAGCGAGGCTGGGCTGCGGTAAGGGACTGGTGTGTCGCTTGGTGGCACTCTGGTAGAGAAGACCTCGAGGATACAGAACCGGAGGAAGAGCCATCTGACCCTGGGTATGCCACACCCGTGTCAGTTGAGACGCCGTTGCAGAGTACTGTGTCCAGATGCACATCTCTGAATGTAATAAGAGATCCATACGCTGGCCGCGGGGGATCGGGGGGGTCGAGTGTCACGGATGGAGGGACTTCTCCACTCCGACGTAATTTCGAGACGCCTGCCCCTATACCAGCTGCCAGAGACAGCCGATCGCTGCCACCGAACACCAGAATCAACACCTCCGCGTCACCAGCCCCAAAATCAGCATCTGCTGATTCGGTTTACACCATCCTTATCAGATTACCAGATGCTGATACAGAAAGACCCAGCATTAAAATGATCACCGAAGAGTCTCCACCGACGAATACAAGAACACACTATCGACCTGCTCGAGGGGATTCCGAACTAAACATACACCCAGCTGGTCACGCTGCACTAACCAGACGGACATCACACATACAAGACGTGAGAATTCCTCTAAATGCGAAAATTATACCGAAACAGCTGGCTGGCAAAGGGATTACTTCAAAACAGCCAAAGAAAAAGAAAACTCAAGAGAAGAAACAGGAATCAAAAGCTGCGAAAACGCTCTCAGCGATATTGTTATCTTTCATCATCACTTGGACGCCTTATAATATCCTCGTGCTATTGAAACCACTCACAGCATGTACCAAGTGTGATGAACTTTGGTCTTTCTTTTACGCGCTATGCTACATCAACTCCACTATAAATCCCGTGTGTTATGCCCTATGCAACGCGACGTTCAGGAGAACGTACGTTAGAATTTTGACTTGTAAATGGCATAATAGAAATAGGGAAGCAATGACAAGAGGAGTGTACAATTAG

Protein sequence:

>DPOGS214534-PA
MLIAFNQTANLSDLAFDSDRPASPFSLAQKIVIAIIASVLSVLTVVGNSMVMISFKIDKQLQTISNYFLFSLAVADFAVGLISMPLFTMFTIYGYWPLGPHICDTWLALDYLASNASVLNLLIISFDRYFSVTRPLTYRAKRTTRRAMVMIGCAWGFSLVLWPPWIYAWPYIDGERKVPPHECYIQFIETNQFITFGTAIAAFYVPVTVMCILYYKIWRETKKRQKDLPNLQGGKKHDSSKRSNSRAVLPIERDIVGRVGHGHVGRGRGVGGTRPLSVGERAAGRVPRTRRVDVMLIAFNQTANLSDLAFDSDRPASPFSLAQKIVIAIIASVLSVLTVVGNSMVMISFKIDKQLQTISNYFLFSLAVADFAVGLISMPLFTMFTIYGYWPLGPHICDTWLALDYLASNASVLNLLIISFDRYFSVTRPLTYRAKRTTRRAMVMIGCAWGFSLVLWPPWIYAWPYIDGERKVPPHECYIQFIETNQFITFGTAIAAFYVPVTVMCILYYKIWRETKKRQKDLPNLQGGKKHDSSKRSNSSDETKEIDGRARSESGDADSVYHVRGALHDARWRDNQALSQRPKRGWAAVRDWCVAWWHSGREDLEDTEPEEEPSDPGYATPVSVETPLQSTVSRCTSLNVIRDPYAGRGGSGGSSVTDGGTSPLRRNFETPAPIPAARDSRSLPPNTRINTSASPAPKSASADSVYTILIRLPDADTERPSIKMITEESPPTNTRTHYRPARGDSELNIHPAGHAALTRRTSHIQDVRIPLNAKIIPKQLAGKGITSKQPKKKKTQEKKQESKAAKTLSAILLSFIITWTPYNILVLLKPLTACTKCDELWSFFYALCYINSTINPVCYALCNATFRRTYVRILTCKWHNRNREAMTRGVYN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: