MonarchBase - Protein-coding gene

DPOGS207218
Transcript	DPOGS207218-TA	2940 bp
Protein	DPOGS207218-PA	979 aa
Genomic position	DPSCF300001 + 6207043-6218927
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL007451	6e-58	50.00%
*Bombyx*	BGIBMGA010713-TA	0.0	88.49%
*Drosophila*	Gyc88E-PD	0.0	80.62%
EBI UniRef50	UniRef50_Q16JH8	0.0	71.64%	Soluble guanylate cyclase gcy n=7 Tax=Coelomata RepID=Q16JH8_AEDAE
NCBI RefSeq	XP_002422715.1	0.0	76.80%	Soluble guanylate cyclase gcy-31, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|3511175	0.0	76.89%	soluble guanylyl cyclase beta-3 [Manduca sexta]
NCBI nr blastx	gi\|3511175	0.0	76.89%	soluble guanylyl cyclase beta-3 [Manduca sexta]

Group
Gene Ontology	GO:0016849	6.9e-89	phosphorus-oxygen lyase activity
	GO:0009190	6.9e-89	cyclic nucleotide biosynthetic process
	GO:0035556	6.9e-89	intracellular signal transduction
	GO:0006182	1.2e-71	cGMP biosynthetic process
	GO:0004383	1.2e-71	guanylate cyclase activity
	GO:0020037	9.3e-59	heme binding
	GO:0005488	1.8e-54	binding
KEGG pathway	smm:Smp_149980	2e-157
	K12319 (GUCY1B)	maps->	Salivary secretion
			Purine metabolism
			Vascular smooth muscle contraction
			Long-term depression
			Gap junction
InterPro domain	[410-602] IPR001054	6.9e-89	Adenylyl cyclase class-3/4/guanylyl cyclase
	[197-431] IPR011645	1.2e-71	Haem NO binding associated
	[1-167] IPR011644	9.3e-59	Heme-NO binding
	[1-192] IPR024096	1.8e-54	NO signalling/Golgi transport ligand-binding domain
Orthology group	MCL15709		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207218-TA
ATGTACGGCTTGCTGTTGGAGAACATGGCGGAGTACATCCGTCAGACTTACGGAGAAGAAAGATGGGAGGATATACGGCGTCAGGCTGGAGTGGAACAGCCATCATTCTCAGTGCACCAAGTCTATCCTGAGAATTTAATTACAAGATTGGCTAAAAAGGCCCAGGAGGTGTTAGGCATATCAGAAAGAGAATTTATGGATCAAATGGGCGTATACTTTGTAGGTTTTGTCTCACAGTACGGCTACGACAGAGTTTTATCAGTTTTAGGTCGACATATGCGGGATTTTCTGAACGGTTTGGATAATTTACACGAATACTTAAAATTCAGTTATCCAAGAATGAGAGCCCCGAGTTTTATTTGTGAAAATGAAACAAGGCAGGGACTGACACTACACTACCGGTCAAAACGGAGGGGGTTCGTTTATTACGCTATGGGACAAATTAGAGAGGTAGCCCGTCACTTCTACCATAAGGAGATGCGTATAGAGTTGTTACGCGAGGAACTCCTTTTTGACACAGTTCATGTAACTTTCCAACTGACGTTCGACAATCGTGCATTCACCCTGGCCTCGCTGGCAATGACAAGGGAAGAAAAACATCTGCCTATTAGCGCTTCGGTCCTCTTTGAGATATTCCCGTTTTGTATTGTCTTTGGTTCAGACATGGTAGTTCGCAGCATCGGCAATTCCCTGATGGTGATTTTACCAGACCTAGTGGGGAAGAAGATCACCAACTGGTTTGATCTCGTGCGACCGCTCATAGCGTTTAAATTTCAAACCATACTAAACAGGACGAATAACATCTTCGAACTGGTGACAGTGGAAGCTGTGATGCATGAGAAGGCGCCTGACAAACGTAACGAACTCATCAGGCTGTCTGATGAATCTGATACAACTACTGAGAAGAATTTGCGGCTCAAAGGCGCCATCTCAAAGAAACGATTTGCATATGACGGAAGGCAGTTACCCGATGTTATAAATTTACATCTCAAAGGACAAATGATATACATGGACAACTGGCGCATGATGATGTATCTTGGCACGCCAGTGATGCCTGACCTGGCAGCGCTTGTGTCAACAGGGCTATACATCAACGATCTCTCGATGCATGACTTCAGCAGAGACCTTATGTTAGCTGGCACACAACAATCAGTCGAACTAAAGCTGGCCTTGGACCAGGAACAGCAAAAAAGTAAGAAGCTCGAAGAATCCATGAGGAAATTGGATGAAGAGATGAAGAGAACGGATGAGCTGTTGTATCAGATGATACCGAAACAGGTCGCTGATAGGTTGAGGAACGGAGAGAATCCCATTGACACTTGTGAGATGTTCCATAGTGTGTCCATATTATTCTCCGATGTTGTGACCTTCACTGAGATCTGTTCCCGCATCACTCCGATGGAAGTTGTCTCGATGCTTAATGCTATGTACTCCATATTCGATACGCTCACAGAACGTAATCGCGTTTATAAGGTTGAAACAATAGGTGACGCTTACATGGTAGTGTCAGGGGCACCAGAGAAAGAGGACAATCATGCTGAGAAGGTCTGCGACATGGCACTTGACATGGTAGACGCGATAACAGACCTTAAAGATCCCAGCACAGGTTCCCATTTATCGATTCGGGTGGGAGTACATTCTGGTGCAGTGGTCGCAGGCATCGTTGGTTTGAAGATGCCTCGCTACTGTCTTTTCGGGGACTCAGTGAATACAGCATCTCGTATGGAATCGACCTCAGAGGCGATGAGGATCCACATCTCACAGACAACGCAAGAGCTACTGTCGCCATCCTACAAGGTCACCGAACGAGGCGAAATACAAGTGAAAGGAAAAGGTGCTATGAAAACTTACTGGTTAGAGGGACGTGAATCCAGGCCATCGCTGACTAAACTAATTTCATCCCAAATTCAACCAGTATCGGAACTGGAATGGGAAAGGGCAGCCGATGTACGAGACAGCATCGCCGAATATTCAGCACAGCAACTGAATAATAAGGAAACAAATATCCATCTTCCTAACGCAATCAATTCTGGGCCCAATTCACTTAGCAACAACAACGCTGGTAATCCAACATTCCAACCATCCACTCCGACTGTCAAGAGCCCTACAGCCCCTACTATGATGTCACCAGCTGAAGAGAGACGGATGTATTCTCCTGTCACTTTCCAGGATGTCGCTAGACGGAGTATCGCAAACTCACCGAACAGAACAGAAAAGGATAAAGAATCAAGATCAACCACAGCGAGTGTGGGAGGTCAATGGACTGATGCGGAATCTTTGGACCCACAACGCACCCTCGACAGTTTAAACTCTTCTTTCTGTTCAACGTCCCCTTGTAGGGTCGGTACAGCACCAGCAACCAAATGTGATGACTTCTTTACAGAACCAATGACACGCGAATCTCCGGCACACTCTGCTCCAGTACTACCAGCATTACCAGCGCCAGCGCTCATGAGAACCAGCCTCGACGATATTGAAACTGATACAGAATATCAAGATGCACACACGGATCACATCTGCGCTTCAGAAAACACAGAACCTCCAAAACAAGGCAAGACACGCGAATCTCCGGCACACTCTGCTCCAGTACTACCAGCATTACCAGCGCCAGCGCTCATGAGAACCAGCCTCGACGATATTGAAACTGATACAGAATATCAAGATGCACACACGGATCACATCTGCGCTTCAGAAAACACAGAACCTCCAAAACAAGGCAAGGTCAGCAGATTCCGAGCTCGAATAGTACCAGGGCAGCATAAAATATGTGCGTTAAAAAATTCAACCAAGGATTCTGTCAAAGAAAAAGTCCAACCGCCGACTAACGTCCAGCCACACGGCCATCATCACACAAAAAATGTAAACCATCACCAATGTTGCGGTGCGTTCGGAAATCCGCATGTCCGTCACAAAACCAGTTCCAGCTGTCATTTGATTTAG

Protein sequence:

>DPOGS207218-PA
MYGLLLENMAEYIRQTYGEERWEDIRRQAGVEQPSFSVHQVYPENLITRLAKKAQEVLGISEREFMDQMGVYFVGFVSQYGYDRVLSVLGRHMRDFLNGLDNLHEYLKFSYPRMRAPSFICENETRQGLTLHYRSKRRGFVYYAMGQIREVARHFYHKEMRIELLREELLFDTVHVTFQLTFDNRAFTLASLAMTREEKHLPISASVLFEIFPFCIVFGSDMVVRSIGNSLMVILPDLVGKKITNWFDLVRPLIAFKFQTILNRTNNIFELVTVEAVMHEKAPDKRNELIRLSDESDTTTEKNLRLKGAISKKRFAYDGRQLPDVINLHLKGQMIYMDNWRMMMYLGTPVMPDLAALVSTGLYINDLSMHDFSRDLMLAGTQQSVELKLALDQEQQKSKKLEESMRKLDEEMKRTDELLYQMIPKQVADRLRNGENPIDTCEMFHSVSILFSDVVTFTEICSRITPMEVVSMLNAMYSIFDTLTERNRVYKVETIGDAYMVVSGAPEKEDNHAEKVCDMALDMVDAITDLKDPSTGSHLSIRVGVHSGAVVAGIVGLKMPRYCLFGDSVNTASRMESTSEAMRIHISQTTQELLSPSYKVTERGEIQVKGKGAMKTYWLEGRESRPSLTKLISSQIQPVSELEWERAADVRDSIAEYSAQQLNNKETNIHLPNAINSGPNSLSNNNAGNPTFQPSTPTVKSPTAPTMMSPAEERRMYSPVTFQDVARRSIANSPNRTEKDKESRSTTASVGGQWTDAESLDPQRTLDSLNSSFCSTSPCRVGTAPATKCDDFFTEPMTRESPAHSAPVLPALPAPALMRTSLDDIETDTEYQDAHTDHICASENTEPPKQGKTRESPAHSAPVLPALPAPALMRTSLDDIETDTEYQDAHTDHICASENTEPPKQGKVSRFRARIVPGQHKICALKNSTKDSVKEKVQPPTNVQPHGHHHTKNVNHHQCCGAFGNPHVRHKTSSSCHLI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: