MonarchBase - Protein-coding gene

DPOGS209487
Transcript	DPOGS209487-TA	2115 bp
Protein	DPOGS209487-PA	704 aa
Genomic position	DPSCF300127 - 429686-438162
RNAseq coverage	1168x (Rank: top 11%)

Annotation
*Heliconius*	HMEL016271	68.09%
*Bombyx*	BGIBMGA007436-TA	78.25%
*Drosophila*	bur-PB	59.51%
EBI UniRef50	UniRef50_Q17JX5	60.39%	Gmp synthase n=17 Tax=Bilateria RepID=Q17JX5_AEDAE
NCBI RefSeq	XP_002427615.1	62.16%	GMP synthase, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242013853	62.16%	GMP synthase, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242013853	62.16%	GMP synthase, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0003922	4.4e-58	GMP synthase (glutamine-hydrolyzing) activity
	GO:0005524	4.4e-58	ATP binding
	GO:0006177	4.4e-58	GMP biosynthetic process
	GO:0006164	3.1e-11	purine nucleotide biosynthetic process
	GO:0006541	3.9e-08	glutamine metabolic process
	GO:0003824	3.9e-08	catalytic activity
	GO:0009058	1.2e-06	biosynthetic process
KEGG pathway	phu:Phum_PHUM333140	0.0
	K01951 (E6.3.5.2, guaA)	maps->	Purine metabolism
			Drug metabolism - other enzymes
InterPro domain	[23-208] IPR004739	4.4e-58	GMP synthase, N-terminal
	[25-205] IPR017926	1.1e-36	Glutamine amidotransferase type 1
	[231-396] IPR014729	8.5e-30	Rossmann-like alpha/beta/alpha sandwich fold
	[459-620] IPR001674	3.1e-11	GMP synthase, C-terminal
	[67-76] IPR011702	3.9e-08	Glutamine amidotransferase superfamily
	[67-76] IPR006220	1.2e-06	Anthranilate synthase component II/delta crystallin
Orthology group	MCL13375		Single-copy universal gene

Nucleotide sequence:

>DPOGS209487-TA
ATGCACACAGCCAGTACCGAGGGACAGTATCGTGGTGCCAACGGAGCAGCCAACGGCAGAGACAAAGTCGCTATATTAGATGCCGGCTCACAATATGGAAAGGTGATAGATAGAAGGATCCGCGAGCTGTGCGTGGAATCTGAGATCCTTCCGCTGGACACTCCCGCGTATCATCTCAAGGAGGCTGGATACCGAGCGATCGTCATCTCAGGTGGACCGAACTCCGTGTACGCTGAAGACGCCCCCAGATATGATGCTGATATATTTAAGATCGGTCTGCCGGTGTTAGGCATATGTTATGGTATGCAAATGCTGAACAAGGAGTTTGGTGGTTCCGTACTGAGGAAGGAGGCTCGCGAGGACGGCCAGTATGAGGTGGAAGTTGAAACCACGTGCCCGTTGTTCAACCGCCTGGAAAAGCTGCAGCCAGTACTGCTGACCCACGGGGATAGCGTGCAGAAGGTCGGCGAACGGTTCCGGGTCGGGGCGCAGTCGTCGAACCATCTCATAGCGGCCATTTACAATGAGCAGATGAGGTTGTATGGGGTACAATTCCATCCGGAGGTGGACCTAACGCCCAAAGGCAAGCAGATGTTGTCAAACTTCTTATTCGACATCGCGGGTCTGTCTCGGACCTTCACACTGCGCTCACGCCGCGAAGCCTGCGTACAGTACATACGAGAGACGGTCGGGGATAATAAAGTTCTGGTCCTTGTCAGCGGTGGAGTCGACTCCACAGTTTGCGCCGCCTTATTAAGAACAGCACTGCGTGAAGATCAAGTCATCGCTTTACACATCGACAATGGTATCGTATCCACGGTAGTCCGCGAGGCGGGAGGTCGCACCCGTCACACTCCGCTGCTGTGTCACGCCACGGCTCCCGAGGACAAGAGGCGCATCATAGGAGACGTGTTCGTCAGGGTCGCCGAGCACGCCGTCAGGGACCTGCTGCAGCTGCAAGAGGAGCAAGTGCTGCTGGGTCAGGGAACTCTCCGACCGGACCTCATAGAGTCGGCGTCGGCGCTGGCGTCCGGAGCCGCGGCCGCCATCAAGACGCACCACAACGACACCGAGATGGTGCGCGCGCTGCGGCAGAGGGGGAGAGTCGTGGAGCCGCTCAGGGACTTCCACAAGGACGAGGTCCGTCAGCTCGGTACGGAGCTGGGTCTGCCGGCGGTGCTGGTGGAGCGACACCCCTTCCCCGGCCCGGGGCTGGCTGTGAGAGTTCTGTGCCAGGACGAGCCCTACGCGGACAGAGACTTCGCCGAGACACAGGTGATAGTTAAGATAATGGTTGAATACGCGTCCATGTGTGTGAAGTCTCATGCGTTGCTGGGTAGAGTCTCCAACGCCACCACCCCGGCCGAGCAGAGCGAGCTGAGGCGCATCTCGTCCGCGGGAGCCCTCGCCGCTACGCTGCTGCCCCTGAGATCGGTCGGGGTCCAAGGGGATCACAGAACGTATAGCTATGCGGTGGCGCTGTCCACGGAACGCTATCCGCCCGACTGGAAGGATATGAACTACCTCGCCAAGATCATACCACGAGTGTGCCACAACGTGAACAGGGTTTGTTATGCTTTCGGCGGTCTGATCAAGGAGCAGGTGACGGACATCACGCCAACTTTTCTTTCTCAACAAGTCATTTCCACCATACGGCAGGCGGACGACCTCGCTACACAGGTAACATTGTACTTGGTCCACAACTTGTCCAGCGGTCTGGGTGGCCTAATCTCCCAGATGCCCGTGGTTCTCGTTCCGGTCCACTTCGATCGTGACGCAGGGCTTCGGGCGCCGTCCTGCCAGCGCTCGCTGGTGCTGCGCCCCTTCATCACCAACGACTTCATGACGGGAGTGCCGGCTTTACCTGGCGAGCCCGCTATGCCGCAGGATGAAGCAAGATTGCTCCCGTTGAGCCTCGACCACACTGATGAGATTATATCCGTAGGTGGTGGACAGAATGCGCAAGGAGCTAATGACAGTGCCGGGTATATCGCGTGTGTTGTACGACCTGACTGCCAAGCCGCCGGCCACCACCGAGTGGGAATGATCACCCATCATGTACGCGGCAGTGGTCGACTACACACCACTATGCACCATCCCAGGAACGCCTTCTAA

Protein sequence:

>DPOGS209487-PA
MHTASTEGQYRGANGAANGRDKVAILDAGSQYGKVIDRRIRELCVESEILPLDTPAYHLKEAGYRAIVISGGPNSVYAEDAPRYDADIFKIGLPVLGICYGMQMLNKEFGGSVLRKEAREDGQYEVEVETTCPLFNRLEKLQPVLLTHGDSVQKVGERFRVGAQSSNHLIAAIYNEQMRLYGVQFHPEVDLTPKGKQMLSNFLFDIAGLSRTFTLRSRREACVQYIRETVGDNKVLVLVSGGVDSTVCAALLRTALREDQVIALHIDNGIVSTVVREAGGRTRHTPLLCHATAPEDKRRIIGDVFVRVAEHAVRDLLQLQEEQVLLGQGTLRPDLIESASALASGAAAAIKTHHNDTEMVRALRQRGRVVEPLRDFHKDEVRQLGTELGLPAVLVERHPFPGPGLAVRVLCQDEPYADRDFAETQVIVKIMVEYASMCVKSHALLGRVSNATTPAEQSELRRISSAGALAATLLPLRSVGVQGDHRTYSYAVALSTERYPPDWKDMNYLAKIIPRVCHNVNRVCYAFGGLIKEQVTDITPTFLSQQVISTIRQADDLATQVTLYLVHNLSSGLGGLISQMPVVLVPVHFDRDAGLRAPSCQRSLVLRPFITNDFMTGVPALPGEPAMPQDEARLLPLSLDHTDEIISVGGGQNAQGANDSAGYIACVVRPDCQAAGHHRVGMITHHVRGSGRLHTTMHHPRNAF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: