MonarchBase - Protein-coding gene

DPOGS210401
Transcript	DPOGS210401-TA	3420 bp
Protein	DPOGS210401-PA	1139 aa
Genomic position	DPSCF300291 + 156796-175947
RNAseq coverage	209x (Rank: top 46%)

Annotation
*Heliconius*	HMEL021505	81.12%
*Bombyx*	BGIBMGA008411-TA	84.63%
*Drosophila*	sdt-PG	74.89%
EBI UniRef50	UniRef50_D2A2A9	61.93%	Putative uncharacterized protein GLEAN_07820 n=2 Tax=Tribolium castaneum RepID=D2A2A9_TRICA
NCBI RefSeq	XP_001664235.1	60.06%	membrane-associated guanylate kinase (maguk) [Aedes aegypti]
NCBI nr blastp	gi\|157138519	60.06%	membrane-associated guanylate kinase (maguk) [Aedes aegypti]
NCBI nr blastx	gi\|347968407	60.22%	AGAP002711-PF [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	6.1e-54	protein binding
KEGG pathway	aag:AaeL_AAEL014012	0.0
	K00942 (E2.7.4.8, gmk)	maps->	Purine metabolism
InterPro domain	[941-1125] IPR008145	6.1e-54	Guanylate kinase/L-type calcium channel
	[942-1120] IPR008144	6.5e-44	Guanylate kinase
	[292-446] IPR001452	3.2e-26	Src homology-3 domain
	[682-805] IPR001478	9.1e-23	PDZ/DHR/GLGF
	[321-382] IPR011511	3.5e-11	Variant SH3
Orthology group	MCL13805		Single-copy universal gene

Nucleotide sequence:

>DPOGS210401-TA
ATGACGAAGATAGTCCAGAGTTTGAACGCATATCTGCTGGATACTTCGGCATGCTGTATGAACGTGGATAGACTGAGACAGTTCTGCTTATGTCGAGGATACCAGAAGGATAGTAACCATGAGATCATGGTGTCCTCGTCGCCACGCGCACAGACGCGCTCCCAACATGGCGTCGACCCAGAAAGAATAAAGGCATATTCGGAGCAACTCCGTCAAAGGAAAGAAGCTGAAGAGCGAATTGCTGCTCAGAACGAGTTCCTGAGGACCTCGCTGCGAGGCTCCCACAAGCTACAGGCCTTGGAGTCCAACCCGCCCTCCTCAACAGCCTTCGTTAATGATGCCTACGAGGAAGACGCCGCTGATGAGGCAGAGCAACTGTACGCGCTCGTCGACTATCAGGAAGTATGTGCAGCGTTATCGAGGGTTCAAAAATCATTATCGTCTTGCGGGGAGGGTGCTCTAGCAGCGAGAGTCTCAGGTGCCGCGGGAGCCCTGCTATGTCCCGCTCTGAGGACAGCTCTAGCTACACGATCCGCAGTCCTAACAGCCGTTAGACATAAACGACCAGGATTGTCTCCACCGCAGACACATCGAGCCACTGATAGACTAAAGGATACTGGCTTCAACAACTACAAAGACGACAAATATTTACCGAATTCGCCGGACGACTCCAGCGAGAATATTAAGATAATTAAAATAGAAAAAACGAATGAACCACTTGGTGCTACAGTGAGGAATGAGGGAGAGGCGGTCATTATTGGAAGGATAGTGAGAGGAGGAGCGGCAGAGAAATCAGGACTCCTACACGAGGGGGATGAACTCCTCGAAGTCAACGGTGTGAGTATGCGCGGTAAGTCGGTGCATGAGGTGTGTCAGGTCTTGGGAGGCCTGGCGGGCACCCTGAGCGTGGTGCTCGCCCCCCGGCCGAGACCCAGACCTCCTCCTGCCTACCGCGTCTTACACGTCAGGGCCCACTTCGACTACGACCCTGAGGACGACGTTTATATACCATGTCGGGAACTCGGTATCAGTTTTCAAAAAGGCGATGTGTTGCACGTCATCAGTCGCGAGGATCCCAACTGGTGGCAGGCCTTCAGGGAGGGAGAGGAGGATCAGACGCTCGCCGGCTTGATCCCCAGCCAGGCCTTCCAGCATCAACGCGAATCAATGAAGCTGTCTTTGGCGGGCGAGGCGGGCTCCGCTGCCAGAAGGTCGAGGAAGGGCGCCACGTTGTTGTGTGCTCGAGCCAGGAGACGCAAGCCCAGGAAACCCACCAGCGAGGCTGGCTACCCGCTGTATTCTGCACAGCCTGACGAGTTCGAGGCGGAGGAGATACTCACGTACGAGGAGGTGGCTCTGTACTACCCGCGCGCCTCCCACAAGCGACCCATCGTCCTCATCGGGCCCCCCAACATCGGTCGCCACGAGCTCAGGCAGAGACTCATGGAAGACTCCACGAGGTTCGCTGCAGCCGAGCAACTCCGTCAAAGGAAAGAAGCTGAAGAGCGAATTGCTGCTCAGAACGAGTTCCTGAGGACCTCGCTGCGAGGCTCCCACAAGCTACAGGCCTTGGAGTCCAACCCGCCCTCCTCAACAGCCTTCGTTAATGATGCCTACGAGGAAGATGCCGCTGATGAGGCAGAACAACTGTACGCGCTCGTCGACTATCAGGAAGTATGTGCAGCGTTATCGAGGGTTCAAAAATCATTATCGTCTTGCGGGGAGGGTGCTCTAGCAGCGAGAGTGTCAGGCGCCGCGGGAGCCCTGCTATGTCCCGCTCTGAGGACAGCTCTAGCGACACGATCCGCAGTCCTAACAGCCGTTAGACATAAACGACCAGGATTATCTCCACCGCAGACACATCGAGCCACTGATAGACTAAAGGATTGTATAGATGTGTTAGGATCTCACACGTCGTCTGGAAGCGAGACATCGGCATTGGCTGCGGAACTGCTGTCAATCCTCGGAGGTCTTGAGGTGGAGAGTGTGATACAGGCCCACGACCAGGCCGCTGCACTACTGGACCCCTCGTGTTTCAATAGAGTGAAGAGAAATAAGACTGGCTTCAACAACTACAAAGACGACAAATATTTACCGAATTCGCCGGACGACTCCAGCGAGAATATTAAGATAATTAAAATAGAAAAAACGAATGAACCACTTGGTGCTACAGTGAGGAATGAGGGAGAGGCGGTCATTATTGGAAGGATAGTGAGAGGAGGAGCGGCAGAGAAATCAGGACTCCTACACGAGGGAGATGAACTCCTCGAAGTCAACGGTGTGAGTATGCGCGGTAAGTCGGTGCATGAGGTGTGTCAGGTCTTGGGAGGCCTGGCGGGCACCCTGAGCGTGGTGCTCGCCCCCCGGCCGAGACCCAGACCTCCTCCTGCCTACCGCGTCTTACACGTCAGGGCCCACTTCGACTACGACCCTGAGGACGACGTTTATATACCATGTCGGGAACTCGGTATCAGTTTTCAAAAAGGCGATGTGTTGCACGTCATCAGTCGCGAGGATCCCAACTGGTGGCAGGCCTTCAGGGAGGGAGAGGAGGATCAGACGCTCGCCGGCTTGATCCCCAGCCAGGCCTTCCAGCATCAACGCGAATCAATGAAGCTGTCTTTGGCGGGCGAGGCGGGCTCCGCTGCCAGAAGGTCGAGGAAGGGCGCCACGTTGTTGTGTGCTCGAGCCAGGAGACGCAAGCCCAGGAAACCCACCAGCGAGGCTGGCTACCCGCTGTATTCTGCACAGCCTGACGAGTTCGAGGCGGAGGAGATACTCACGTACGAGGAGGTGGCTCTGTACTACCCGCGCGCCTCCCACAAGCGACCCATCGTCCTCATCGGGCCCCCCAACATCGGTCGCCACGAGCTCAGGCAGAGACTCATGGAAGACTCCACGAGGTTCGCTGCAGCCGTTCCGCACACATCCCGCGCCCGCAAGGACCACGAGGCGGCCGGCCAGGACTATCACTTCATATCCCGCGCTCAGTTCGAGGCGGACATCCTGAACAGGAAGTTTGTGGAGCACGGAGAATACGAGAAGGCTTATTATGGTACATCCGTCGAGGCGATCCGCGAAGTGGTGAACTCCGGTAAGATCTGTGTCCTGAACCTTCACCCTCAGTCGCTGCGAATCCTGCGAGGCTCCGACCTCAAGCCCTACACCGTGTTCGTGGCGCCGCCCAGCCTGGAGAAGCTGCGGCAGAAGAAGATCAGGAATGGAGAGGCCTTTAAGGAGGAGGAACTAAAAGAGATAATAGCGACCGCGAGGGACATGGAACTCCGCTGGGGTCACTTGTTCGACATGATCATTATTAACAACGACACGCAGCGCGCTTACCAGCAACTGTTGAACGAGATCAACAGTCTGGAGAGGGAACCGCAATGGGTCCCAGCGCACTGGCTCAAACAGACCTAG

Protein sequence:

>DPOGS210401-PA
MTKIVQSLNAYLLDTSACCMNVDRLRQFCLCRGYQKDSNHEIMVSSSPRAQTRSQHGVDPERIKAYSEQLRQRKEAEERIAAQNEFLRTSLRGSHKLQALESNPPSSTAFVNDAYEEDAADEAEQLYALVDYQEVCAALSRVQKSLSSCGEGALAARVSGAAGALLCPALRTALATRSAVLTAVRHKRPGLSPPQTHRATDRLKDTGFNNYKDDKYLPNSPDDSSENIKIIKIEKTNEPLGATVRNEGEAVIIGRIVRGGAAEKSGLLHEGDELLEVNGVSMRGKSVHEVCQVLGGLAGTLSVVLAPRPRPRPPPAYRVLHVRAHFDYDPEDDVYIPCRELGISFQKGDVLHVISREDPNWWQAFREGEEDQTLAGLIPSQAFQHQRESMKLSLAGEAGSAARRSRKGATLLCARARRRKPRKPTSEAGYPLYSAQPDEFEAEEILTYEEVALYYPRASHKRPIVLIGPPNIGRHELRQRLMEDSTRFAAAEQLRQRKEAEERIAAQNEFLRTSLRGSHKLQALESNPPSSTAFVNDAYEEDAADEAEQLYALVDYQEVCAALSRVQKSLSSCGEGALAARVSGAAGALLCPALRTALATRSAVLTAVRHKRPGLSPPQTHRATDRLKDCIDVLGSHTSSGSETSALAAELLSILGGLEVESVIQAHDQAAALLDPSCFNRVKRNKTGFNNYKDDKYLPNSPDDSSENIKIIKIEKTNEPLGATVRNEGEAVIIGRIVRGGAAEKSGLLHEGDELLEVNGVSMRGKSVHEVCQVLGGLAGTLSVVLAPRPRPRPPPAYRVLHVRAHFDYDPEDDVYIPCRELGISFQKGDVLHVISREDPNWWQAFREGEEDQTLAGLIPSQAFQHQRESMKLSLAGEAGSAARRSRKGATLLCARARRRKPRKPTSEAGYPLYSAQPDEFEAEEILTYEEVALYYPRASHKRPIVLIGPPNIGRHELRQRLMEDSTRFAAAVPHTSRARKDHEAAGQDYHFISRAQFEADILNRKFVEHGEYEKAYYGTSVEAIREVVNSGKICVLNLHPQSLRILRGSDLKPYTVFVAPPSLEKLRQKKIRNGEAFKEEELKEIIATARDMELRWGHLFDMIIINNDTQRAYQQLLNEINSLEREPQWVPAHWLKQT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: