MonarchBase - Protein-coding gene

DPOGS211139
Transcript	DPOGS211139-TA	2064 bp
Protein	DPOGS211139-PA	687 aa
Genomic position	DPSCF300007 - 207102-231095
RNAseq coverage	101x (Rank: top 61%)

Annotation
*Heliconius*	HMEL017212	0.0	78.04%
*Bombyx*	BGIBMGA003012-TA	0.0	78.74%
*Drosophila*	CG34400-PC	2e-132	50.51%
EBI UniRef50	UniRef50_Q9VU98	3e-130	50.51%	CG34400, isoform C n=52 Tax=Coelomata RepID=Q9VU98_DROME
NCBI RefSeq	NP_648668.3	5e-131	50.51%	CG34400, isoform C [Drosophila melanogaster]
NCBI nr blastp	gi\|221331142	1e-129	50.51%	CG34400, isoform C [Drosophila melanogaster]
NCBI nr blastx	gi\|221331142	2e-138	51.01%	CG34400, isoform C [Drosophila melanogaster]

Group
Gene Ontology	GO:0005515	2.3e-27	protein binding
KEGG pathway	bfo:BRAFLDRAFT_131151	3e-12
	K08018 (RAPGEF2, PDZGEF1)	maps->	MAPK signaling pathway
InterPro domain	[372-484] IPR001478	2.3e-27	PDZ/DHR/GLGF
Orthology group	MCL15343		Single-copy universal gene

Nucleotide sequence:

>DPOGS211139-TA
ATGAGGTCGGGGGAGGGCGAAGGCTCGGAGCTGGCGGAGTTCGGTGCTCGCTGGCCGCCGCCCTACACTCAGGGCTACGGCTGGCGCTCCGCCACGCCGCAGCATCCGCCTGCTCACCACCTCGCGAGACATTCGCGGTCACAGCAGGACAACCGGCACACTAGCTACGAGGCTGAGGACGCTCGCGCCAGAGCGCGCGGCGGCGTCTACTATTCCCCGCCGGGCACATCCTATACCATTGTCGAACGACCGGCCTCCTCACATGGCCACCACACTCCATACTCTCAACACCACTACTCGGGGAAACTATCGAGAACACCATATCTCGGTTCTACTACTATAGCAAACACTGCAGGGGCGACGAGTTTAAGAAACAGTACGAACCATTTAAGCGCCAACGGTAAGAAACGGCCAATATCTCCGGAGCAGGTGCTTCGTTTATTCGGCCAGGGCGGAGCGGCTGCGTTAGGCAAGGCTCTACCGCCGTCACATCCGCCTGCACCGCTACCCGCACCGCTGCCTGCGCCCTTGCCGGCGAGGAGGCACTCGCCCGCCAGCAGTCCCAGCAGTACAACACACCATGCAATATATCGTGGCGGAGAGAGGGAGCGTCCGTACTCGTCGGGCGGGGCGCCGCCGCCGCCGGAGCCGGCCACGAGGACGGTCACCATGAGCAGGGACCCCGCAGACTCGCACGGCTTCGGCATCTGCGTTAAGGGGGGAAAGGAAGCTGGTGTGGGTGTGTATATATCGAGAGTGGAGGAAGGCTCTGTAGCTGAGAGAGCAGGCTTACGACCGGGAGATTCTATTCTCCAAGTCAATGGGACGCCCTTCTCTGGAATATCACATGAGGATGCACTTAAGATGCTCAAGTCGTGTCGCCAGCTGACTATGGTGGTTAGAACGGCTGGTGCGTTAGTTGGTAGGGCTTCCTGTTCTTGGATGGATCGATACGGCAGGCCAGCCTCGCCACCACCACAACGACCCCTGAGATCTGCAAGCAAGGATCGCTCTATACGGAGGATGCTCAAGTCGTGTCGCCAGCTGACTATGGTGGTTAGAACGGCTGGTGCGTTAGTTGGTAGGGCTTCCTGTTCTTGGATGGATCGATACGGCAGGCCAGCCTCGCCACCACCACAACGACCCCTGAGATCTGCAAGCAAGGATCGCTCTATACGGAGGGTGGATTTGTGTATCGAGCCGGGGCAGTCACTCGGACTGATGATTCGCGGAGGTTTGGAGTACAACCTTGGAATATACATCACAGGGGTTGACAAGGATTCTGTAGCTGACCGGGCGGGACTTATGGTCGGCGACCAGATCTTGGAAGTGAATGGACAGTCATTCGTAGATGTGACTCACGACGAAGCTGTCGCCCAGCTGAAGTACCATAAACGAATGTCTTTGCTAGTGAGAGATGTTGGAAAAGTTCCTCACGCTTGTACTGCTTATGGAGAACGAGATGCTGCCCCTAGAATAAGCGGCTGGGGTAAAAGAAGAGGTGCGGCTGCAACAGCTGTCGAACAGAAGGCAAAGTCGTTGTTACCTCAAAGCGACTTGCCCGCGCTGGCATATTACATGGAGGAATACGCCAACAGAAGACTCACAGCTGACGCATTCCTCACAGTTTTAAGAGATTTACTCGACACACCCCAAAAATATTCCCTTCTGACGGAAATCCGGGAGTTTTTACTTCCTGAGGACCGGCCTCGTTTCGACGAGCTCGTGTATAGACGCCCCGAGGACGGTACAGAACACCATGTGAAGCGAAGTGGCGAACGACACATGCTGCCGTCGTCAACCATGCACGACCTCCACGACCCGGAGGCGCCGGCTGAAGTGCCCCTCGTTGTGGATCACCGCTCGCCCTCCGAGGACTCCGGCTTGGGCCTCCCGCCTCATGACCAGGCTTACAGGAGCGGGCGCGCGTGGTGCCCTGGGGACCCTGCGCCCCCACCGCCCAAGCCGCCGGACGAAGACCTGGAGCCTCCGCCCGAGGTGAATTTGCCAGAGTTACCTTCCACACTTAATCAAGTTCTACACGTTTACCTCTCTATGCCTTAA

Protein sequence:

>DPOGS211139-PA
MRSGEGEGSELAEFGARWPPPYTQGYGWRSATPQHPPAHHLARHSRSQQDNRHTSYEAEDARARARGGVYYSPPGTSYTIVERPASSHGHHTPYSQHHYSGKLSRTPYLGSTTIANTAGATSLRNSTNHLSANGKKRPISPEQVLRLFGQGGAAALGKALPPSHPPAPLPAPLPAPLPARRHSPASSPSSTTHHAIYRGGERERPYSSGGAPPPPEPATRTVTMSRDPADSHGFGICVKGGKEAGVGVYISRVEEGSVAERAGLRPGDSILQVNGTPFSGISHEDALKMLKSCRQLTMVVRTAGALVGRASCSWMDRYGRPASPPPQRPLRSASKDRSIRRMLKSCRQLTMVVRTAGALVGRASCSWMDRYGRPASPPPQRPLRSASKDRSIRRVDLCIEPGQSLGLMIRGGLEYNLGIYITGVDKDSVADRAGLMVGDQILEVNGQSFVDVTHDEAVAQLKYHKRMSLLVRDVGKVPHACTAYGERDAAPRISGWGKRRGAAATAVEQKAKSLLPQSDLPALAYYMEEYANRRLTADAFLTVLRDLLDTPQKYSLLTEIREFLLPEDRPRFDELVYRRPEDGTEHHVKRSGERHMLPSSTMHDLHDPEAPAEVPLVVDHRSPSEDSGLGLPPHDQAYRSGRAWCPGDPAPPPPKPPDEDLEPPPEVNLPELPSTLNQVLHVYLSMP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: