MonarchBase - Protein-coding gene

DPOGS212031
Transcript	DPOGS212031-TA	3159 bp
Protein	DPOGS212031-PA	1052 aa
Genomic position	DPSCF300054 - 267713-289769
RNAseq coverage	404x (Rank: top 30%)

Annotation
*Heliconius*	HMEL003708	0.0	72.73%
*Bombyx*	BGIBMGA005351-TA	1e-28	26.56%
*Drosophila*	CG43102-PC	0.0	44.25%
EBI UniRef50	UniRef50_Q7QFT4	0.0	46.73%	AGAP003854-PA n=2 Tax=Culicidae RepID=Q7QFT4_ANOGA
NCBI RefSeq	XP_001998429.1	0.0	45.16%	GI23633 [Drosophila mojavensis]
NCBI nr blastp	gi\|383861771	0.0	47.59%	PREDICTED: uncharacterized protein LOC100877669 [Megachile rotundata]
NCBI nr blastx	gi\|328792136	0.0	47.60%	PREDICTED: hypothetical protein LOC413562 [Apis mellifera]

Group
Gene Ontology	GO:0005622	5.9e-49	intracellular
	GO:0035023	5.9e-49	regulation of Rho protein signal transduction
	GO:0005089	5.9e-49	Rho guanyl-nucleotide exchange factor activity
	GO:0005515	3.1e-12	protein binding
KEGG pathway	xtr:100170186	2e-30
	K04436 (MAPK8IP3, JIP3)	maps->	MAPK signaling pathway
InterPro domain	[47-273] IPR000219	5.9e-49	Dbl homology (DH) domain
	[432-466] IPR011993	3.1e-12	Pleckstrin homology-type
	[873-898] IPR015943	3.8e-06	WD40/YVTN repeat-like-containing domain
Orthology group	MCL11568		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212031-TA
ATGAGTCGTGAGTCTCTGAAGTTGAAGTTCAGCGATCAACGGGCGGCCCTTAGTCTGTCCTTCCACGGTTCTGAGTCTGATGATGAAATTACTGAGAGGAATATCAGGAGATCTAGAAGCGGCACCGGCACAATGAACGCTGCGGCCCTACCCTCGATATCCGCCGGCCTACCGTCGGCTTTACTTGCTGCTCAAGACACACGGACACACGTGGTCGTCGAACTTTACGAGACGGAAAAATCTTATGTGGAGGCGCTCGAAAACTTAGTCAAGAAATACCTCCAACCGCTTAAAAGTCCAGAGAACGCTGGACTCTTAGATGCCTATTTGGTGGATGAAATATTCTACCAAGTACCGGCTATCCTCAACGTGCACCAAGTATTCCTCGAACAACTGAGGCTAAGACTTGAGCAATGGGACCTCCAGCAAAAAGTTGGGGACGTGTTCCTCGAAGTGTTTACCTTTGGGTGGCATTACCTGTGGATCATGTCCTTTATCAACAACCTGAAAAAGGCCAAGGAAACGATAAAATCCGCAGCGGCATCGCGACCTGCTTTTGCAAAGTTTTTGGAAGCACGTGCAAGAGACCACAAGGGAAAGTTGTCTTTAGACAATCTCTTAATAAAGCCAGTACAGAAGTTTCCAAGCTATAAGCTTTTGATTCAAAGATTGATTAAACACACAGAGCAGTCGCATCCTGACCACAAACTATTGTTGGAAGCTCAGAGGGAGATTCACGATCTCTTGGAACTTATAAATTGTACTGAAAGAGAAAGTCTCGAACAAGAACAACAGCAACAGACTCTGAGGGAATTAGAACAATTGATAGAAGGTCTCTCTAATTTAGTGTCGGCTGATAGAACATTCATTAGGCACGAGATGGTTACAATGCCGTCAGCGCAAGGAGCTGTTAAAGACAGAGCTTTATTCCTCTTTAACGACACTCTTTTGATAACAAGTGTCAAGAAAAGGACTGGTACCATAAAGAAACCGATTCCGACATACCAATGCAGCATCGCGAGTCAAATGGAAGGGAACAAATATAAGCTTCTGATGAGGATATCTCTCGGAGACTTGGAAATCGTGAAAGGAAAAGACGAAAACATGAGACGCTTAATCCATGAAGTGGAAACACTTACAGAAGATGTCAATACATTGACTGTTATATCAGAACAAGTGGCCGCTCTACACACCCAGCATCTTCCTTTAGAAGAGCTGGTCAGAGAAATGTTACAATCGGCCAATAGACAGCTATCTGAGAGACAGAATTTTGATAATCAACTATGCTGTATGGAACTAACTTTGAATACCTCAAACGTCCCAGAGAATTTGACGGTGATATTTGCTAATTCGGAAAAGAGGAGCAATTGGGAGGAACTCATAAACGAGACGAAGCAGAAGCTATATATGTACGGCCCAGAGCGTCCGGCGCCCGAGTTTCTCTCCCCTGTCCCTATAAGGAAGACGAGAGCCGGCCTACAGTTCACATGCGCTGCCCCTACACTACCCCCGAAAGGACAACCGCCTGATGTTTGGGTTTGCAACAGCGACGGGTATGTCGGTCAAGTGTGTGTTCTGACTTTGAATCCTAAGCCGCAAGTGACATCTTGCAATGGCGTCTGTAATGCTAGGATCGTATGCGTTGCTTGCGTACCACCCGCACCGGCCCTCGTTCGCCAGCAGACATTAGACATACCGAGTACCAGCTCGTTGAACAGTTCCGGTAATAAGCCTGGTATAAGTATTTCTGATGCTGATGAAAGCTGCAAGAATATACGTCTTGACAGCTCATCATCTAGTGAAGACGAGGACGATGGCTCGTCCACCAGCGAGAATCAAGACGCCCAGTCCGAAAGAAGCCAGGACTCTGTTCGTCTGCACAGCCTCAGTGCGATCGGGGCCAGGGCGACGCTGACGCCTAACCATAGCAAGAGTCTGAGCACGCCTCACACCGGACAGAACATACCGATACACCCAGTCATGAAGTCCAGCTCGAATCCCGCTGTCGACAAACAGGCTATGGGAATCACATCCGGCACATTATCGTCACCAGCCAGTCGCCAGTCCTCGGAGGACAACGCTACGAATCAGCCAACAATGTGGCTCGGGACCGAAGACGGCTTCATTCACGTCTACAACTGCATGGACAACATACGCATCAAGAAGAACAAGATTAAGCTACAGCACAGCGCCTCTGTGATATCCATCAAATACGTCGAGGGTCAAGTGTTCGTGTCTCTTGGTAACGGTGAATTGGTCGTGTATAACAGAGATATTGATGGTACATGGTCAGAGCGCGCTACGCTGGTGGTAGGTGGTAGCTCTAACCCAATATCCGCCATGTTGGTGGTCGCTACGCGTCTCTGGTGCTCAACACAGTCCTACGTTAAAGTCATCAATCCGCATACGCTGCAGGAGGACGGTTCATTTCAAGTGCCCACTCACAGTCGTCAGATCAGTCACATGGCCATCTCCGGTAACACCATATGGCTGGTGCTCAACCCGACGCATAAACAGTCGCAGGAGGACGATACATTCCACGTGACCACAGACACTCGTCCCATCAGTCATATGGCTGTTGCCGGCACCTCTTTGTGGATGGCCCTCAACACGACTCCCCAGCTCCGATGCTATCAGACAAATTCCAAGGAACTGCTAGCTGAACTGAGCATCACAGCGCCCGTCACTAAAATGCTGCATGGATGCGACGACATTATCCGCCAACATAAGGCGGCTTGTCTGCGAGTGACGGCTTTATTGGCACATCGAGATACCTTGTGGGTTGGAACGTCTGCTGGCGTGTTGCTCACAGCGCCGCTACACAACTCGCCCAACACACGAACCGGACAGTTCACTGTGCCACAACTCACCGGGGTGACTTACGGTCACACTGGACATGTTAGATTTTTGACAATCGTCGAAAATCCAGTTCCGCATAAGCCAACAACGAAACCAAGCACGAGCTTGAAGACGAAGGCTCTGAGTCGACGATCGACGAACGCTGAGAAACTACAGAAGCAGACAGAAAGCAGCCCGAACAATAAGGAGACTTTGGTGATATCTGGAGGGGATGGCTACGAGGACTTCAGGACGTCCTCCATGTCCGAGGACGCGGGGCGAGAGGACTCCACAAATCACCTGCTATTTTGGAGGGTATGA

Protein sequence:

>DPOGS212031-PA
MSRESLKLKFSDQRAALSLSFHGSESDDEITERNIRRSRSGTGTMNAAALPSISAGLPSALLAAQDTRTHVVVELYETEKSYVEALENLVKKYLQPLKSPENAGLLDAYLVDEIFYQVPAILNVHQVFLEQLRLRLEQWDLQQKVGDVFLEVFTFGWHYLWIMSFINNLKKAKETIKSAAASRPAFAKFLEARARDHKGKLSLDNLLIKPVQKFPSYKLLIQRLIKHTEQSHPDHKLLLEAQREIHDLLELINCTERESLEQEQQQQTLRELEQLIEGLSNLVSADRTFIRHEMVTMPSAQGAVKDRALFLFNDTLLITSVKKRTGTIKKPIPTYQCSIASQMEGNKYKLLMRISLGDLEIVKGKDENMRRLIHEVETLTEDVNTLTVISEQVAALHTQHLPLEELVREMLQSANRQLSERQNFDNQLCCMELTLNTSNVPENLTVIFANSEKRSNWEELINETKQKLYMYGPERPAPEFLSPVPIRKTRAGLQFTCAAPTLPPKGQPPDVWVCNSDGYVGQVCVLTLNPKPQVTSCNGVCNARIVCVACVPPAPALVRQQTLDIPSTSSLNSSGNKPGISISDADESCKNIRLDSSSSSEDEDDGSSTSENQDAQSERSQDSVRLHSLSAIGARATLTPNHSKSLSTPHTGQNIPIHPVMKSSSNPAVDKQAMGITSGTLSSPASRQSSEDNATNQPTMWLGTEDGFIHVYNCMDNIRIKKNKIKLQHSASVISIKYVEGQVFVSLGNGELVVYNRDIDGTWSERATLVVGGSSNPISAMLVVATRLWCSTQSYVKVINPHTLQEDGSFQVPTHSRQISHMAISGNTIWLVLNPTHKQSQEDDTFHVTTDTRPISHMAVAGTSLWMALNTTPQLRCYQTNSKELLAELSITAPVTKMLHGCDDIIRQHKAACLRVTALLAHRDTLWVGTSAGVLLTAPLHNSPNTRTGQFTVPQLTGVTYGHTGHVRFLTIVENPVPHKPTTKPSTSLKTKALSRRSTNAEKLQKQTESSPNNKETLVISGGDGYEDFRTSSMSEDAGREDSTNHLLFWRV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: