MonarchBase - Protein-coding gene

DPOGS208152
Transcript	DPOGS208152-TA	3423 bp
Protein	DPOGS208152-PA	1140 aa
Genomic position	DPSCF300058 - 52992-70746
RNAseq coverage	288x (Rank: top 38%)

Annotation
*Heliconius*	HMEL011082	0.0	72.66%
*Bombyx*	BGIBMGA013771-TA	0.0	77.10%
*Drosophila*	CG10188-PA	2e-153	44.19%
EBI UniRef50	UniRef50_D6WQX0	0.0	43.61%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WQX0_TRICA
NCBI RefSeq	XP_002423205.1	0.0	41.63%	Rho/RAC guanine nucleotide exchange factor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|270010070	0.0	43.61%	hypothetical protein TcasGA2_TC009420 [Tribolium castaneum]
NCBI nr blastx	gi\|270010070	0.0	43.20%	hypothetical protein TcasGA2_TC009420 [Tribolium castaneum]

Group
Gene Ontology	GO:0005622	2.7e-51	intracellular
	GO:0035023	2.7e-51	regulation of Rho protein signal transduction
	GO:0005089	2.7e-51	Rho guanyl-nucleotide exchange factor activity
	GO:0005515	1.2e-30	protein binding
KEGG pathway	bta:505940	6e-68
	K12791 (ARHGEF2, GEF-H1)	maps->	Pathogenic Escherichia coli infection
InterPro domain	[351-746] IPR015721	4.1e-75	Rho GTP exchange factor
	[339-566] IPR000219	2.7e-51	Dbl homology (DH) domain
	[568-701] IPR011993	1.2e-30	Pleckstrin homology-type
Orthology group	MCL14212		Single-copy universal gene

Nucleotide sequence:

>DPOGS208152-TA
ATGGGGTTGCAGAGTGCGTTGAACGGTCACAGCGCTTCACTATCATCTATGGAGTCTGAGGGGGAGGTGTCACGGCCAGTACGACATTCAACTCACTCGTTGAATGACAACGATTTAGCTAAGGAGTTCGAGAAGGTAACTGCAGCATTACGTGCTGCCGCTGACACCAGCTCCAGCAGACTGCTGCCACGTCTGCCGCTGCAGAAGTCCGTCTCCACACCGAGCATCGTGGCCGCCGTACATCCGACACAACCACCCCCAGCCGCCAATATTCTGTCAGCGGGTGGTGCGAGCGAGACGGAGAGTGACGACGACACGTCCGCGCCGGTCGCCAACCAGCCGAGAAGGAATAACACTCAGGAGCACCTCGGCTTACATCGGCTGGCGTTCTTGGAACAAGCCGCCTTCGACCATCACGCTGAGAAACGCCGTAAGAGAGGAAGCTTGTTCTTTAGGAAGAAGAAGGACAAATCTCGCAAGGCCTCTCACGTGTGGTCGGCGGCCGCGGCTGGTGGTGCATGTGATTGGTGCGCGAGGGACCTGGCGGACAAACCGGCTCTGTACTGTGACAATTGCACTATGACGGTTCATCAGAACGTTTGTAAGGACTACATTGTTGAATGCAATAAACCAAAATCATCCAAGACGTCCGTGGGCAAGTCGCTAAGCGCCAGTAGCGGTAAAAGCAGCAAACGCAGTTCCGTTTCCGGTCAATCACAGAACTCTAACAGCAATCCAAATCCCCTACTACAAGTGAAGGGTATAGGCGTGTGTGTATTGTTATTGTTCAGTAAGAAGCAGTCTTCCGGGTGCTACTCTCCGTGGCGTCGCGTGGCCACCAAGCTCGGAGTACACACGAGTCATATTTATAATGACGATAAAGACGGATCCGATCACAAGCACGATCAGAGCAATGCATCAGACGACGCTTCCACTGAATGGCCGGAGGTTTATCTGACAGCGGAACAGTTAGGTGATGAAGCGATACAGCTGGGCTTGGGGGCTGTCGAACCTGACACCTGGGCAGCTGGAGCACCTAAAGGACTTGCTAAACAAATCGGCGACAGAGAGACCAAGCGCCAGGAGCACATATATGAACTAATATTAACCGAAAAACATCATTGCCTCACCGTGAGGCTCATGCAGAAGATGTTCGCCGATGGTCTATCTCGTCTTGGAGGCGTGTCTTCATCACAGGTCTCCCGTATGTTTCCTCGTCTGGATGAACTATGGTCGTTGCACGCGGCGTTGCTCGCACGACTCAGGGCTCGCCAGCGCGTTGGCCCACGAGTGGCCAGCATCGCCGATATATTAGCGGATACGTTCGCAGCGCCACATCACCAAAGGCTGAAGGCTGCATATGGTGAGTTCTGTTCGCGTCATCGTGACGCCGTCGAGGTGTTCAAGGATGTCTGCGCGAGGGAGACGAGGGTCGCACGGTTCATAAGGAAATGTCAACAGAATCCACTACTCAGGAAGAAGGGTGTTCCCGAATGCGTGTTGTTCGTGGCACAGAGACTCACAAAGTATCCCCTACTATTGGAACCGCTCCTCAAGACCGCGGGTGACGATGCACACGAACGTGAACTATTACAGAAAGCACTGTGCGGTGTGAAGGAAATTCTAGTCGACGTTGACAACCAAGTGGCGGCAAAAGAGAGAGAAGACAGGAAACTGGAGATATATCATCGTATCGATGCAAAGTCCTTCGCCAATTATCGCGGACGGAAGTTTAAGAAGAGCGACATCCTGCAAGGGAATAGGAGTCTTACATTCGAAGGTGTAGCGACTTTGATGCAAGGTAGGAGTAAAATGCAGACGCTCCTAGTGATAGTGTTGACGGACGTGTTGTTCTTCCTTCACGACAACAACAACAAATACACTTTCTTCACGCCTGACAATAAGACTGGTGTAGTATCTCTATGGAAGTTGTTAGTTCGCGAGAAGGCCGGAGCCGACGGCCGAGGCCTGTACCTCATATGTAGCGGGCCGCCTGGACCCGAAATGTTCGAACTAAGAGTTCATCGACCCAAAGACATCGCTCAATGGATACGGGCTATACGAGGGGCAGTTCAAAGCTGTCCCGAAGAAATAGAAGAATCTGAAGCTGGGAGTACCGTGACGTCAGCAGAAGAGAGACAGAAACAGTTGGAGGCGAGGCATGAGAATATAAGACTGATTACAGAGGCTTTGAGGGCAAAGGACAGAGAGCAGGCGCAATTGTTGGAAGAGAAAATGGTGTTGCATATGAGGATGGTCGGACACACCGGGAGTTCCGCCTTAGATGTACCCAGCACAGGTGTGCCCCCCTGTCCCGGGGGATTGTCGTTCCCGGAGTACGTCCGTCTATCAGGACCCACGCCAGACACGCACGCCTTATGGCAGGAAGTCTGCAGGGTCGTTCAGGATGCTCTGGAGGCGTCGTCCCTGGGCTGGTCGTCTCTCAGCGGCGTGTCTCTGGGGCGAAGCACGAGCTCGGCGGGTGAGAGGCACTCGGTCCACTACACCAGCCCCGCTCTGCCGAGGAGGGCGGACACCTTCGCCGGCTTCGACGCGCATAGAGGGGGTGTGTCCGTACGTCTGTCGGCGTCGGACGTTCCCAGCGAACCGGAAACGGAAGCCCAAATGCACGCTCGGATCAAGGACGAAGCGAACGCTGCGCTGAAACTACAACATGCCATATACACGCTCACCTGTATAGTGTGGCAGCAGCTGACCACCATACACAGCCTGGAGGCGCAGGTGTGTGCGTGGAGGGCGTGCGGGGGGGCGGGAGCGGCCGCGGTGGGCGGGCGGGCACACGACGCGCAGCTCGAGGAACTGAGGCACGCACAGGCGAGGCTCACGGCGGAGAGGGCGGCCTGGGAGGCGCAGAGGACGGCCGACAGGGACGCGCTGGAACATGATCGTAGACAACTACAGGCAGCGCGAAAGGAGCTGGAGGAACAACAGAAAGACGTTGAACAACAGAGAGAAAGGCTCTACAGGCGCCTGGAGAGATTACAACAACACGGTGGCGGATCTCAAGAGGAAATAGCTAGCGTTGGAACTCTGTCGCCTGATTCAAGTGTCAGCGATACCAACAGAAGGAAAGAACCAAAATGGAGAAATAACCGCGGTTCAACCGGCTCGGAGTCGTCGTTGAGCGCCTGCAGCGTCCGCGGCGCTGCACTGCCACCGCCACAGCTGCTGTCGGCGCACAACGAGACGAGAGCCACAGCGCGCGCTCCGGTACAGGTGATGCGAGACTGTTCTAGTATGAGAACAAACACCTACCCAAAGCTGCCGGACAAGTTCCGCGTGCGATCTCCGGATGCCGCGCCCCCCTCGCAGGCCCCGCCCACCTCGCAAGCCTCCCCCCTCCCGCCGGCGGCCCCCATCCCCCCGGCGGCCCCCTCGGAGGAGGAGGTCATCTACTTCTGA

Protein sequence:

>DPOGS208152-PA
MGLQSALNGHSASLSSMESEGEVSRPVRHSTHSLNDNDLAKEFEKVTAALRAAADTSSSRLLPRLPLQKSVSTPSIVAAVHPTQPPPAANILSAGGASETESDDDTSAPVANQPRRNNTQEHLGLHRLAFLEQAAFDHHAEKRRKRGSLFFRKKKDKSRKASHVWSAAAAGGACDWCARDLADKPALYCDNCTMTVHQNVCKDYIVECNKPKSSKTSVGKSLSASSGKSSKRSSVSGQSQNSNSNPNPLLQVKGIGVCVLLLFSKKQSSGCYSPWRRVATKLGVHTSHIYNDDKDGSDHKHDQSNASDDASTEWPEVYLTAEQLGDEAIQLGLGAVEPDTWAAGAPKGLAKQIGDRETKRQEHIYELILTEKHHCLTVRLMQKMFADGLSRLGGVSSSQVSRMFPRLDELWSLHAALLARLRARQRVGPRVASIADILADTFAAPHHQRLKAAYGEFCSRHRDAVEVFKDVCARETRVARFIRKCQQNPLLRKKGVPECVLFVAQRLTKYPLLLEPLLKTAGDDAHERELLQKALCGVKEILVDVDNQVAAKEREDRKLEIYHRIDAKSFANYRGRKFKKSDILQGNRSLTFEGVATLMQGRSKMQTLLVIVLTDVLFFLHDNNNKYTFFTPDNKTGVVSLWKLLVREKAGADGRGLYLICSGPPGPEMFELRVHRPKDIAQWIRAIRGAVQSCPEEIEESEAGSTVTSAEERQKQLEARHENIRLITEALRAKDREQAQLLEEKMVLHMRMVGHTGSSALDVPSTGVPPCPGGLSFPEYVRLSGPTPDTHALWQEVCRVVQDALEASSLGWSSLSGVSLGRSTSSAGERHSVHYTSPALPRRADTFAGFDAHRGGVSVRLSASDVPSEPETEAQMHARIKDEANAALKLQHAIYTLTCIVWQQLTTIHSLEAQVCAWRACGGAGAAAVGGRAHDAQLEELRHAQARLTAERAAWEAQRTADRDALEHDRRQLQAARKELEEQQKDVEQQRERLYRRLERLQQHGGGSQEEIASVGTLSPDSSVSDTNRRKEPKWRNNRGSTGSESSLSACSVRGAALPPPQLLSAHNETRATARAPVQVMRDCSSMRTNTYPKLPDKFRVRSPDAAPPSQAPPTSQASPLPPAAPIPPAAPSEEEVIYF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: