MonarchBase - Protein-coding gene

DPOGS203274
Transcript	DPOGS203274-TA	3843 bp
Protein	DPOGS203274-PA	1280 aa
Genomic position	DPSCF300229 + 268765-277132
RNAseq coverage	41x (Rank: top 72%)

Annotation
*Heliconius*	HMEL021126	74.28%
*Bombyx*	BGIBMGA000454-TA	85.45%
*Drosophila*	RhoGAP100F-PD	55.52%
EBI UniRef50	UniRef50_E2AF34	50.13%	Rho GTPase-activating protein 100F n=8 Tax=Formicidae RepID=E2AF34_CAMFO
NCBI RefSeq	XP_971877.2	54.78%	PREDICTED: similar to rho-gtpase-activating protein [Tribolium castaneum]
NCBI nr blastp	gi\|189241104	54.78%	PREDICTED: similar to rho-gtpase-activating protein [Tribolium castaneum]
NCBI nr blastx	gi\|189241104	54.66%	PREDICTED: similar to rho-gtpase-activating protein [Tribolium castaneum]

Group
Gene Ontology	GO:0007165	3.6e-43	signal transduction
	GO:0005622	3.6e-43	intracellular
	GO:0005515	2.4e-16	protein binding
KEGG pathway	mmu:110279	2e-32
	K08878 (BCR1, BCR)	maps->	Pathways in cancer
			Chronic myeloid leukemia
InterPro domain	[880-1083] IPR000198	3.6e-43	Rho GTPase-activating protein domain
	[890-1084] IPR008936	9.6e-42	Rho GTPase activation protein
	[731-872] IPR008973	2.4e-16	C2 calcium/lipid-binding domain, CaLB
	[92-200] IPR001478	9.3e-16	PDZ/DHR/GLGF
	[737-851] IPR000008	3.5e-06	C2 calcium-dependent membrane targeting
Orthology group	MCL14588		Insect specific

Nucleotide sequence:

>DPOGS203274-TA
ATGATCATAAAAAAGGAAAATGGGCGCGCGGCGCCGGACTTGACGGCATCGCCGGGACGCGCGCCGCCCGGCCCGCCGCAGCCGCCCCGCGCCAACCACGCGCCGCCCTGCGTGCTGCAGCCAGACTTCCGCAAGGTATCGGGTGTCAGTAATGAAATATTCAGGCAAATTGAGATGGTGGAAAACGATCACGACACCACCACTGCAGCGGCGCTTGAGGCGGTGGAGCGACGCGGTGAGATGATTGTACGAATTCTTGAATTGAGACAAGTCGGAAGAAATAATGTTGAAGCCGCCAAAAAATTTTTTTCCTTACAAGATGCACGTCACATAGTTCAACTAGTGGAGATCGTGAAGCGCCCTGGTCAAACCTTGGGCCTTTATATACGAGAGGGAGACGGTGGTGCTAGGACTGATGGAGTATTCATATCACGAATAGCTCTCGAATCAGCGGTATATAACAGTGGATGTCTAAAGGTTGGGGATGAAATCCTGGCTGTCAACCTGGTGGATGTAAGACGCATGTCTTTAGACGATGTCGTGATTATTATGTCTATACCCCGCAGGCTTTTATTGTGCACTAGACAGAGAAAAGGAAAATCAGGCCCTGGTTCACCATCATTACCCAGATCTGAGCACAAACCACCTCCTGTTGTTGTTTTGAAAAGAGACTGCCGGGACGATGACGACCACGATAGAGTTGATGGACTTTATTCGCAACATGGTACCTTACGTTCAACGGGAGGTCCTGGAAGTTCTGTGAGACCAGTTGGGGATGGTAGAGAAGAAAGGAGTCGTTTACAACTTGGTGCATTATCACCAGATTCCACTCCACTTGATCTATATTACAATTCACGACCACCCTCCGATCATGCTACGTGGAGTTATCGGCCACCTCCGCCAGTTATTACGGAGCAACCTAAATCTACTGCAACACATTTTGTGCCATATGAAAGGTCTTATCCGAATACATTGGAAAGTCTAGCGGAAAAAGTTCATTCCTTTTACCCATCGGAGACTGGAGGCAGCAGTATGCGGTTTGGTGGAAGAGTTCCACGTTCTGGTTCTGAGCAACAGCTCCCAAGGGCCGAAACTCATTCTGACTTTGGCCGTCATTCACTGCTTCGGTCTAGTTTGAAAGCGTCAACTGCTGCAGGGCCAGGAGCTTCCAGTTTGACAAGATATGGACAACGTTACGGTGGAGTAGGAATGCCAGGTTCAGGATTACCTGGTAGTGGACTCACTGGCACGGGACTAGGCGGTACTGGTTTAAGTGGTTCAGGATTGCCTTCAGGGTTTTCTGCTACTGGCCTCAGTGGTTTGACTGGTTCCAGTTTAGTAGGGTCAGGTTTGGCAAGTTCTGGTCTTAGCAGTACGCTCACAGGAACTGGCCTAAGTTCAACACTTGGTGCAGGTTATGGCACTACAGGGCTAGGACTACCGTCATATGGAAGTAAATTTGGAACGACTAGAAGAAATCGAAGCTTGGATTACTCTTCTGATACTGAGGCAACAGCACCCACTAGAACTCCTTATTACTCAGGCTTGAGTGGTTACAGGAGTAGTACTTTAGGAAGGGACATAGGATCGAAATTTAATTCTTTACCAAGAGATGTCAGAGGAACTGGTCAAAGACTGGGACTAACTAGACGCACAGGGAGTGTACTTCAAGATGAACCTGAACCGTTGTCTTCACGATTAGACTTACGTTCCTCCAGAGGTCGCCTGCCTTCCTCTCCCTCAGTATTTACATCAGATGAATATCGCGCATGGTTATCTCGAGCTCCATCAACAAGTGCATTGTATGAAACACTTCGTCCTCGACTGCCTACACACTACTCAGCGGAAAATATACATGATGCGCTTAAGAATATGGAAAGTGGAAGTCGCTTTGGATCTTCTCTCGGCTTAGCTGGAAGGCGAATTGAAAGGCCTCGTCATTTACCAGCTAGATCGTTATCATCGCAACAGTTGGGACCGACAGCAAGCGGATCACCATCAGCTCGTCGTGTGAGACAGCTTCTTGAGTTGGGATCAAAATTTACATGCCCAAATCCAAGTCCTGTACCAACACCAGGTTCAAGACATCAACGACATCTGGATATAAACCCGAATGAGTTCCTAAAATATAAAGTGGATAAACCCGGTCAAGGAGGTTTATCATCGTCTATGACGGGTTTGTCTCGGCTCTCTGGAGGTGTCTCTGGTATGCTCTGGGTCCACCTTCTTGCTGGTAGAGGGTTGCGTCCAGCTCCTACTGGTTCCTCACCAGGCTCACCACCTTCAGGACCCCTTGCGCCACCACAACCTCCAGTAGCACCTCGTGATCTATATTGTGTCTTAGAATGCGATCGCGTACATAAAGCTCGTACAGTGGTTCGCACTGGTGAGTTGCAGTTTGATTGGGATGAGTCCTTTGAATTGGAGTTGGTTGATAACAGACAGCTAGATGTACTCGTGTATTCCTGGGATCCACAACACAGGCACAAACTTTGCTTTAGGGGAGCTGTGACTTTACCAGATTTATTAGCTCGTTCGCCATTTCATCAACTTGCTATAAAGATGGAACCGCGCGGGACGCTATACATGCGAGTCCGTCATACTGAACCACACGAGTTATTCCGTCGCCGCGTAGCGCCTTCTCGCATAGCTCCAGCACCGTTGTTTGGGGCTGAGTTAGAAGCAGTTGTGGCACGGGAATTGCGACCACCTCACGCACCACCTGTACCGTTGGTGGTAAGACGTTGTGTTGAAGAAATTGAGAGACGAGGCTTGGACATTATTGGACTCTATCGCTTATGTGGTTCTGCTAACAAAAAGCGTATACTTCGTGAGGCATTTGAGCGTAACGCACGTGGTGTTGAGTTGACACCGGACTCAGTTCCTGATATTAACGTGATTACTGGAGTATTAAAGGATTATTTGACCGAATTGCCACAACCTCTTATCAGCCGCTGTTTGTATCAAATGACGTTGGATGCTTTAGGCGTTTGTCTTCCCGATGATAAAGAAGGCAATGCTCGTCTCATGGCCTCTATAGTGGAATGTCTTCCACGAGCCGCAAGAGCTACTTTGGTCTTCCTGCTTGATCATTTAGCATTAGTTGTGGCTGCTCAAGATCGTAATAAAATGTCACCTCAGCATTTGGCTGTTGCTATGGCACCTCCATTAATGTTACATTCCCAGCCACCAGCGGAATTAGATTATCAGCGTCCAATACATGTACTCCAATGTCTTCTTCAAATTTGGCCTCCACCGAAACGTTCAGGCCGAGCTCCGCCCTCAGTCAGTCCATATCGGCATCAAGCGGCAGCATCAGCAGCATCTCCGCCGCCAGCTCTCTCGGGTCGTCCCGGAGTCGACCGCTCGCCGCCCGCACATGTTCTCTCATCAGTCAGGGGAGGCCAATATCGTCCGCAGTCGCCTCTTCGCGGCCCTCTGCCCGCTCCTCCTCGCTCCCGACAGGTGACGGTGTCATCTCCCGGCTCCCCCAGCAGTAGCTCCGGGAGCCACAGCCCAGCTGACACGATAAAGCATGGCGGCTCTGTGTCATCAATACTACGTCAACCGGAACGCGCGAGCTCTCCTCGCGTATCACCCAGACAATCACCTCGCGCATCTCCTCGGGATTCTCCGCGCGGGACACCAAGGGAGACTACGCCCCGGGAATCTCCTCGGCCTGCTATACCAGGAACGTCGGCCGGTCTGGCCGTGACTCTGAATTCCGAGCGGGGTTCGAGTCCACGCTACAGCTCCACCAATCCATTTCTGCAGCAGTATGATGCTGAGGAGGAGGCGGAGGCGTGGCGCGCTGCAGACATATTCTCATCCACGCACACATAG

Protein sequence:

>DPOGS203274-PA
MIIKKENGRAAPDLTASPGRAPPGPPQPPRANHAPPCVLQPDFRKVSGVSNEIFRQIEMVENDHDTTTAAALEAVERRGEMIVRILELRQVGRNNVEAAKKFFSLQDARHIVQLVEIVKRPGQTLGLYIREGDGGARTDGVFISRIALESAVYNSGCLKVGDEILAVNLVDVRRMSLDDVVIIMSIPRRLLLCTRQRKGKSGPGSPSLPRSEHKPPPVVVLKRDCRDDDDHDRVDGLYSQHGTLRSTGGPGSSVRPVGDGREERSRLQLGALSPDSTPLDLYYNSRPPSDHATWSYRPPPPVITEQPKSTATHFVPYERSYPNTLESLAEKVHSFYPSETGGSSMRFGGRVPRSGSEQQLPRAETHSDFGRHSLLRSSLKASTAAGPGASSLTRYGQRYGGVGMPGSGLPGSGLTGTGLGGTGLSGSGLPSGFSATGLSGLTGSSLVGSGLASSGLSSTLTGTGLSSTLGAGYGTTGLGLPSYGSKFGTTRRNRSLDYSSDTEATAPTRTPYYSGLSGYRSSTLGRDIGSKFNSLPRDVRGTGQRLGLTRRTGSVLQDEPEPLSSRLDLRSSRGRLPSSPSVFTSDEYRAWLSRAPSTSALYETLRPRLPTHYSAENIHDALKNMESGSRFGSSLGLAGRRIERPRHLPARSLSSQQLGPTASGSPSARRVRQLLELGSKFTCPNPSPVPTPGSRHQRHLDINPNEFLKYKVDKPGQGGLSSSMTGLSRLSGGVSGMLWVHLLAGRGLRPAPTGSSPGSPPSGPLAPPQPPVAPRDLYCVLECDRVHKARTVVRTGELQFDWDESFELELVDNRQLDVLVYSWDPQHRHKLCFRGAVTLPDLLARSPFHQLAIKMEPRGTLYMRVRHTEPHELFRRRVAPSRIAPAPLFGAELEAVVARELRPPHAPPVPLVVRRCVEEIERRGLDIIGLYRLCGSANKKRILREAFERNARGVELTPDSVPDINVITGVLKDYLTELPQPLISRCLYQMTLDALGVCLPDDKEGNARLMASIVECLPRAARATLVFLLDHLALVVAAQDRNKMSPQHLAVAMAPPLMLHSQPPAELDYQRPIHVLQCLLQIWPPPKRSGRAPPSVSPYRHQAAASAASPPPALSGRPGVDRSPPAHVLSSVRGGQYRPQSPLRGPLPAPPRSRQVTVSSPGSPSSSSGSHSPADTIKHGGSVSSILRQPERASSPRVSPRQSPRASPRDSPRGTPRETTPRESPRPAIPGTSAGLAVTLNSERGSSPRYSSTNPFLQQYDAEEEAEAWRAADIFSSTHT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: