MonarchBase - Protein-coding gene

DPOGS204642
Transcript	DPOGS204642-TA	2160 bp
Protein	DPOGS204642-PA	719 aa
Genomic position	DPSCF300277 + 232685-253948
RNAseq coverage	578x (Rank: top 22%)

Annotation
*Heliconius*	HMEL009454	2e-109	59.50%
*Bombyx*	BGIBMGA009471-TA	3e-78	59.71%
*Drosophila*	Graf-PF	4e-133	44.41%
EBI UniRef50	UniRef50_UPI0002062588	0.0	43.34%	UPI0002062588 related cluster n=1 Tax=unknown RepID=UPI0002062588
NCBI RefSeq	XP_001122822.1	0.0	45.84%	PREDICTED: similar to Graf CG8948-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|383860815	0.0	45.92%	PREDICTED: rho GTPase-activating protein 26-like [Megachile rotundata]
NCBI nr blastx	gi\|350414689	0.0	46.64%	PREDICTED: rho GTPase-activating protein 10-like [Bombus impatiens]

Group
Gene Ontology	GO:0007165	1.1e-54	signal transduction
	GO:0005622	1.1e-54	intracellular
	GO:0005515	5.2e-16	protein binding
	GO:0005737	1.1e-11	cytoplasm
	GO:0046847	2e-06	filopodium assembly
	GO:0017124	2e-06	SH3 domain binding
	GO:0008093	2e-06	cytoskeletal adaptor activity
KEGG pathway	mmu:78514	9e-128
	K13736 (ARHGAP10)	maps->	Bacterial invasion of epithelial cells
InterPro domain	[369-542] IPR000198	1.1e-54	Rho GTPase-activating protein domain
	[359-550] IPR008936	3.4e-45	Rho GTPase activation protein
	[663-719] IPR001452	5.2e-16	Src homology-3 domain
	[22-225] IPR004148	1.1e-11	BAR
	[37-216] IPR013606	2e-06	IRSp53/MIM homology domain (IMD)
Orthology group	MCL10369		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204642-TA
ATGGGCGTGGGCCTGCAACCGCTGGAGTTCACCGAGTGCCTGGCAGACAGCCCGCACTTCCGAGAGAACCTACAGCGTCATGAGAAGGAGCTGGAGCGGACCAGCCAGCAGATCAAACGTCTCATCAAGGAGGTCAAGGATGTCGTGCAAGCCGCCAAACGTCTGGGTGCGGCTCAGCTGGCTTTGGCGGCCAGTATGGAGCAGTTCGAGTTCGCGTGCATCGGAGCCTCTATGACTGAAGATGAGAGGGTCATCGGAAGATCCTTGCATCACTTCGCTAACCTCATCAGAACTATAGAGGATGAAAGAGATAGAATGCTGGGTCGAGCACACGAGCAAATTATACAGCCTCTGGAGAAGTTCAGGAAGGAACATATTGGTGCTGTTAAGGAAGGCAAGAAGAAGTTTGACAAAAAGACTGCAAAATTCTGTCAGAGTCAAGAGCGCACTTTGTCGCTATCAACCAAAAAACCAGAAGCTGTCTTCCAAGAAGCCGATGCGGCGATGGATATGGCGGAGCGCGACTTCTGCCAGGCGTCCCTGGAGTACGTGTTCCAGTTGCAGGCCGTCCAGGAGAGGAAGAAGTTCGAGCTGGTCGAGACGCTGCTGGGGTTCGTGTTCGGCTGGTGGACCTTCCATCACACGGCGCATGACGTGCACGCTGACGCCGAGCCGCTCGTCAGAGACCTGCAGCTCCGGATACAGAGGACGAGAAGTAACTTTGAAGAGACCAGCAAACAGACGGAGTCGCTGATGAAAAAGATGATGGAGGTCAGGCAGATGGCGTTCGGTACTACCTGGAGCAAACAGTACTGCACATATGAGAAGATGACGAGCACACTCACACTGATGCCATACAACCAGATTAATGTAAAGACGGCTGGTCCCGTGGAGAGTGTGGTGGTGGTGGGAGCGCGGCCCGTCACGGATGCCGAGAGGAGGTTCTGCTGGGAGGCTCTGGTGGAGGAGAAGCCTCCGCTGGCGCTGCAGGCCGCCGCCGACCGGGAGCGCGCCGCCTGGATCAGGACGCTCAGGCGGGCCGGCGCCCCGCACACGGACACGCCCGCGCCCAGGGCCAGCGACGGCGAGCTCTGGCCGCTCGACGACGCCGGCTTCGAGTTCGTCAGGAGGCTGGCGACTGAGCTTGAGGCCCGGGGGCTCGACGACCAGGGACTGTACCGGGTGGCCGGCGTGTCGTCCAAGGTGTCTCGTCTGGTGTCCCTGGGTCGCTCGGGGCGCTTGCCCCCGTCGCTGGAGTCGTTCGAGTCCCGCACGCTCACCTCCGCCCTCAAGAGCTACCTCCGAGCGCTGCCCGACCCTCTGCTCACGCGACGCCTCCACGACGACTTCCTCGCCGCCGCCAAATGCGAGCGTTCCTCGGAGCGCGTGTCCCGCCTGTACTCGCTGGTGCGCGCGCTGCCGCCCGCCAACCGCGCCATGCTGCAGCTGGTGCTGGCCCACCTGGAGCGCGTGGCGGCCAGGAGTGACGTCAACCTGATGACGTCATCCAACCTCGCCGTGTGCTTCGGGCCGACGCTGTTGAGAGCGGAGCGGGAAACCGTGGCCTCCATACTGGAGCTGAAGTTCTACAACGTGCTGGTGGAGGCGCTGCTCGACAATATATCCGCGGTGTTCGCGCCTCTCCCGCCCGCCGCTGTGCCGCCCGCTGAAAACCACAACGGTATCGCTGGAACATCTCCGTCTTCGATACCTCTCGCATCTCGCAATGATATTAGTGTGTGTGACCGCTCCCTGGTGACGTGTGGGGGTTCAAGTGTGTCAGACGTGGGTGTCTCTGGAGCCGCGGTAGGGAACTACTCCCCGCATCATCACCAACTGTTGCAGCACTTCTCGAACGCACACACACGTGTTGGTCGTTGTAGCAGCAGTTCGGAGTCGGTGTCGAGTCACAGCGCCTCCCCCCCACCCCGCGCCCCGCTCACACACAGCATACACAACCCTTCGCTCGCCTTCCCGCCGAGGACCGCGCGTGTGCGGACCTTGTACGCGTGTCTGGGCGAGAGCGAGGGCGAGCTGTCCTTTGAACCGAACCAGATCATAACGAACGTGTCTCCGTCCGCCGAGCCCGGCTGGCTGAGGGGCTCGCTCAACGGGAAGAGTGGCCTCGTGCCGCAGAACTATGTGGAGCCCCTGCCTTAG

Protein sequence:

>DPOGS204642-PA
MGVGLQPLEFTECLADSPHFRENLQRHEKELERTSQQIKRLIKEVKDVVQAAKRLGAAQLALAASMEQFEFACIGASMTEDERVIGRSLHHFANLIRTIEDERDRMLGRAHEQIIQPLEKFRKEHIGAVKEGKKKFDKKTAKFCQSQERTLSLSTKKPEAVFQEADAAMDMAERDFCQASLEYVFQLQAVQERKKFELVETLLGFVFGWWTFHHTAHDVHADAEPLVRDLQLRIQRTRSNFEETSKQTESLMKKMMEVRQMAFGTTWSKQYCTYEKMTSTLTLMPYNQINVKTAGPVESVVVVGARPVTDAERRFCWEALVEEKPPLALQAAADRERAAWIRTLRRAGAPHTDTPAPRASDGELWPLDDAGFEFVRRLATELEARGLDDQGLYRVAGVSSKVSRLVSLGRSGRLPPSLESFESRTLTSALKSYLRALPDPLLTRRLHDDFLAAAKCERSSERVSRLYSLVRALPPANRAMLQLVLAHLERVAARSDVNLMTSSNLAVCFGPTLLRAERETVASILELKFYNVLVEALLDNISAVFAPLPPAAVPPAENHNGIAGTSPSSIPLASRNDISVCDRSLVTCGGSSVSDVGVSGAAVGNYSPHHHQLLQHFSNAHTRVGRCSSSSESVSSHSASPPPRAPLTHSIHNPSLAFPPRTARVRTLYACLGESEGELSFEPNQIITNVSPSAEPGWLRGSLNGKSGLVPQNYVEPLP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: