MonarchBase - Protein-coding gene

DPOGS207428
Transcript	DPOGS207428-TA	3345 bp
Protein	DPOGS207428-PA	1114 aa
Genomic position	DPSCF300087 + 406651-435826
RNAseq coverage	374x (Rank: top 32%)

Annotation
*Heliconius*	HMEL005447	0.0	65.05%
*Bombyx*	BGIBMGA009325-TA	1e-128	66.51%
*Drosophila*	RhoGAP102A-PE	5e-87	31.70%
EBI UniRef50	UniRef50_D2A1J4	0.0	41.29%	Putative uncharacterized protein GLEAN_08395 n=3 Tax=Tribolium castaneum RepID=D2A1J4_TRICA
NCBI RefSeq	XP_002423816.1	1e-180	37.52%	hypothetical protein Phum_PHUM087100 [Pediculus humanus corporis]
NCBI nr blastp	gi\|270006226	0.0	41.29%	hypothetical protein TcasGA2_TC008395 [Tribolium castaneum]
NCBI nr blastx	gi\|270006226	0.0	41.07%	hypothetical protein TcasGA2_TC008395 [Tribolium castaneum]

Group
Gene Ontology	GO:0007165	4.1e-55	signal transduction
	GO:0005622	4.1e-55	intracellular
KEGG pathway	mbr:MONBRDRAFT_30343	1e-18
	K12490 (ARAP)	maps->	Endocytosis
InterPro domain	[651-841] IPR000198	4.1e-55	Rho GTPase-activating protein domain
	[652-846] IPR008936	3.1e-48	Rho GTPase activation protein
Orthology group	MCL16522		Insect specific

Nucleotide sequence:

>DPOGS207428-TA
ATGTCCGATGCCGGTCGCCGGCTCATCCCAGACGGCGCCCAGAACCGCGCGGACGACGTGCCGCGGATCGAGGCCTACTTCCAGGAGGTGTGCCAGCGGGAGCCGCGGTTTTTGCTGTGGAGAAAGAGCTCTTACCCGGGAGTGCTGCCGAAACCCCGACGCAAAAAGAGAGCGCGCGGTGGTTCTGTGAGGGCACGTTCGCCTTCGGATGACGCTCCGCCTCCACCCACGAGGCCCACCGATCTCTATATTCCTCACACCTCGGGTGGCCGCTTTGATATCGCTAAGCTACGGCGAGATTTTTTCGCAGCGCCTCCTCCTTCTCCGTCCTCCACTGGATTTCCTTCAGTCAGTGCTACTTTTAATACTAATAATAGTGCTATTAAGAATGGATGCCCGCATCCGTCTATTTCTGAGGATGATGAAGGAATTTTAGTAGATTTACTACGTAAGTACCTGAAAGTTGAAGATGCTAGGGATCCACCTCGTGTGTCAGAGTCTGAGGAACTTATCCGAGCTCTGCGTGACTACCTCAAACGTCTGTCGGAACGTGAGCCTACAGATTCCGATACAGATCCCACGCGAAGAATTCTCCGTGAAAACCTCGGTAGGTACTACCTCCGTTCTTCCAATAGAGACAATACAGTGCAAGATTTATTGAACGATAAAAATTTGTTGAAAAACCTGTACCATGACCTTCGTAAACCGAAGCCTTATCGTGGTGGCAGGAGTGGCGGTGGTCCGAGTTCGCTCGGGTCTAGTAGTGGGTTTAGTGCATCTAGTTCACGTAGCGTGTTTTTTGGCCGAAATTTTGGTGGTTCAAAGTTTAACGATGAGAACTGTTCATCACCACCAATGTCTCCTCCACCTCTTATTGAAGTTTACGGCGAATCGATGGAGGATAAACTCGTCGACGTTGGAACGCAAACACTTCCTATACCTGAGGAGGTATTACAGGAGCAGGAACGAAGTTATAGAGAAAAGTTGGAAGCCGCTACGGCCCCAACGAGTCCAACGAGTCCACCTCCCGAGAGAAGACCTCGGCGACGTTCCAGCGTGGACCACGACGACGTCTCACAATCAGTCAGCGACACCATCAAGCGGTATTTGAGGATGGCGCGCAAAAAGAGCGTAGACGCTGAAAAGACTGATCGCTTCAAGCGTATAAACTATGATAAAAACTTACGCAACATAAAACCTCGTCAGCAGGGTGACGTTGACGACGACGGGCCTCACAAGGGATGTCAAACAGATGAGGCTTGGATATTAACGTACAGAGATTTACAATTCGCGTCTGTAGCATCGACCCCGACCTCTCCTCCGTCCCCGTCTCAGTCGCACTCTTTTCTGTCAACCCTTTTGGGTCGAAATGCATCAATGGCTCCTAATGCAGGTGGCATGCAAAAGTCTCGGTCTTCGAGCAGCGTGGTCCAGAGCGTCAGTAAGCGACTCTGGCGCACGAGGAGCCGGTCTTCGAGCCGCGTCGCAGCATCATGGACGCCTCAGGGCAGTTGTTGCTGGACAGACGGCGCCGGGCGCTGCGTGAAGCTGACGGACACCTCGCTGCTGTCTCTCACGGAGGTGGAGAGGAGGGCGCTACAGCAGGCGGCACTGGCCAGGCTGCAGCAGCTCAACCTTGGAACTACTATTAAGATACCTGAGGATAACACGTCGACAGTAGCGACTAAGCCGAAGCGCCGCGCCTACCTTCTGAAAAGGAAGGCGCTCACCACTGGCTTCTTCGACCAGCGACCCAAGGACGCTGAGAAGGAGAAAGAGTCCACGGGCAGCGTTTTCGGCGTGCCGTTGTCTCAATGTGTGGAAACAGAACGAGCTCTGAGGAGACAACATGGAGGTTCCAGGGCGTCTCTGGCTTCCATTGGAGGCTTGGAGAAAGGAGACGATAGTGAATCGTGTGACTCCGGTGAGTGGGGCTGGTCAGGGGTGGACGAGGGCAACGGAGGGCCGAAGGTCCCCGCGTTAGTATCTTCTTGTCTGTCCCACCTCCGAAGGCACGGTCTCGACACACTCGGGCTCTTCAGAGTGTCCGCCTCTAAGAAGAGAGTGAGACAGCTCCGCGAGGAGTGGGAGCGAGGTCAGGAGGCAGCTCTAGACGCGGCAGTATGCCCCCACGACGTAGCCACTTTATTGAAGGAATTCCTCAGGGATTTACCAGATCCATTGCTATGCAGGGATCTATATCCCGCATTTCTACAGACTCAAAAGATCCGTAACCGTCGTCTTCAGTGGGAGGCGCTCCGTCTGATCGTCCAGCTCTTGCCGGCGGCTCATCGCGACACTCTCAGCGCACTGCTCGCGTTCCTCTCGCAGCTGGCATCACACGCGGGGGACGAAGACACCCCCGGCAACAAGATGAATGCCGCTAACCTGGCCACCATCTTCGCACCCAATATACTGCATAAGAACAAACCCAACGAGACCGCGAGTGCGGAGCAGTTGTCGGAGAGAGCTGACGTCATCAACGTGGTCCGCACCTTGGTGGAGCGACAGAGTGAGCTTTGGTCGCTGCCGGCGGAACTGTTACATGAGGCCTACATTCATCTCGCACACCACGCACCGGCAGGGCTTGACGCACTGCTGCTTAGGAGGGCAGAAACAGCAGCAGAAAATGAAAAGGCCAATGCAGAGGGCGCCAAACGTCTTTGGTCTCGTGAAAGCTTCCTCCACGCGGCTGCCAACACTGTCCCCGCTGTCTCCAGGAGTAGTGTGACGGAGGGCGGGCGGGCGAGAGACTCGGACGCCTCCTCCGCATCACTGTCTTCTGCCGTTATGCTCATGACCAGGTTACGCAGCAGCGAGGAACGCGCCAGCAGCGGGGTGGTGAGCGGTCACAGGGACTCCGCCCCGGACTCCAACGACTCCAGCGACTACAACGAGGTGGGCGGTGTGTCGGAGGACGAGCTGGTGATCACGGCGTCGCTCCACATCCCGGCGCTCCGGCGTCGCTCCGTGTCCTCGTCCAAGCGGGACTCGGCGGTGGGCTCGTCGTCGTCAGCGGCGTCTCCGTCGTCGTGCTCGCCGCCTTCCTCTCCGCCGCCCCGACCGGCGCGGGACATCGACCGCCTCGTGGGCCTCTCGCGTGAACGGAACACTTCCGACTCCCGCGCGGCGGTCGTTGGCAGAACTCACGAAGAAGTGACAGTTTCAAGAAGCACACGCGTGTCCAGACAGGAGCACACCGTACGGCGAGAAGAAGTCATCAGGAGAGAAGACCAGAACACGAGGAAAGAAGATCACAACGCCAGAAGAGAAGACAAAAGAGAAGGGACGATGCTTTACAAAAGAGGCGAACTCATCTCAAGCGCGAGGACGCCGCCCGCATGA

Protein sequence:

>DPOGS207428-PA
MSDAGRRLIPDGAQNRADDVPRIEAYFQEVCQREPRFLLWRKSSYPGVLPKPRRKKRARGGSVRARSPSDDAPPPPTRPTDLYIPHTSGGRFDIAKLRRDFFAAPPPSPSSTGFPSVSATFNTNNSAIKNGCPHPSISEDDEGILVDLLRKYLKVEDARDPPRVSESEELIRALRDYLKRLSEREPTDSDTDPTRRILRENLGRYYLRSSNRDNTVQDLLNDKNLLKNLYHDLRKPKPYRGGRSGGGPSSLGSSSGFSASSSRSVFFGRNFGGSKFNDENCSSPPMSPPPLIEVYGESMEDKLVDVGTQTLPIPEEVLQEQERSYREKLEAATAPTSPTSPPPERRPRRRSSVDHDDVSQSVSDTIKRYLRMARKKSVDAEKTDRFKRINYDKNLRNIKPRQQGDVDDDGPHKGCQTDEAWILTYRDLQFASVASTPTSPPSPSQSHSFLSTLLGRNASMAPNAGGMQKSRSSSSVVQSVSKRLWRTRSRSSSRVAASWTPQGSCCWTDGAGRCVKLTDTSLLSLTEVERRALQQAALARLQQLNLGTTIKIPEDNTSTVATKPKRRAYLLKRKALTTGFFDQRPKDAEKEKESTGSVFGVPLSQCVETERALRRQHGGSRASLASIGGLEKGDDSESCDSGEWGWSGVDEGNGGPKVPALVSSCLSHLRRHGLDTLGLFRVSASKKRVRQLREEWERGQEAALDAAVCPHDVATLLKEFLRDLPDPLLCRDLYPAFLQTQKIRNRRLQWEALRLIVQLLPAAHRDTLSALLAFLSQLASHAGDEDTPGNKMNAANLATIFAPNILHKNKPNETASAEQLSERADVINVVRTLVERQSELWSLPAELLHEAYIHLAHHAPAGLDALLLRRAETAAENEKANAEGAKRLWSRESFLHAAANTVPAVSRSSVTEGGRARDSDASSASLSSAVMLMTRLRSSEERASSGVVSGHRDSAPDSNDSSDYNEVGGVSEDELVITASLHIPALRRRSVSSSKRDSAVGSSSSAASPSSCSPPSSPPPRPARDIDRLVGLSRERNTSDSRAAVVGRTHEEVTVSRSTRVSRQEHTVRREEVIRREDQNTRKEDHNARREDKREGTMLYKRGELISSARTPPA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: