MonarchBase - Protein-coding gene

DPOGS206600
Transcript	DPOGS206600-TA	4512 bp
Protein	DPOGS206600-PA	1503 aa
Genomic position	DPSCF300048 - 1335185-1377514
RNAseq coverage	13x (Rank: top 83%)

Annotation
*Heliconius*	HMEL008830	0.0	84.54%
*Bombyx*	BGIBMGA008326-TA	2e-92	96.43%
*Drosophila*	CG42629-PB	0.0	86.28%
EBI UniRef50	UniRef50_UPI00020626A2	0.0	60.60%	UPI00020626A2 related cluster n=2 Tax=unknown RepID=UPI00020626A2
NCBI RefSeq	XP_550681.3	0.0	86.88%	AGAP002115-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|345479401	0.0	76.83%	PREDICTED: hypothetical protein LOC100122885 [Nasonia vitripennis]
NCBI nr blastx	gi\|383858245	0.0	68.61%	PREDICTED: uncharacterized protein LOC100880942 [Megachile rotundata]

Group
Gene Ontology	GO:0005622	2.6e-59	intracellular
	GO:0051056	2.6e-59	regulation of small GTPase mediated signal transduction
	GO:0005096	2.6e-59	GTPase activator activity
	GO:0005515	4.5e-06	protein binding
	GO:0008270	7.5e-05	zinc ion binding
KEGG pathway	mcc:715958	1e-60
	K08013 (SIPA1)	maps->	Leukocyte transendothelial migration
InterPro domain	[844-1033] IPR000331	2.6e-59	Rap/ran-GAP
	[1263-1328] IPR011333	1.5e-15	BTB/POZ fold
	[1103-1328] IPR000210	4.5e-06	BTB/POZ-like
	[1267-1326] IPR013069	7.7e-06	BTB/POZ
Orthology group	MCL13116		Insect specific

Nucleotide sequence:

>DPOGS206600-TA
ATGACGGCGATATGCTTCGTCTGCAATTTACCGATACTATCACACCAAGTTGGTTTGGTGTGGGCAGGAGGGAATGGATGGGACGAACTCACAAGATCCAATTTGGAAGAATCTACCCTTAGACAGCGGCTTGGGAACCGCAGGGATTCTGCAGCCCAAGTGTGTTGCTTATCACCACCAGAGCCCGATGTCTCGGATCAACCCAGGGGTGGTCCCCGCCGTCGTCGTTCGTCGCTTGCTCAACTTACCGACATACTTCGCGAATGGGGTGGTGGGAGCAGCGCACCCAGACGTCAAAGAGCTCCCTTATCCAGACGAGAGACATTGGCAGACTTAGCTCGCTCCTTACCTTGGGCCCGACATGAACCACCCCCTCGTCGTCGACGCGAATCGTCAGCGGATTCTGGAATTAAATCCTCAGTGTCTAAACGCCGGGATTCCAGAGCTGTCCCTCATGATTTTAAAACAGATTTTCCCAACAGCTTAGATCGCAAAGATTCTATAGCTGTAATGACAAACAGAGAACGCAGGGTTAAACGAAGAGGATCTGGAGATGGTAAAGATCGGCGTGATTCGGTCGATGGTCACCGACATCGACGTGATTCCTTAGCGACTCCCCCACCGCGTATAGTCGCCACTCACAAAAAGAGACGAGGTTCTCCACCGACACCGGGTCCGCCATCTTTCGTAGATGCATCATCCGATCCTGGTCCATCAACTCATCCGCCCTCTGTGACAGTAGTAACAGTGCACGAGCCAAGTCGCTCAGATGGAGAATGCCCACCAATGACTATGCCAACAATTATCACATCAGCAGTAACACCTTCGCCAACTTCACCAACTGTACCCACATCCAATGCAACACAGACTACTCAAGCCACTCAGGCTACCCAGTCTGCACAGGGTACTCAAGTTACTCCTGGTGGAAAAACACCTCCACAATTAGGTGGCAGGCGAGATTCTACCACCCAATGTGGTCGAGCTAGACGAGATTCACGAGCTACGGCTAGTCCAGAACGAAGATTAGGCAGATTACAAAGACAAGCAACTGCTTTTGATGACCCCACTGGTCCACCTGGAACCCGTCGCAGAGATTCCGGACCTACACTGGAACCGGATGATGCAGGCCGAGCCAGACGTGACTCGTTAAGTCCTGACTCAGCACGGCCAAAAAGGGAAAGAAACCAGTTGAGTCCTGATCGCGCAGGGGGTGGTGAACTTAGCCCATCAGCCGCTCGTCGAAGAAGTCGCCTAAGACGCCAAGCTTCATGTGCCAGAGTTGGTCGAGCAAGAAGTCCTGAGTCGAGCTCGTGTTCAAGCCGAGATCCAAGCCCTTGTGCACGACCTCCTGAGAGAACGATGTTTAGGAGACAATCGACCACGGAAGAGATATTGATAGCACGTGGTTTTAGACGTCAATCTACAACAGAAGAAATGATACGATGTCGTAATTTTCGAAGACAAAGCTCCCAGAGTGATGACGCTTGTATGCGTGCTCGTGGTCGCCGAGATTCTTCAACACAAATACTCGATGGCACTATTGGTACCATGACGGTAGAAACTACGAGTACATTCTTTGACTCCAGTACACAAACTGAGCCATCCCCGTTGTACGACAACAACCATTATCACGAGGAATGCCTTCGTTGCAACTCCTGCGGGTTGAATCTCACCGGACCAAATCAAAAACGTGCTCGCCGTTTCAAGAATCAGATTCTCTGCGATTTGCACTTCGCGGACGTGGCGCTGATGGAGTGCAGTGACTTCATGCAACAGCTTCGCAGCTTCAAACCCCAGTCGCTTGGATGTGCTGTCGCCAGGCGAAAGTCGTCGACTACCCTCATATTCCCTTTGCCTCCTCAAGCTTGCTCAGATGAGTTCTGCGAAGAATACCCTCACAATCTGATTCCAACACCGGGATACTGGATCGAGTGCTCGCGTCAGAAGATTACCACAGACACGATTTGGGATGAATCAGAATCTGAACACGACAGCGGTCCAGATAGAGATGATTCAGATCGACGTAGGAGATCGGGTTCCTTGGACGAAGCCGCAGAGGATAGCAGCGATAACGGTGGAAGTACGCCGAAGAAGAAAACAGCTATCGAAGAACAATGGGAAAGATCTGGTGGCTTCGAACTTACATCAGTTGAACAGGAAACTTACGAAAAATACTTCTACGGCACTGAACATTGGAACTATTTCACCAATGACGAAGACTTGGGCCCCGTTATACTTTCAATAAAGCAAGAAACTCTTAATGCAAGAGACCAATTCAGAATTCTCGTCCGAGCGATCAGCTATACTGTACATGGCCTAATACCCGCATCCTGTGTCTTCGCTGACCGCTACAATCGCGAAGAAGTGGTCAGATCTCTAGGCAAAGAGGTCAATATCAACCCACCTCTCATGCTGGGACAACTGCCCGATACCCCTGAGGAACTACTAAAATTGGACCAAGTTTTTATAAAATCAGAACTGAAAGTTGGTGTGATATATGTGAAGGAAAATCAATACACCGAAGAAGAAATTTTGGACAATAATGAGAACTCACCACTTTTTGAAGAGTTCTTACAAGTTCTCGGCGAAAAAGTTCGTCTTAAAGGATTCGACAAATACAAAGGCGGGCTTGATACCGTTCACGATCTCACAGGATTGTATTCAGTTTACACAAACTGGAGGAGCATTGAGATCATGTTTCACGTTTCAACTCTTCTGCCGTATGAGAAACATGACGCACAGAAATTACAACGAAAACGTCACATCGGAAATGACATTGTATGTGTCGTATTCTTAGAAGCCGATAATACAGCCTTTTCACCAGCCTGCATAAAGAGTCATTTCTTACACACATTTATTTTAGTGCGAGTGTCTGCTAAAATTAAAAGGCGTCCCACTAGATATGAAGTGTCGGTCGTGACCCGAGACGAGGTGGGAGCTTACAAGCCCTACTTGTGGGAGCAAAGTGTGTTTGATAAAGGACCTATGTTCAGAGAATGGTTACTTACTAAAATTGTAAATGGTGAGCGAGCTTCGTATTCAGCACCTAAGTTTGCTCGAATGCAGGAACGTACTCGAAGCCAAATGTTAGAAGACATAGTCGCCAATTTGCAGAATCACGCAGAAACTGGACAGATCCCTAAGCCTTACCGACGAGGATCTTGGCGTCCAATTGGTCACATGCGACCGTCATCGCCATTGTTAGACTCCGTTAGGGATCAGTTCGAGGACTACGACCAACTGGCCAAAGATTTTACAAGAGTTTTCCTCAACAGTGAACTAAATGCTGCTCAAAATGCACAACTTTTCGATGTAGTATTCATGGTTGGGCAATCTAAACAGAAAACGAAATTTATCGGTGTCCGTGCAATACTAGGTGTGAGGAGCAGGGTATTCCAAGAAATGCTGTACGGCATACAAACTGGTTTCGGCTCCCCTCAAGTGCCGGTAGCTGAACTGTTGGCTCGACCCGCACCCACGCTTCTGTCTCCCACGCCACGACAAAAAAGTAGCAACTTCTTACAAGTACCTGACATTGAATCTCCAAGACCCAAAAGCGTTCCCAGTTCTCCTATGGTTAAACGTGCTTTCTCCCGCCTCGGCACCATAACAGCTGGATGGGGTCGATCTATCAGGAAACAACATTCTCAACTCAATGTTGATGATAAGAAAAAATGGGCTAGCTCACAAGACTGTTCAAATAAAGAAAGTAAGGACAAAGACAAAGAAAAAAATGCAGCTTTGGCAGTTCCACGTCTCTCAGTGTGTGCTGATGCTCAAAAAGTAGACCGAGCAAAGCTTGCTCAAACTGAGTTCTCGATAATCGAATTCGATCCTGAGACCTTTCGGATCTTGCTGGACTACTTACACACGGGTAGCTGTCCTCTCACTTGCGCCTCCATACCGGGACTCATCTGTGCTGCGGAACACTACGACCTGCCTGAACTTCTGCAGGCTTGCTTCCATCACGCGAAGCAGTTCCTTAGGATTGAAGTGGTCTGTACCATGCTGATCTCGTTGGAAAATTACTACTGGCGTTACACATCAGCTTCTGAGCTGGTCAATATGATTCTGGCATTTATAGAACAACGGGCATATGCTCTTTTCCAAACTTCGGAGTTTCTTAACCTATCCGAATCGATGGTACAGATGATAATGTGCAGGAACCTGGAAGTACCAGAAGTTAGAAAATTCGAAGCAATGCTTAGTTGGGCTCGCAATAAAATCAAATCAAGGTCTACGAACAAGACTGACGCCAAGAATGAGTTCAAATGTATAATGGAGCGATTAGCTAGAGATTTGAAATTATACAGGATCTCACCCCAAGAATTGATAAAAGTGGTTCTTCCCTCAAAAGCAATCAAAAATGAACGTATCCTCGAAACGTTGATGTATCAAGCCAACTCGGGAATGTACAGAATTCAGGACAGCTACATCGAGGCTTGTCAGCAACGCCTACAGAAACAGGATTCGAGATTCTCCGAATTTGAAAGTTTTGATTACGGTATATAA

Protein sequence:

>DPOGS206600-PA
MTAICFVCNLPILSHQVGLVWAGGNGWDELTRSNLEESTLRQRLGNRRDSAAQVCCLSPPEPDVSDQPRGGPRRRRSSLAQLTDILREWGGGSSAPRRQRAPLSRRETLADLARSLPWARHEPPPRRRRESSADSGIKSSVSKRRDSRAVPHDFKTDFPNSLDRKDSIAVMTNRERRVKRRGSGDGKDRRDSVDGHRHRRDSLATPPPRIVATHKKRRGSPPTPGPPSFVDASSDPGPSTHPPSVTVVTVHEPSRSDGECPPMTMPTIITSAVTPSPTSPTVPTSNATQTTQATQATQSAQGTQVTPGGKTPPQLGGRRDSTTQCGRARRDSRATASPERRLGRLQRQATAFDDPTGPPGTRRRDSGPTLEPDDAGRARRDSLSPDSARPKRERNQLSPDRAGGGELSPSAARRRSRLRRQASCARVGRARSPESSSCSSRDPSPCARPPERTMFRRQSTTEEILIARGFRRQSTTEEMIRCRNFRRQSSQSDDACMRARGRRDSSTQILDGTIGTMTVETTSTFFDSSTQTEPSPLYDNNHYHEECLRCNSCGLNLTGPNQKRARRFKNQILCDLHFADVALMECSDFMQQLRSFKPQSLGCAVARRKSSTTLIFPLPPQACSDEFCEEYPHNLIPTPGYWIECSRQKITTDTIWDESESEHDSGPDRDDSDRRRRSGSLDEAAEDSSDNGGSTPKKKTAIEEQWERSGGFELTSVEQETYEKYFYGTEHWNYFTNDEDLGPVILSIKQETLNARDQFRILVRAISYTVHGLIPASCVFADRYNREEVVRSLGKEVNINPPLMLGQLPDTPEELLKLDQVFIKSELKVGVIYVKENQYTEEEILDNNENSPLFEEFLQVLGEKVRLKGFDKYKGGLDTVHDLTGLYSVYTNWRSIEIMFHVSTLLPYEKHDAQKLQRKRHIGNDIVCVVFLEADNTAFSPACIKSHFLHTFILVRVSAKIKRRPTRYEVSVVTRDEVGAYKPYLWEQSVFDKGPMFREWLLTKIVNGERASYSAPKFARMQERTRSQMLEDIVANLQNHAETGQIPKPYRRGSWRPIGHMRPSSPLLDSVRDQFEDYDQLAKDFTRVFLNSELNAAQNAQLFDVVFMVGQSKQKTKFIGVRAILGVRSRVFQEMLYGIQTGFGSPQVPVAELLARPAPTLLSPTPRQKSSNFLQVPDIESPRPKSVPSSPMVKRAFSRLGTITAGWGRSIRKQHSQLNVDDKKKWASSQDCSNKESKDKDKEKNAALAVPRLSVCADAQKVDRAKLAQTEFSIIEFDPETFRILLDYLHTGSCPLTCASIPGLICAAEHYDLPELLQACFHHAKQFLRIEVVCTMLISLENYYWRYTSASELVNMILAFIEQRAYALFQTSEFLNLSESMVQMIMCRNLEVPEVRKFEAMLSWARNKIKSRSTNKTDAKNEFKCIMERLARDLKLYRISPQELIKVVLPSKAIKNERILETLMYQANSGMYRIQDSYIEACQQRLQKQDSRFSEFESFDYGI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: