MonarchBase - Protein-coding gene

DPOGS201484
Transcript	DPOGS201484-TA	3120 bp
Protein	DPOGS201484-PA	1039 aa
Genomic position	DPSCF300006 + 112782-143650
RNAseq coverage	486x (Rank: top 26%)

Annotation
*Heliconius*	HMEL015940	0.0	78.46%
*Bombyx*	BGIBMGA002673-TA	3e-150	76.52%
*Drosophila*	CG30372-PB	0.0	60.02%
EBI UniRef50	UniRef50_E0VXN3	0.0	62.18%	130 kDa phosphatidylinositol 4,5-biphosphate-dependent ARF1 GTPase-activating protein, putative n=2 Tax=Neoptera RepID=E0VXN3_PEDHC
NCBI RefSeq	XP_397124.3	0.0	65.13%	PREDICTED: similar to CG30372-PB [Apis mellifera]
NCBI nr blastp	gi\|350408148	0.0	60.48%	PREDICTED: arf-GAP with SH3 domain, ANK repeat and PH domain-containing protein 1-like isoform 1 [Bombus impatiens]
NCBI nr blastx	gi\|350408148	0.0	60.86%	PREDICTED: arf-GAP with SH3 domain, ANK repeat and PH domain-containing protein 1-like isoform 1 [Bombus impatiens]

Group
Gene Ontology	GO:0032312	3.1e-38	regulation of ARF GTPase activity
	GO:0008060	3.1e-38	ARF GTPase activator activity
	GO:0008270	3.1e-38	zinc ion binding
	GO:0005515	1.2e-20	protein binding
KEGG pathway	ame:413683	0.0
	K12488 (ASAP)	maps->	Endocytosis
			Fc gamma R-mediated phagocytosis
InterPro domain	[581-734] IPR020683	2.2e-48	Ankyrin repeat-containing domain
	[460-580] IPR001164	3.1e-38	Arf GTPase activating protein
	[979-1038] IPR001452	1.2e-20	Src homology-3 domain
	[343-438] IPR001849	4e-14	Pleckstrin homology domain
	[338-437] IPR011993	1.5e-13	Pleckstrin homology-type
Orthology group	MCL10457		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201484-TA
ATGCCGGGTCTTATTGGTATTGGTGAATTTATTGACGAAACTCGAGAGGATTACAGTTCGCCAACTACTTCGACATTCGTATCGCGTATGCCACAATGCAAACAGACCATTAACGCATTGGAGGAGTGGCTCAAACACGGGGGGAATAGATTAATGGCAAGGGAGACAGATGTTCGTACCTCCTTTGAATGGCTCGTGGAAGCCATTGTGGACTGGTCGCAGTTCAAAAAGAATGGTCTTGTTACCCTGGATTTTGATCGCGATGGACTAACAAAGCTCAAAAAAGCAATAAAAGCCATACACAACTCAGGGAATGCCCACGTGGATAATGAGATGTACCTGTCCCGGGCGCTGGAGCGTCTCGGAGGAAACGCGCTCAGCAAAGATTCGGAACCCGACATAGGAGCCGCTTTTTTCAAATTTGCGGTCGTCACCAAAGAACTGTCAGCACTCATGAAGACACTGATGCAAAATATAAACAATATAGTGATGTTCCCTGTGGATAGTCTCTTAAAGGGTGATCTCAGAGGTGTGAAGGGGGACCTGAAGAGACCGTTCGATAAGGCATCCAAAGACTACGAGTCAAAGTACCTGAAGATTGAGAAGGAAAAGAAGTCACAAGCGAAGGAAGCCGGCCTCATAAGGAGTGAAGTCACATCGGCTGAGATAGCTGATGAGATGGAGAAAGAGAGAAGATTGTTTCAGCTGCAAATGTGTGAGTACCTGATAAAGTTTAATGAAATAAAAACCAAGAAAGGCATAGAACTGCTTCAGCACCTGGTGGAGTACTATCACGCACAAACTAATTATTTCCAAGATGGTTTAAAGACTATCGAACACTTCGGTGTGTACGTAGCGGATCTTAGTGTTCAATTGCAGAAGATAAGACAGCAGCAAGACGACGAGCGAAGAAGATTATTGGAGTTGAGGAACATGTTGAGAGCAGCTACACCGCAAGATAGAGAAGCGGCGGCTGCAGTGGGCGGATATTCACTTCACCAATTACAAGGTGACAAACAGCATGGAGTCACACGGAGCGGTTATCTTCTTAAAAAGTCGGAAGGTAAAGTTCGAAGGGTCTGGCAAAAGAGAAGATGCAGAGTCACGGCTGAGGGTTTCTTGGACATATTCCACGCGGACGAGAATAAAACTCCGGCCAGGGTCAATCTGCTTACGTGCCAGATAAAAGTGGCCTCGGAGGATAAAAGGGCGTTTGATCTAGTCTCATATAATCGTACGTACCATTTCCAAGCTGAAGATGAGAACGAACAGCGTACTTGGACCTCGGTCCTCGTGAATTGTAAGGAGGGAGCTCTGATGAGGGCCTTCCACCAACAGGCTGGTGAGAGTAATGACAATGGACACTCACTACTCGATCTCCAGAGATCAATCATCAGAGCAGTGAGAGCTATGCCAGGGAATCAAGTCTGTGCTGACTGCGGTTCAACTAATGATCCCACGTGGTTGTCAACGAACTTCGGCGTGATAGTGTGTATAGAATGTTCTGGAAGCCATCGCGAACTCGGAGTACATATATCAAGGATACAATCTCTGACACTGGACAGACTGAGCACCTCACAGTTGCTGATAGCAAGGAACATGGGCAACCAGACGTTCAATGAAGTCATGGAAAACACATTGGATGAAAGAGATAAACTCACACCAGAGAGCACCATGGAGGAGAGACTGAGGTTTATACGGGAAAAGTACGTGTATAGAGCGTGGGCGGGCAGGACTTGTAGAGATGAAACAGAGAGGCTGTCGGAAGTGGAACACGCCGTTAACAACGGACACTTACAGAACTTACTCCAGGCTTATGCTGAAGGGGCTGACTTGAGTTCAGCTCTGCCCGGTTCTGATTGCGGTGAAACAGCGCTCCATCTGGCGATATCTAGAGAAATCGGCGACGGGTCCGGTCTGCACATAGTGGATTTTCTGATCCAGAACGGCGGTTCACTGCTGGATAAGACCACCTTATCTGGGATGACTGCCCTACACCTGTGTGCAGCAACGGACAGGGCGGAGGCCATGAAATTGCTGCTGAAAGCCGGTGCTGATACCACGCCGAAAGATATCAATGGAAGAACAGCTCTGTACATCGCGAGACAACTTGGACACCACGCTTGTGTGGAATTGTTGGAAAGCGTTGATAAAAGGGAAAAGAGTATATTCGAAAATATAAATATTGATTGGAATTTGTCACACGACGATGGCTCCACAGACTTCTCTGACGATGACACTGTCATCGATGAAAGGCAAAACGGCAGCGTTACTCCAGAGAAAAAGTGTCCGCGTTCCCGCCCGCCGTCATACGCTGGTACGTGTGGGGGCGACTCCCCTGTACTACGATCAAGATCCTCAACCTGCGACTCCCTCCACCACGCACCGCCAACCCCTACCACGCTACCGCGAAAACCCAACTATAATATAGGCAGTTTAAAAAAGCGTGTCGCCCCCCTTCCCCCCGCGGTGTCCGTGTCTCACCCCCCCTCGCTGGCTGCTCTGCCATCACACGCGAGATCCACACCATCGCCATCCGCTGACAACACCAGGTCCATACATGGGACCGGTGCAGCGCCGGCAGTGAAGCCGCGACCTCAACAGCCGCCGCCCACGCCGCCGCCCGTGTCACTGCACAACGGAGCCCATAGGGACGAACCGACACCTCCGCCCAGGAAGAAGAAAAATAGATTGCACCTGGAAAATGCTGTGAAAGGAAAACTTAAAAGGGAATGTTCTAGTCAAGATTCATCGTTGGAGTTATGTGATATATCTGATGGCTTGGACGACAGTAGGCTGCAGTCATGTCTGTCGGACAGTTCTAGATCTCGTGAGAGAACGAGACGCAGCGACAGGTCCCTAGATGTGTCAGACACTTCCAGTCTTCACTCGAGGTCACCTTCCACTTCTATAACTATGATGGGTGGAGGTATGAGGAGGTGCCGAGCGCTATACGACTGTTCTGCTGATAATGAGGACGAGCTGTCGTTCAGGGAGGGCGAGGTCATAGTCGTCATCAACGAACGAACCGAAGACGACAACTGGATGGAGGGACAGGTCGAGGGGACCAGCCGCCGCGGCATGTTCCCCGTCTCTTTCGTACACATGCTGCCTGATTAG

Protein sequence:

>DPOGS201484-PA
MPGLIGIGEFIDETREDYSSPTTSTFVSRMPQCKQTINALEEWLKHGGNRLMARETDVRTSFEWLVEAIVDWSQFKKNGLVTLDFDRDGLTKLKKAIKAIHNSGNAHVDNEMYLSRALERLGGNALSKDSEPDIGAAFFKFAVVTKELSALMKTLMQNINNIVMFPVDSLLKGDLRGVKGDLKRPFDKASKDYESKYLKIEKEKKSQAKEAGLIRSEVTSAEIADEMEKERRLFQLQMCEYLIKFNEIKTKKGIELLQHLVEYYHAQTNYFQDGLKTIEHFGVYVADLSVQLQKIRQQQDDERRRLLELRNMLRAATPQDREAAAAVGGYSLHQLQGDKQHGVTRSGYLLKKSEGKVRRVWQKRRCRVTAEGFLDIFHADENKTPARVNLLTCQIKVASEDKRAFDLVSYNRTYHFQAEDENEQRTWTSVLVNCKEGALMRAFHQQAGESNDNGHSLLDLQRSIIRAVRAMPGNQVCADCGSTNDPTWLSTNFGVIVCIECSGSHRELGVHISRIQSLTLDRLSTSQLLIARNMGNQTFNEVMENTLDERDKLTPESTMEERLRFIREKYVYRAWAGRTCRDETERLSEVEHAVNNGHLQNLLQAYAEGADLSSALPGSDCGETALHLAISREIGDGSGLHIVDFLIQNGGSLLDKTTLSGMTALHLCAATDRAEAMKLLLKAGADTTPKDINGRTALYIARQLGHHACVELLESVDKREKSIFENINIDWNLSHDDGSTDFSDDDTVIDERQNGSVTPEKKCPRSRPPSYAGTCGGDSPVLRSRSSTCDSLHHAPPTPTTLPRKPNYNIGSLKKRVAPLPPAVSVSHPPSLAALPSHARSTPSPSADNTRSIHGTGAAPAVKPRPQQPPPTPPPVSLHNGAHRDEPTPPPRKKKNRLHLENAVKGKLKRECSSQDSSLELCDISDGLDDSRLQSCLSDSSRSRERTRRSDRSLDVSDTSSLHSRSPSTSITMMGGGMRRCRALYDCSADNEDELSFREGEVIVVINERTEDDNWMEGQVEGTSRRGMFPVSFVHMLPD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: