MonarchBase - Protein-coding gene

DPOGS210108
Transcript	DPOGS210108-TA	1272 bp
Protein	DPOGS210108-PA	423 aa
Genomic position	DPSCF300017 + 1195481-1217077
RNAseq coverage	555x (Rank: top 23%)

Annotation
*Heliconius*	HMEL005379	6e-128	90.11%
*Bombyx*	BGIBMGA000217-TA	2e-120	79.85%
*Drosophila*	CG34104-PB	4e-51	39.02%
EBI UniRef50	UniRef50_A7UV03	3e-55	44.09%	AGAP003931-PA n=1 Tax=Anopheles gambiae RepID=A7UV03_ANOGA
NCBI RefSeq	XP_970876.1	2e-52	52.28%	PREDICTED: similar to AGAP003932-PA [Tribolium castaneum]
NCBI nr blastp	gi\|347970932	1e-54	44.09%	AGAP003931-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347970932	8e-51	41.61%	AGAP003931-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0007264	3.1e-51	small GTPase mediated signal transduction
	GO:0005622	3.1e-51	intracellular
	GO:0005525	3.1e-51	GTP binding
	GO:0016020	6.2e-17	membrane
	GO:0007165	6.2e-17	signal transduction
	GO:0006184	6.2e-17	GTP catabolic process
	GO:0003924	6.2e-17	GTPase activity
	GO:0015031	2.3e-12	protein transport
KEGG pathway
InterPro domain	[238-408] IPR003578	3.1e-51	Small GTPase superfamily, Rho type
	[237-402] IPR001806	5e-41	Small GTPase superfamily
	[235-399] IPR005225	1.7e-20	Small GTP-binding protein domain
	[233-408] IPR020849	6.2e-17	Small GTPase superfamily, Ras type
	[236-408] IPR003579	2.3e-12	Small GTPase superfamily, Rab type
Orthology group	MCL17915		Insect specific

Nucleotide sequence:

>DPOGS210108-TA
ATGTCTCCTAGCTTAGAGGGTATCATGTTTAACAGGAACGCGAACCTGTCAGCTCGCCGGCCATTGCTCGCGGAACCACAGAAGCCAGTCGTGGTTCCACCTCGAGCACCACCCCGTGACTATGGTAAGTACGGTAGACCTGTGCCAGCGGCGAGGAACCCTTCAGCCGACGAAGGACGATTCGAATACAGATCCGATTATTGGAAACCGTCAAATGTTGACATCGAAAAACGGCTGCAGGAGACGAGAACACGAGAGAAGATCGGATACTTTCAAGACAAAGTGACCCCACCGGAATTAAACTTGGATCGTAGGGAAGCGGAATTAGTGTTTAAATTCGACCCTCACGCATCCGCTGAATATTTATCGAGTCAGTATCAAGCTCCAACAGTTCAATATGCAAAGCCCCCGACGCCGGCAAACGGGTTTGCTAACCGTCTACCGGAGAGAGATGGTCCTTTTGTATTCGGAGTGCACAGTCCCAGTCAGTTCCCTATACCGCGTCGGGACGAAGACGACTACGACTACTCCGAGGTGGCCGAGGAGCACGGCCGTCCAGTGATACGAGACGACGAATCTACGGAACTCAATTGTTGTGATAAAGTGAATGAGTGGACGGTTAGGGATAAGAAGAGTCGGAGGACTTTAAATCGTATGTTCCAAATAAAGGATCGACGGAAAGTTAAAGGTGGGAAGAAAGAAAAGATTAAGTGTGTGTTGGTGGGAGATGGAGCGGTGGGAAAGAGTTCCTTAATAGCTGCGTACGCCCAGGACACCTTTCGGGAAGAATATCAGCCGACCGCATACGACACATTTAATGTTGTGGTTGACGTTGATGACAGGCCGGTCTGTGTGGAAATCTGTGATACTGCGGGTCAGGACTCAATGTCCGAGCTCCGCGAGCTGTGCTATCCCGGTACCGATGTCCTGATGCTCTGTTTCTCCGTGGTTCGTCCGGAGACGTTCAAGTCAGTCGCCGATCGCTGGATCCGCGCCGTGTCCTCGGTGCAGGCTCCAGTAGTGCTCGTGGGGACGCAGAGCGACCTGGCCCTGGACGGACGTGTGATACAGACTTTACGGGCCCGCAACGAACACGCGGTAACAGAAGCTGAAGCGAGAGCATTGGCGGCAAAAATAAACGCCACGTACATAGAGACGTCAGCTAAGACACGGAAACAGCTGAAGGACGCCTTCGACGCCGCCATCTTGGCAGGGCTTCCAGTTGTACAGAACAAACGACCGCTATGGAAGAAATTATTATGCCTTAACTAG

Protein sequence:

>DPOGS210108-PA
MSPSLEGIMFNRNANLSARRPLLAEPQKPVVVPPRAPPRDYGKYGRPVPAARNPSADEGRFEYRSDYWKPSNVDIEKRLQETRTREKIGYFQDKVTPPELNLDRREAELVFKFDPHASAEYLSSQYQAPTVQYAKPPTPANGFANRLPERDGPFVFGVHSPSQFPIPRRDEDDYDYSEVAEEHGRPVIRDDESTELNCCDKVNEWTVRDKKSRRTLNRMFQIKDRRKVKGGKKEKIKCVLVGDGAVGKSSLIAAYAQDTFREEYQPTAYDTFNVVVDVDDRPVCVEICDTAGQDSMSELRELCYPGTDVLMLCFSVVRPETFKSVADRWIRAVSSVQAPVVLVGTQSDLALDGRVIQTLRARNEHAVTEAEARALAAKINATYIETSAKTRKQLKDAFDAAILAGLPVVQNKRPLWKKLLCLN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: