MonarchBase - Protein-coding gene

DPOGS200728
Transcript	DPOGS200728-TA	1566 bp
Protein	DPOGS200728-PA	521 aa
Genomic position	DPSCF300030 - 108776-117536
RNAseq coverage	1735x (Rank: top 7%)

Annotation
*Heliconius*	HMEL008956	0.0	78.25%
*Bombyx*	BGIBMGA001126-TA	0.0	81.96%
*Drosophila*	Rep-PA	2e-87	36.20%
EBI UniRef50	UniRef50_E1ZY69	4e-139	46.43%	Rab proteins geranylgeranyltransferase component A 2 n=9 Tax=Formicidae RepID=E1ZY69_CAMFO
NCBI RefSeq	XP_001950164.1	3e-142	47.39%	PREDICTED: similar to Choroideremia [Acyrthosiphon pisum]
NCBI nr blastp	gi\|193579932	7e-141	47.39%	PREDICTED: rab proteins geranylgeranyltransferase component A 1-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|193579932	3e-137	47.39%	PREDICTED: rab proteins geranylgeranyltransferase component A 1-like [Acyrthosiphon pisum]

Group
KEGG pathway	pic:PICST_90444	2e-27
	K00680 (E2.3.1.-)	maps->	Benzoate degradation via CoA ligation
			Limonene and pinene degradation
			Ethylbenzene degradation
			Tyrosine metabolism
			1- and 2-Methylnaphthalene degradation
InterPro domain	[1-522] IPR016664	2.6e-155	Rab protein geranylgeranyltransferase component A, eukaryota
	[6-485] IPR018203	8.9e-80	GDP dissociation inhibitor
Orthology group	MCL10995		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200728-TA
ATGGACGACGATTTACCTACAGACTTCCAGGTCATCGTCGTGGGGACGGGCATGGTTGAGTCCATCGTAGCTGCAGCATGCAGTCGAATAGGCAAAAATGTGCTACATCTAGACTCGAGTGACCACTATGGGGGTCTTTGGGCCTCATATAATTTTGAGGGTCTTCAGAAATTTATTAAGGAAATTAACTCGGACCCAAACAGGCAACTCCAGGTGTACAACTTGATTGAAAAGTGGTATATTGATAAAGACTCACCTCAAGAGGAAACGAAACAAGAGACTGAAGATGAAAAGACTGAGCCCCCCAAGAAGATATGGAGCCAAGCCGACTTTGCTTCCGAGTACAGGAAGTTTAATATTGACATGACACCAAAGCTGCTGTTTTCCCGGGGGCCGTTAGTGGAGCTCCTAATATCTTCGAATATTGCTCGTTATGCTGAGTTCCGATGCGTGACACGTGTTCTCACTTGGCTCAATGACAAGTTGAATCCTGTCCCCTGTTCCCGGGCTGACGTGTTCGCTACGGAGGCTGTCAGCATCGTGGAGAAGAGGATGCTCATGAAAATGCTCACTTCCATCGTAGGGTACAATGAAGAAGAGATGGACAATGAATTTAAGGATTGGACCGACAAATCCTTCAAGGACTACCTGACTCACAAGGGTCTGACACCGAATCTGATCCACTACGTGTTGTACGCTATCGCCGGCGGTTCTGACGCTATGCCGTGTCTGGAGGGTGTTAGGGAATGCAAGAAGTTCCTGATGAGTCTCGGCCGTTATGGGAACACGCCGTTCCTTTGGCCGATGTACGGCAGCGGGGAACTGCCTCAGGGCTTCTGTCGACTATGCGCGGTATTCGGCGGCGTGTATTGCTTGAATCGTCCGATAGATTCGGTCGAGACTAAGACGGGTGACGAAGGGAAAGAGATCGTGGTCATCGGCAGCAAGGCCAAGAACTTGAATTGCGATCATCTAGTCATCGGTATAAACGAGTGTCCCAAGGATCTACTGTCCTCGGAGCCGAGCGAGAGCTCTGATATATCCAAGGCTATATTCATTACCAATGGCACTATAATGCCAAGCGAGAAAGAACCGCTGACCCTACTGAGATTCCCGCCGCTAGATGAAGGTGACAACCCTGTTACTGTTCTCGAAGTCGGACCAGCCACCGGCTCCTGCCCTAAAGGCCTCTTCGCCGTTTACTTCATAACGAACAAGGTTAAGGATGCCGAGAGCGATCTCATGAAGTACGCGGAGAAGATCTTCGACATGACTGGAGACCAGACCAAGGCTGGAGACAAGCCGACGTGCCTGTGGTCTCTGTTCTACAACGTGAAGGATGTGAGCGCGGGAGTACGTGACGGCGTTGAGACGGTCCACGTGTGTGCCGGACCAGACGCCGGGCTGGACTTCGACCGCGCCGTACTCCAGGCGGAACAAATCTTCAAGAAGATCTGCCCGGGCGAGGAGTTCTTGCCCCGCGCCCCGGATCCTGAAGACATCGTCTTCGAGGATGACGTCACTCACGGGCCGGAGTTCCGCGGCGACGAAGGAGACAAAGAGTAA

Protein sequence:

>DPOGS200728-PA
MDDDLPTDFQVIVVGTGMVESIVAAACSRIGKNVLHLDSSDHYGGLWASYNFEGLQKFIKEINSDPNRQLQVYNLIEKWYIDKDSPQEETKQETEDEKTEPPKKIWSQADFASEYRKFNIDMTPKLLFSRGPLVELLISSNIARYAEFRCVTRVLTWLNDKLNPVPCSRADVFATEAVSIVEKRMLMKMLTSIVGYNEEEMDNEFKDWTDKSFKDYLTHKGLTPNLIHYVLYAIAGGSDAMPCLEGVRECKKFLMSLGRYGNTPFLWPMYGSGELPQGFCRLCAVFGGVYCLNRPIDSVETKTGDEGKEIVVIGSKAKNLNCDHLVIGINECPKDLLSSEPSESSDISKAIFITNGTIMPSEKEPLTLLRFPPLDEGDNPVTVLEVGPATGSCPKGLFAVYFITNKVKDAESDLMKYAEKIFDMTGDQTKAGDKPTCLWSLFYNVKDVSAGVRDGVETVHVCAGPDAGLDFDRAVLQAEQIFKKICPGEEFLPRAPDPEDIVFEDDVTHGPEFRGDEGDKE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: