MonarchBase - Protein-coding gene

DPOGS203345
Transcript	DPOGS203345-TA	2001 bp
Protein	DPOGS203345-PA	666 aa
Genomic position	DPSCF300003 - 106985-113275
RNAseq coverage	885x (Rank: top 14%)

Annotation
*Heliconius*	HMEL022657	0.0	69.99%
*Bombyx*	BGIBMGA011993-TA	0.0	53.64%
*Drosophila*	CG2017-PA	2e-128	49.49%
EBI UniRef50	UniRef50_Q960F7	3e-126	49.49%	CG2017, isoform A n=25 Tax=Coelomata RepID=Q960F7_DROME
NCBI RefSeq	XP_002429073.1	2e-127	52.22%	GTP-binding protein, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242017187	4e-126	52.22%	GTP-binding protein, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|24644462	4e-122	49.49%	CG2017, isoform B [Drosophila melanogaster]

Group
Gene Ontology	GO:0005525	8.1e-20	GTP binding
	GO:0003924	8.1e-20	GTPase activity
KEGG pathway
InterPro domain	[156-381] IPR000795	8.1e-20	Protein synthesis factor, GTP-binding
	[564-657] IPR009001	1.2e-12	Translation elongation factor EF1A/initiation factor IF2gamma, C-terminal
	[392-485] IPR009000	3.2e-10	Translation elongation/initiation factor/Ribosomal, beta-barrel
Orthology group	MCL14086		Single-copy universal gene

Nucleotide sequence:

>DPOGS203345-TA
ATGTACCTGGCCGGCGACCTGAGCGCGGAGGACCTTGAGAGCGACTTCTTTTACAGTTCAGACGACATGGACGACTTCTGTGACGATACAACCTCGGAGGCGTCTGACTCTGGCGAGGAATGCTACGGCAGTCTTCCCCCAGAACCTCGTTTCGGTAACGTTGAGTACAAACTGCAGCTGGTGTCGCCTTGCGAGAGAAGATTCCAGCATTTGGTTACACAGCTGAAATGGCGTCTCCGCTCTGGCGGTGGGAGCGCGGTGTACGTGGTAGGGGTCCGGGATAATGGAGCGCTAGTAGGGCTCCATGCGGGTGCGCTCCGAGCCTCGCTGTGCTCGTTGAGGGACATGGCGAGAGCTCTGGGAGCTGTGATCGTTAGCGCGCGCGCGAGACGAGTGACCAGTAGCCGGGCTGTCGCTGAGGTTTATATACGGAAGTTAGCGGACACTCAACAAAGTGTGGAACTGCGTGTGGCTGTGATGGGGGCTATAGAAGCTGGGAAATCTACCCTCATTGGGGTCCTAACACAAGGTGAATTAGATAATGGCAGAGGCAGCGCTCGTCTGAATATGTTCAGACATCTCCATGAAGTCAGAAGCGGAAGGACGTCTTCGCTCAGCCACGAGATACTCGGGTTCGACTCTCAGGGTAACGTGGTGAATTATGGCTGTTCTGAGCTGATGACGGCGGAGCGTATCGGAGAGAGGAGTTCCAAGCTGGTGTCTTTCTTAGACCTCGCGGGACACAGCAAGTATCAGCGGACCACGGTGTACGGTCTCACGGGATACTCGCCGCATTACGCCATGATAGTGATATCAGCAACGGCTGGGATAACACCGATAACAGAAGAACACATAGGTCTACTTCTTGCCCTGGAACTGCCTTTTTTCGCTGTTATTAATAAGACGGAGCTAGCTTCCAGCACTAAGGAGCTGGTGGATAGGCTCGGAGAAATACTTTCGACGGCGAACAAGAAACCTCTTCTCATAACGGACGAGAACCTCGCGAGGAATTGTATAGCGCCGTCCATATTGGACTCCATTGATAATGAGGATAAGGAAAATGAAGGATCCTTCATACCTGTGTTCCCTGTTAGCTGTGTTCGTGGAGTTGGTCTCAACTCATTGCACGCGTACCTCCTCGCTCTCAGACCACCCGCTGGCGGCGTAGAGACTACAAGGGAAGATGAGACCTGCGAGTTCCAAATAGACGAGATCTTCCACGTGGCGTCCGGGGCTCCGGTCGTTGGAGGTCTCCTGGCTCGGGGGGCGCTCAACGAGGGCGACACGCTGTTAGTGGGTCCATTAGACAGCGGTCAATTCGTCAAAACGACTGTGTTATCCATATATCGTAATCGGGTTCCTTGCGCGTCCGTCCGCGCCGGACAGTCTGCCTCGCTGGGGCTCCGCCCCGGGCCAGTTCTGAGGCCCGGTATGGTGCTCCTCGCTATACCAGAAGACTATGGCACGGGGGCCCGGCCCGCTTTCGGCGGCTGTGGGGGACTACGGTGCGGGGGGAGGGAGATATCGGAACTTGTGAAATCGTCGCAGGAGAAGAACCGAAAGAACGCGAGGCGCAACAAGAACATTAAGGAGATCAACATAACGGACAAACATACAGACAAACTCACAGACGCTTTGGGGGACGGAGACTGCGTGTGCAGCGACGTGGTACCACTAGAAGACCCGAACGACCCAAGAGGTTGTATTTACTTCCAGGCTAGCGTCCACCTCCTCCGACACTCCACCTCCATATCTCCAGGGTTCCAGTGTTCCGTACACGTGGGGAACGTGAGGCAGACAGCCATCATAGAGGGTATACTGTCAGCGATGTCTTCGCTCCGGCCCGGTCAGAGCGCGTGCGTGTTGTTCAGGTTTGCGCGCTGTCCGGAGTATTTGAGGAAGGGCAGGAGGCTGCTGTTCACCGCCGGACTTGGGACCAGAGCCATCGGAGTCGTGACGCAGACGTTCCCGTACATACCGCAGCCGAAAGATAATTTATAA

Protein sequence:

>DPOGS203345-PA
MYLAGDLSAEDLESDFFYSSDDMDDFCDDTTSEASDSGEECYGSLPPEPRFGNVEYKLQLVSPCERRFQHLVTQLKWRLRSGGGSAVYVVGVRDNGALVGLHAGALRASLCSLRDMARALGAVIVSARARRVTSSRAVAEVYIRKLADTQQSVELRVAVMGAIEAGKSTLIGVLTQGELDNGRGSARLNMFRHLHEVRSGRTSSLSHEILGFDSQGNVVNYGCSELMTAERIGERSSKLVSFLDLAGHSKYQRTTVYGLTGYSPHYAMIVISATAGITPITEEHIGLLLALELPFFAVINKTELASSTKELVDRLGEILSTANKKPLLITDENLARNCIAPSILDSIDNEDKENEGSFIPVFPVSCVRGVGLNSLHAYLLALRPPAGGVETTREDETCEFQIDEIFHVASGAPVVGGLLARGALNEGDTLLVGPLDSGQFVKTTVLSIYRNRVPCASVRAGQSASLGLRPGPVLRPGMVLLAIPEDYGTGARPAFGGCGGLRCGGREISELVKSSQEKNRKNARRNKNIKEINITDKHTDKLTDALGDGDCVCSDVVPLEDPNDPRGCIYFQASVHLLRHSTSISPGFQCSVHVGNVRQTAIIEGILSAMSSLRPGQSACVLFRFARCPEYLRKGRRLLFTAGLGTRAIGVVTQTFPYIPQPKDNL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: