MonarchBase - Protein-coding gene

DPOGS216071
Transcript	DPOGS216071-TA	1533 bp
Protein	DPOGS216071-PA	510 aa
Genomic position	DPSCF300067 + 373080-376584
RNAseq coverage	286x (Rank: top 38%)

Annotation
*Heliconius*	HMEL008933	0.0	62.70%
*Bombyx*	BGIBMGA008870-TA	9e-146	55.65%
*Drosophila*	Ate1-PB	2e-89	37.98%
EBI UniRef50	UniRef50_O95260	1e-118	45.59%	Arginyl-tRNA--protein transferase 1 n=104 Tax=Coelomata RepID=ATE1_HUMAN
NCBI RefSeq	XP_395484.2	5e-120	44.72%	PREDICTED: similar to Arginyl-tRNA--protein transferase 1 (R-transferase 1) (Arginyltransferase 1) (Arginine-tRNA--protein transferase 1) [Apis mellifera]
NCBI nr blastp	gi\|354502516	6e-122	46.73%	PREDICTED: arginyl-tRNA--protein transferase 1-like isoform 1 [Cricetulus griseus]
NCBI nr blastx	gi\|354502516	9e-122	46.92%	PREDICTED: arginyl-tRNA--protein transferase 1-like isoform 1 [Cricetulus griseus]

Group
Gene Ontology	GO:0016598	5.5e-155	protein arginylation
	GO:0004057	5.5e-155	arginyltransferase activity
KEGG pathway
InterPro domain	[1-511] IPR017137	5.5e-155	Arginine-tRNA-protein transferase 1, eukaryotic
	[280-422] IPR007472	2.2e-42	Arginine-tRNA-protein transferase, C-terminal
	[10-94] IPR007471	8.3e-26	Arginine-tRNA-protein transferase, N-terminal
	[334-438] IPR016181	8.7e-08	Acyl-CoA N-acyltransferase
Orthology group	MCL13837		Single-copy universal gene

Nucleotide sequence:

>DPOGS216071-TA
ATGAATCATAGTTTCATTAAATATTATTCTGAGCATGAGGGCTACAAATGTGGGTACTGTAAACGTCCAGATACAAATTACAGTCACGTTATGTGGGCGCATGCAATGACGGTTACTGACTACCAGGATTTAATAGATAGAGGTTGGAGGAGATCTGGAAAACAATGCTACAAGCCAACATTAGAAGTCATCTGCTGTCCCATGTATACCATACGATGTAGGGCATTAGAATTTAAGGCTAGTAAATCTCAAAAGAAAGTTTTGAAGAGTTTCAATAAGTTTTTAATCGGAGAAGAAATAAGTGATATAAGTGCACAAGAAAGTCGAGAAGATGTTGCAATGGAACAAGTTGAAGGGCAGGAGCAGTTTCTAGAATCTAAAAGGCCACATGAAGATGTAAACATTGCCGGAATGGATATTCCATTTATAGAAGAAGCAGATGACTCAAGAAAACTTGAACTATCTGAAATAGAGACAAAAGATGACAGTCATATGCAGAAATTTGATTCTCATCAAGATTTACAGCAAGCGAGTTCATCAACAGCCAGTAGTTCATGCCTGTTGGGAAACACATCAAAAGAAAAATCTAACAAAGTGACCGGTGCAGATCCCACAAAAGCTCCATGCAAAAAAGCGAAACAGGCAAGGCGAGAGAGAATGTTAGAAAAGCTCCAAAGGAAGGGTATCAATGTTACCACTTTAGATAATACCGGCAAAAATACACCAAAAACCATTGAAGACATTATTAATGAACTACCAGATAATGTCAAGAGTAAACTTGAGATAAAATTGGTGAGAACAGAACCACCGAGTCCAGAGTGGCTGGCTACGAAATCAGAAAGTCATGAAGTTTATGTGAAATACCAAACTATTGTTCATGGAGATAAACCTGAGAAATGTACTGAACCCAAGTTCCATGATTTTTTGGTCCACAGTCCATTACTGGAAGAATATTCCGAAGTGGGTCCCCCATGTGGATATGGTTCATTCCACCAACAGTATTGGCTGGACGGAAAGATTATAGCCGTTGGCGTTATAGACATACTGCCAAAATGTATATCGTCCGTATACTTTTTTTATGATCCCCAATATTTATGCCTGAGTTTAGGAACTTATGGAGCTTTAAGAGAAATAGCATTCACAAGACAGTTACAAAAGATTTGTCCTAATCTGAAATATTACAACATGGGATTCTACATACATACTTGTACTAAGATGAGATACAAGGGAAAGTTCCACCCATCGGACCTATTGTGCCCTGAGACTTTCAAGTGGTTTCCCATCAAGGAATGTATAGCAAAGTTGGAAATATCAAAGTATTCAAGATTTGATCCTGATCTAGATGGTGTGGATGAAAATTATCCCACAGATAATGACGTGAACAATATAAAAGTTTTATCAAACGGGCAAGTGCAAATTTACAAAGTTTTCAAACGGAAAGCAGGAAGGAAGTACAATGAAGAATTTGAAGTTCTTGAATATGCGAGGCTGGTTGGAGGCAAGACCGCTAGAAGTATTATAATGGTCATGTAG

Protein sequence:

>DPOGS216071-PA
MNHSFIKYYSEHEGYKCGYCKRPDTNYSHVMWAHAMTVTDYQDLIDRGWRRSGKQCYKPTLEVICCPMYTIRCRALEFKASKSQKKVLKSFNKFLIGEEISDISAQESREDVAMEQVEGQEQFLESKRPHEDVNIAGMDIPFIEEADDSRKLELSEIETKDDSHMQKFDSHQDLQQASSSTASSSCLLGNTSKEKSNKVTGADPTKAPCKKAKQARRERMLEKLQRKGINVTTLDNTGKNTPKTIEDIINELPDNVKSKLEIKLVRTEPPSPEWLATKSESHEVYVKYQTIVHGDKPEKCTEPKFHDFLVHSPLLEEYSEVGPPCGYGSFHQQYWLDGKIIAVGVIDILPKCISSVYFFYDPQYLCLSLGTYGALREIAFTRQLQKICPNLKYYNMGFYIHTCTKMRYKGKFHPSDLLCPETFKWFPIKECIAKLEISKYSRFDPDLDGVDENYPTDNDVNNIKVLSNGQVQIYKVFKRKAGRKYNEEFEVLEYARLVGGKTARSIIMVM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: