MonarchBase - Protein-coding gene

DPOGS214446
Transcript	DPOGS214446-TA	1287 bp
Protein	DPOGS214446-PA	428 aa
Genomic position	DPSCF300441 - 76784-79919
RNAseq coverage	82x (Rank: top 64%)

Annotation
*Heliconius*	HMEL004431	2e-163	63.84%
*Bombyx*	BGIBMGA009612-TA	1e-80	68.81%
*Drosophila*	Aats-pro-PA	5e-95	41.38%
EBI UniRef50	UniRef50_Q7QAP8	8e-98	45.60%	AGAP003589-PA n=2 Tax=Culicidae RepID=Q7QAP8_ANOGA
NCBI RefSeq	XP_971952.1	1e-102	43.46%	PREDICTED: similar to prolyl-tRNA synthetase [Tribolium castaneum]
NCBI nr blastp	gi\|91078076	3e-101	43.46%	PREDICTED: similar to prolyl-tRNA synthetase [Tribolium castaneum]
NCBI nr blastx	gi\|91078076	1e-97	43.46%	PREDICTED: similar to prolyl-tRNA synthetase [Tribolium castaneum]

Group
Gene Ontology	GO:0005524	4.2e-35	ATP binding
	GO:0006418	4.2e-35	tRNA aminoacylation for protein translation
	GO:0000166	4.2e-35	nucleotide binding
	GO:0004812	4.2e-35	aminoacyl-tRNA ligase activity
	GO:0005737	4.2e-35	cytoplasm
	GO:0006433	8.9e-14	prolyl-tRNA aminoacylation
	GO:0004827	8.9e-14	proline-tRNA ligase activity
KEGG pathway	tca:660646	4e-102
	K01881 (PARS, proS)	maps->	Aminoacyl-tRNA biosynthesis
InterPro domain	[59-220] IPR002314	4.2e-35	Aminoacyl-tRNA synthetase, class II (G/ H/ P/ S), conserved domain
	[303-416] IPR004154	1.1e-15	Anticodon-binding
	[75-93] IPR002316	8.9e-14	Prolyl-tRNA synthetase, class IIa
Orthology group	MCL12355		Single-copy universal gene

Nucleotide sequence:

>DPOGS214446-TA
ATGAAATTATTATCTAAAATATTCCAACCTGTGATCACAATACCTAAGGGTGCGAAGATAAAGAACACGGAAATAACATGTAAAAGTCAGAAACTCTTGTTAGAATGCGGTCTGGTCCGTCCAACGAGCACCGGTTTCTTCACCCTGCTACCGTTGGCAAGACGAGCTCTCACCAAATTAGAAAACATTGTACACCGCTGCTTAGAAGACGTCGGTGCTCAACAGATATCACTACCTTGTCTCACTTCCAGCAGGCTATGGGAAGCGAGCGGACGTTTAGACAGAGTTGGCTCCGAGTTGTTAAAAGTAGAAGATAGACACAACAAGAAGTATATATTAAGTCCGACTCACGAGGAGGCCATCGCCGACTTGTTGTCCGATGTAGCTCCGTTGTCACACAAACAGTTACCGTTCATACTGTACCAGATTGGTAACAAGTATCGTGACGAGCTCCGTCCTAAGCACGGTCTGCTGAGGTCGAGGGAGTTCCTCATGATGGACGCCTACAGTGTACACACGGACACGGACAGCGCGCTCTGTACATACGACACACTCACACACGCGTACAGGAACGTGTTCAGAGAACTGCGGCTGCCGGTGAGGAGAGTGGAGGCTCCGTCGGGTGACATGGGAGGCACTCTCTCCCACGAGTGGCAGCTGCCAGCTCCCTCTGGCGAGGACTGTCTGTCTGTGTGTCCGTCTTGCTCACACACCACCTTACTGGAGGAGGGGAAGGAGGGCAGAAAATGTGTCGCGTGTGGCAGAGAGACGGAGATATGTAGCAGTATTGAGGTTGGTCACACGTTCGTCCTCGGTGACAGGTACAGCGCCCCCATCGTGATGGCCTGCTATGGTATAGGACTCACGAGGCTGCTTGCCGCTAGTGTGGAGCTCCTCTCATCCGAGCGTTCCCTGAGGTGGCCGCACGCTCTGGCGCCCTACAAGGCCATAGTTATAGGACCTAAGGAAGGTTCTAAGGAGTGGGTACATCATGACAGTCCTCGGTTGGAGCAGCTCGGGGCTCAGGTGGAGGCTGTAGCTGGTGACGTGGTTTTGGACGACAGACATCACCTCACCATAGGGAAGAGATTGCTTCAGGCTGATAAAACTGGCTATCCATACATCATAGTGTGCGGGCGCTCCGCCCTGGAGTCTCCGCCGCGGTATGAACTGCATCGAGACCAAGGCGAAGTCCTAACTCTGCCGCTAAACGAACTATTAGCATTCATTAAAGATGATAACAAAGAACGAGATTTAAAGTTTAAAAGAGAAAGCGAATATATATAA

Protein sequence:

>DPOGS214446-PA
MKLLSKIFQPVITIPKGAKIKNTEITCKSQKLLLECGLVRPTSTGFFTLLPLARRALTKLENIVHRCLEDVGAQQISLPCLTSSRLWEASGRLDRVGSELLKVEDRHNKKYILSPTHEEAIADLLSDVAPLSHKQLPFILYQIGNKYRDELRPKHGLLRSREFLMMDAYSVHTDTDSALCTYDTLTHAYRNVFRELRLPVRRVEAPSGDMGGTLSHEWQLPAPSGEDCLSVCPSCSHTTLLEEGKEGRKCVACGRETEICSSIEVGHTFVLGDRYSAPIVMACYGIGLTRLLAASVELLSSERSLRWPHALAPYKAIVIGPKEGSKEWVHHDSPRLEQLGAQVEAVAGDVVLDDRHHLTIGKRLLQADKTGYPYIIVCGRSALESPPRYELHRDQGEVLTLPLNELLAFIKDDNKERDLKFKRESEYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: