MonarchBase - Protein-coding gene

DPOGS210181
Transcript	DPOGS210181-TA	2748 bp
Protein	DPOGS210181-PA	915 aa
Genomic position	DPSCF300393 + 125205-131473
RNAseq coverage	0x (Rank: top 98%)

Annotation
*Heliconius*	HMEL012750	1e-177	67.13%
*Bombyx*	BGIBMGA014150-TA	0.0	63.95%
*Drosophila*	CG5414-PB	0.0	42.34%
EBI UniRef50	UniRef50_UPI0001792271	0.0	43.77%	UPI0001792271 related cluster n=1 Tax=unknown RepID=UPI0001792271
NCBI RefSeq	XP_001949755.1	0.0	43.77%	PREDICTED: similar to CG5414 CG5414-PA [Acyrthosiphon pisum]
NCBI nr blastp	gi\|193636717	0.0	43.77%	PREDICTED: isoleucyl-tRNA synthetase, mitochondrial-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|193636717	0.0	43.37%	PREDICTED: isoleucyl-tRNA synthetase, mitochondrial-like [Acyrthosiphon pisum]

Group
Gene Ontology	GO:0005524	3.8e-205	ATP binding
	GO:0006428	3.8e-205	isoleucyl-tRNA aminoacylation
	GO:0000166	3.8e-205	nucleotide binding
	GO:0005737	3.8e-205	cytoplasm
	GO:0004822	3.8e-205	isoleucine-tRNA ligase activity
	GO:0006418	2.9e-141	tRNA aminoacylation for protein translation
	GO:0004812	2.9e-141	aminoacyl-tRNA ligase activity
KEGG pathway	api:100166726	0.0
	K01870 (IARS, ileS)	maps->	Aminoacyl-tRNA biosynthesis
			Valine, leucine and isoleucine biosynthesis
InterPro domain	[30-914] IPR023585	0	Isoleucyl-tRNA synthetase, type 1
	[56-837] IPR002301	3.8e-205	Isoleucyl-tRNA synthetase
	[78-654] IPR002300	2.9e-141	Aminoacyl-tRNA synthetase, class Ia
	[435-652] IPR014729	7.7e-105	Rossmann-like alpha/beta/alpha sandwich fold
	[241-434] IPR009008	7.8e-38	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class Ia, editing domain
	[667-913] IPR009080	2.9e-30	Aminoacyl-tRNA synthetase, class 1a, anticodon-binding
	[699-818] IPR013155	1.2e-15	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class I, anticodon-binding
Orthology group	MCL11857		Single-copy universal gene

Nucleotide sequence:

>DPOGS210181-TA
ATGTTCAAAACATACAATTTAAGAACTTTTCATAATAATTATAGAAAATCAAACATAAAATGGACCTCCTTCTTTTGTACGAGAGAGGAAAGTTCAACAAAACCAAAAACAAAAACATACTCTCACACAGTTTTGTTCCCTAAAACAAATTTTCCGGCTAGATCTAATATCAACAAAGAGAAAATTCAAAAGACTGCAAAGTTTTCTGAACTCTATGAATGGCAGCGGGAACATTTAACTGGTCCAGAATTTATTTTACATGACGGGCCACCTTATGCAAATGGAGCTTTACATATGGGGCATGCTGTTAACAAGATCATTAAGGATATAAACAACAGAAGTCAGATTCTTCAAGGCAATAAGGTCCATTATGCACCAGGCTGGGACTGCCATGGACTTCCAATAGAGTTTAAAGCTCTCCAGAAAACAAAAAGCAAAAATGAACCCACCGATCCAGTACAAACAAGACAAATAGCAAGAAGTTTTGCACTCGAAACAGTTAAGAGCCAGAAAGAAGCATTCGAAAGCTGGGGTATAATGGCCGATTGGGAAAAACAATGTTATTTAACACTCGATAAAAACTATGTCCAGAGCCAGCTGAGATTGTTCTATAAAATGTACAAATCCGGCTTAATTTACCAAGCCCTTAAACCGGTTTATTGGTCTCCATCTTCAAGGACAGCATTAGCTGAAGCGGAATTGGAATATGATCCTAACTTTAAAAGCAAAGAGGTTTATTTTAAATTTCCCATGGAGAAAGTTCCTGATTTGGTAAAAAATGTCTGTTCTGACCAACAAATTTTTGCCCTCATCTGGACAACAACTCCTTGGACATTAGTTGCTAACAAAGCGATAGCTTACAACCCCAGCATGGTGTACTGTGTTGCCAAAATGAGTAAAAGATCTGAGCTATTCCTTATTGCTAAAGATCAGATTCAAGAGCTAGAGAGAGTATTGGACTGTGGAATATCCATTGTGGTGGAGTTTGAGGGTCAACATTTATCATCCACAACTTATAACGGTCTGTCACACACTATGCCGCTAATACCAGGACCACACGTGACCAGTGGCAAGGGCACCGGCTTAGTTCATACAGCACCCGCACATGGACCGGATGACTTTGTCGTTGCTCTCAATAATAATATTACTGTGGAGTGCAATGTGGACGAACACGGCCGCTATATAAACCTCGGTCCCGATTTGGACGGGCTATACGTGCTGCAGGAAGGCCAGGAAACTGTGATGAAGAAGCTTCGAGACTCGATTATATATGAGGGTATATTCACCCATTCCTATCCATTGGATTGGAGAACTAAAAAACCGGTTATCCTAAGAGCCAGCCATCAGTGGTTCATAGACACGAACGCGTTGAAACAAACGGCCCTGGGAGCTCTAGATAAAGTGGCTATCCTACCACCATCCACGGCGGACCAGTCTAGACAGGGCTTCCGCGCTCAATTGGAGAAGAGGCCCTACTGGTGTATATCGAGACAGAGAGCCTGGGGCGTGCCCATACCTGCTCTATATAGGGACAAGGACGGCACAGACGTTTGGTGGACTTGCGATGTGAAGGATCTCATACCGAAGAAGATTTCTGAGAAATTTAATTGTGAAGAAATTACCAAAGGAAAGGATATAATGGACATCTGGCTGGACTCTGGTCTTTCCTGGCACACCCTGGATCGTAAGGCTCACCTGTATTCTGAAGGTGTTGACCAACTCACCGGTTGGTTCCAAGCTTCCTTGCTAACATCTCTCGCTCTGAATGGTGAAGCGCCTTACGAATCTATATTCGTACACGGCTTCGTAGTTGACGACAAGAAACGTAAAATGTCTAAATCCATAGGCAATGTCATTGACCCGAAAACCATAATATTCGGTGACAAGAAGAACGCCGCTTACGGTGTCGACACATTGAGGTGGTGGGTCGCGAGTCACTCCACTCAACATTCCCAAATAGTCATCAGCAAGAAACTTCTAGAGGACTGTCAGAACGAAGTGATAAGGATACGAAACATAATGAAATACCTACTAGGCGTGATCAGCGATTTAGAGAAGACGGATTTCTACAAGAATCCAACATTAAATTTCTTCGACCGATACATGGTCACGGAATGTCATAGTTTTGTGAACGAAACTAATCACCATTACGATAATTTTAGATACAATCATGTGGCGCAGAATGTGTCCGGATTGTATTGTCACTGTATTAAAGACAGGTTGTACTGTTCAATGAGAAATTCTAAAGAGAGACTCGCCGCTCAGCTTGTGATACATACGATTCTGGTCTCTCTGTGTAAGGGTTTAGGGCCAATTTTGCCTCATCTGATCGAAGAAGTGTGGCAGTATCATCCGTTGTATGATGAACCGTTTTTTTTCACCAAAGAACTGCCAGTCTTGAAGCCGTCTGATGTTGATTCGTCGTTAATGGAGGCCATATTGGATATTAAAAGAAACGTTATACTAAAAACTAAAAATGAACATTTGAAGAAATTCGAATTAAATTTAACAATAAATTCAGAGTTATATAATAAATTAGATGATTTAAACCACACAGATGGCATCAACGATAGTGTGTTATGTGAAATTCTAGAACTGTCATCTGTCAGATTGAATAATGGCGGGGAAAATATGCTCGTAGATTTGACACAGAGTAAAAAAGATCAATGTTTGAGATGCAGGAAATATAATGCGATAGATAATAGTGACAAGTGTTTGAGATGTGAAAAAGTTTTAGCTATGTATTGA

Protein sequence:

>DPOGS210181-PA
MFKTYNLRTFHNNYRKSNIKWTSFFCTREESSTKPKTKTYSHTVLFPKTNFPARSNINKEKIQKTAKFSELYEWQREHLTGPEFILHDGPPYANGALHMGHAVNKIIKDINNRSQILQGNKVHYAPGWDCHGLPIEFKALQKTKSKNEPTDPVQTRQIARSFALETVKSQKEAFESWGIMADWEKQCYLTLDKNYVQSQLRLFYKMYKSGLIYQALKPVYWSPSSRTALAEAELEYDPNFKSKEVYFKFPMEKVPDLVKNVCSDQQIFALIWTTTPWTLVANKAIAYNPSMVYCVAKMSKRSELFLIAKDQIQELERVLDCGISIVVEFEGQHLSSTTYNGLSHTMPLIPGPHVTSGKGTGLVHTAPAHGPDDFVVALNNNITVECNVDEHGRYINLGPDLDGLYVLQEGQETVMKKLRDSIIYEGIFTHSYPLDWRTKKPVILRASHQWFIDTNALKQTALGALDKVAILPPSTADQSRQGFRAQLEKRPYWCISRQRAWGVPIPALYRDKDGTDVWWTCDVKDLIPKKISEKFNCEEITKGKDIMDIWLDSGLSWHTLDRKAHLYSEGVDQLTGWFQASLLTSLALNGEAPYESIFVHGFVVDDKKRKMSKSIGNVIDPKTIIFGDKKNAAYGVDTLRWWVASHSTQHSQIVISKKLLEDCQNEVIRIRNIMKYLLGVISDLEKTDFYKNPTLNFFDRYMVTECHSFVNETNHHYDNFRYNHVAQNVSGLYCHCIKDRLYCSMRNSKERLAAQLVIHTILVSLCKGLGPILPHLIEEVWQYHPLYDEPFFFTKELPVLKPSDVDSSLMEAILDIKRNVILKTKNEHLKKFELNLTINSELYNKLDDLNHTDGINDSVLCEILELSSVRLNNGGENMLVDLTQSKKDQCLRCRKYNAIDNSDKCLRCEKVLAMY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: