MonarchBase - Protein-coding gene

DPOGS210182
Transcript	DPOGS210182-TA	2532 bp
Protein	DPOGS210182-PA	843 aa
Genomic position	DPSCF300393 + 148006-153804
RNAseq coverage	1x (Rank: top 94%)

Annotation
*Heliconius*	HMEL012750	8e-134	65.88%
*Bombyx*	BGIBMGA014150-TA	0.0	65.72%
*Drosophila*	CG5414-PB	0.0	43.25%
EBI UniRef50	UniRef50_UPI0001792271	0.0	44.20%	UPI0001792271 related cluster n=1 Tax=unknown RepID=UPI0001792271
NCBI RefSeq	XP_001949755.1	0.0	44.20%	PREDICTED: similar to CG5414 CG5414-PA [Acyrthosiphon pisum]
NCBI nr blastp	gi\|193636717	0.0	44.20%	PREDICTED: isoleucyl-tRNA synthetase, mitochondrial-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|193636717	0.0	43.95%	PREDICTED: isoleucyl-tRNA synthetase, mitochondrial-like [Acyrthosiphon pisum]

Group
Gene Ontology	GO:0004822	6e-286	isoleucine-tRNA ligase activity
	GO:0005524	1.5e-204	ATP binding
	GO:0006428	1.5e-204	isoleucyl-tRNA aminoacylation
	GO:0000166	1.5e-204	nucleotide binding
	GO:0005737	1.5e-204	cytoplasm
	GO:0006418	1.2e-134	tRNA aminoacylation for protein translation
	GO:0004812	1.2e-134	aminoacyl-tRNA ligase activity
KEGG pathway	api:100166726	0.0
	K01870 (IARS, ileS)	maps->	Aminoacyl-tRNA biosynthesis
			Valine, leucine and isoleucine biosynthesis
InterPro domain	[1-842] IPR023585	6e-286	Isoleucyl-tRNA synthetase, type 1
	[1-764] IPR002301	1.5e-204	Isoleucyl-tRNA synthetase
	[1-574] IPR002300	1.2e-134	Aminoacyl-tRNA synthetase, class Ia
	[337-572] IPR014729	4.7e-96	Rossmann-like alpha/beta/alpha sandwich fold
	[143-336] IPR009008	6.7e-38	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class Ia, editing domain
	[587-841] IPR009080	3.9e-35	Aminoacyl-tRNA synthetase, class 1a, anticodon-binding
	[619-744] IPR013155	3.3e-21	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class I, anticodon-binding
Orthology group	MCL11857		Single-copy universal gene

Nucleotide sequence:

>DPOGS210182-TA
ATGGGGCATGCTGTTAACAAGATCATTAAGGATATAAACAACAGAAGTCAGATTCTTCAAGGCAATAAGGTCCATTATGTACCAGGCTGGGACTGCCATGGACTTCCAATAGAGTTTAAAGCTCTCCAGAAAACAAAAAGCAAAAATGAACCCACCGATCCAGTACAAACAAGACAAATAGCAAGAAGTTTTGCACTCGAAACAGTTAAGAGCCAAAAAGAAGCATTCGAAAGCTGGGGTATAATGGCCGATTGGGAAAAACAATGTTATTTAACACTCGATAAAAACTATGTCCAGAGCCAGCTGAGATTGTTCTATAAAATGTACAAATCTGGCTTAATTTACCAAGCCCTTAAACCGGTTTATTGGTCACCATCTTCAAGGACAGCATTAGCTGAAGCGGAATTGGAATATGATCCTAACTTTAAAAGCAAAGAGGTTTATTTTAAATTTCCCATGGAGAAAGTTCCTGATTTGGTAAAAAATGTCTGTTCTGACCAACAAATATTTGCCCTCATCTGGACAACAACTCCTTGGACATTGGTTGCTAACAAAGCGATAGCTTACAACCCCAGCATGGTGTACTGTGTCGCCAAAATGAGTAAAAGATCTGAGCTATTCCTTATTGCTAAAGATCAGATTCAAGAGCTAGAGAGAGTATTGGACTGTGGAATATCCATTGTGGTGGAGTTTGAGGGTCAACATTTATCATCCACAACTTATAACGGTCTGTCACACACTATGCCGCTAATACCAGGACCACACGTGACCAGTGGCAAGGGCACCGGCTTAGTTCATACAGCACCCGCACATGGACCGGATGACTTTGTCGTTGCTCTCAATAATAATATTACTGTGGAGTGCAATGTGGACGAACACGGCCGCTATATAAACCTCGGTCCCGATTTGGACGGGCTATACGTGCTGCAGGAAGGCCAGGAAACTGTGATGAAGAAGCTTCGAGACTCGATTATATATGAGGGTATATTCACCCATTCCTATCCATTGGATTGGAGAACTAAAAAACCGGTTATCCTAAGAGCCAGCCATCAGTGGTTCATAGACACGAACGCGTTGAAACAAACGGCCCTGGGAGCTCTAGATAAAGTGGCTATCCTACCACCATCCACGGCGGACCAGTCTAGACAGGGCTTCCGCGCTCAATTGGAGAAGAGGCCCTACTGGTGTATATCGAGACAGAGAGCCTGGGGCGTGCCCATACCTGCTCTATATAGGGGTAACGAGATCATTGTTGATGAGGAAATCATAGAGAATATCTGTTCTCTCATAGACAAGGACGGCACAGACGTTTGGTGGACTTGCGATGTGAAGGATCTCATACCGAAGAAGATTTCTGAGAAATTTAATTGTGAAGAAATTACCAAAGGAAAGGATATAATGGACATCTGGCTGGACTCTGGTCTTTCCTGGCACACCCTGGATCGTAAGGCTCACCTGTATTCTGAAGGTGTTGACCAACTCACCGGTTGGTTCCAAGCTTCCTTGCTAACATCTCTCGCTCTGAATGGTGAAGCGCCTTACGAATCTATATTCGTACACGGCTTCGTAGTTGACGACAAGAAACGTAAAATGTCTAAATCCATAGGCAATGTCATTGACCCGAAAACCATAATATTCGGTGACAAGAAGAACGCCGCTTACGGTGTCGACACCTTGAGGTGGTGGGTCGCGAGTCACTCCACTCAACATTCCCAAATAGTCATCAGCAAGAAACTTCTAGAGGACTGTCAGAACGAAGTGATAAGGATACGAAACATAATGAAATACCTGCTCGGCGTGATCAGCGATTTAGAGAAGACGGATTTCTACAAGAATCCAACATTAAATTTCTTCGACCGATACATGGTCACGGAATGTCATAGTTTTGTGAACGAAACTAATCACCATTACGATAATTTTAGATACAATCATGTGGCGCAGAATGTATTATATTTTATAAGTAATAAGGTGTCCGGGTTGTATTGTCACTGTATTAAAGACAGGTTGTACTGTTCAATGAGAAATTCTAAAGAGAGACTCGCCGCTCAGCTTGTGATACATACGATTCTGGTCTCTCTGTGTAAGGGTTTAGGGCCAATTTTGCCTCATCTGATCGAAGAAGTGTGGCAGTATCATCCGTTGTATGATGAACCGTTTTATTTCACCAAAGATCTGCCAGTCTTGAAGCCGTCTGATGTTGATTCGTCGTTAATGGAGGCCATATTGGATATCAAAAGAAACGTTATACTAAAAACTAAAAATGAACATTTGAAGAAATTCGAACTAAATTTAACAATAAATTCAGAGTTATATAATAAATTAGATGATTTAAACCACACAGATGGCATCAACGATAGTGTGTTATGTGAAATTCTAGAACTGTCATCTGTCAGATTGAATAATGGCGGGGAAAATATGCTAGTAGATTTGACACAGAGTAAAAAAGATCAATGTTTGAGATGCAGGAAATATAATGCGATAGATAATAGTGACAAGTGTTTGAGATGTGAAAAAGTTTTAGCTATGTATTGA

Protein sequence:

>DPOGS210182-PA
MGHAVNKIIKDINNRSQILQGNKVHYVPGWDCHGLPIEFKALQKTKSKNEPTDPVQTRQIARSFALETVKSQKEAFESWGIMADWEKQCYLTLDKNYVQSQLRLFYKMYKSGLIYQALKPVYWSPSSRTALAEAELEYDPNFKSKEVYFKFPMEKVPDLVKNVCSDQQIFALIWTTTPWTLVANKAIAYNPSMVYCVAKMSKRSELFLIAKDQIQELERVLDCGISIVVEFEGQHLSSTTYNGLSHTMPLIPGPHVTSGKGTGLVHTAPAHGPDDFVVALNNNITVECNVDEHGRYINLGPDLDGLYVLQEGQETVMKKLRDSIIYEGIFTHSYPLDWRTKKPVILRASHQWFIDTNALKQTALGALDKVAILPPSTADQSRQGFRAQLEKRPYWCISRQRAWGVPIPALYRGNEIIVDEEIIENICSLIDKDGTDVWWTCDVKDLIPKKISEKFNCEEITKGKDIMDIWLDSGLSWHTLDRKAHLYSEGVDQLTGWFQASLLTSLALNGEAPYESIFVHGFVVDDKKRKMSKSIGNVIDPKTIIFGDKKNAAYGVDTLRWWVASHSTQHSQIVISKKLLEDCQNEVIRIRNIMKYLLGVISDLEKTDFYKNPTLNFFDRYMVTECHSFVNETNHHYDNFRYNHVAQNVLYFISNKVSGLYCHCIKDRLYCSMRNSKERLAAQLVIHTILVSLCKGLGPILPHLIEEVWQYHPLYDEPFYFTKDLPVLKPSDVDSSLMEAILDIKRNVILKTKNEHLKKFELNLTINSELYNKLDDLNHTDGINDSVLCEILELSSVRLNNGGENMLVDLTQSKKDQCLRCRKYNAIDNSDKCLRCEKVLAMY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: