MonarchBase - Protein-coding gene

DPOGS200737
Transcript	DPOGS200737-TA	3552 bp
Protein	DPOGS200737-PA	1183 aa
Genomic position	DPSCF300030 + 139893-146094
RNAseq coverage	425x (Rank: top 29%)

Annotation
*Heliconius*	HMEL008960	80.37%
*Bombyx*	BGIBMGA001037-TA	80.08%
*Drosophila*	CG33123-PA	63.49%
EBI UniRef50	UniRef50_E0VRG6	59.71%	Leucyl-tRNA synthetase, putative n=5 Tax=Bilateria RepID=E0VRG6_PEDHC
NCBI RefSeq	XP_395743.2	63.20%	PREDICTED: similar to CG33123-PA isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|66501629	63.20%	PREDICTED: leucyl-tRNA synthetase, cytoplasmic-like isoform 1 [Apis mellifera]
NCBI nr blastx	gi\|270006203	62.78%	hypothetical protein TcasGA2_TC008372 [Tribolium castaneum]

Group
Gene Ontology	GO:0004823	3.1e-286	leucine-tRNA ligase activity
	GO:0005524	3.1e-286	ATP binding
	GO:0000166	3.1e-286	nucleotide binding
	GO:0006429	3.1e-286	leucyl-tRNA aminoacylation
	GO:0005737	3.1e-286	cytoplasm
	GO:0006418	8.2e-30	tRNA aminoacylation for protein translation
	GO:0004812	8.2e-30	aminoacyl-tRNA ligase activity
KEGG pathway	ame:412282	0.0
	K01869 (LARS, leuS)	maps->	Aminoacyl-tRNA biosynthesis
			Valine, leucine and isoleucine biosynthesis
InterPro domain	[23-1062] IPR004493	3.1e-286	Leucyl-tRNA synthetase, class Ia, archaeal/eukaryotic cytosolic
	[514-749] IPR014729	2.9e-102	Rossmann-like alpha/beta/alpha sandwich fold
	[261-517] IPR009008	8.2e-30	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class Ia, editing domain
	[183-759] IPR002300	1.2e-26	Aminoacyl-tRNA synthetase, class Ia
	[768-992] IPR009080	1.2e-24	Aminoacyl-tRNA synthetase, class 1a, anticodon-binding
	[797-914] IPR013155	3.5e-14	Valyl/Leucyl/Isoleucyl-tRNA synthetase, class I, anticodon-binding
Orthology group	MCL12248		Single-copy universal gene

Nucleotide sequence:

>DPOGS200737-TA
ATGACAAATCTTTCCAGTACGGCAACCCTTGACCGCAAAGGAACCTTTAAGGTTGAATATCTCCAAGAGATTGAAAAGAAAGTTCAGGAGCGATGGGATCGAGAAAAAATTTTCGATATGGAAGCGCCGGATGACGGAAAAGACTATGAGAAGTTTTTGTGCACCTTTCCTTATCCATATATGAACGGACGTTTACACCTCGGACACACATTTTCATTATCAAAATGTGAGTTTGCCACCAGGTACTACAGGTTAAAAGGGAGGAAGGTTCTTTTTCCATTTGGTTTCCACTGCACCGGAATGCCTATCAAAGCATGCGCTGATAAGCTTAAAAGAGAAATGGCATTATATGGATGCCCACCAATCTTTCCCGATGACGAAATTGTAGAAGAAAAGGAACAAGGGGATATAGTCCCTAAAGATAAAAGTAAGGGCAAAAAAAGCAAAGCCGTGGCTAAGACAGGAGCTGCAAAGTATCAGTGGCAGATCATGCAGAGCATTGGAGTTCCCGAGGAGGAAATTAAGGAGTTTGCTAATGAGAGTTACTGGCTGGAGTACTTCCCACCTCGTGCCGTAGCTGACTTAAAAAGGATGGGAATCCATGTTGACTGGCGTAGAAAATTCATAACAACAGATGCGAATCCATTCTATGATTCATTCATCAGGTGGCAATTTCATCATCTGAAACAACGGAATAAGATTATGTATGGCAAACGCTATACTATATTTTCTCCGCTAGATAAGCAACCTTGCATGGACCATGACAGAAGTACTGGCGAAGGAGCTGGGCCACAGGAATATACACTTATTAAAATGGAAGTTTTGGAGCCTTTTCCTGAAGTTTTAAAACAATTTCAGGGTAAAACCTTAAACTTTGTAGCGGCAACACTCCGGCCTGAGACCATGTATGGCCAGACAAACTGTTGGGTCCATCCTGAAATTAAGTATATTGCATTTGAAACTGTCAAACACGGTGTGTTCATATGTACAAGACGAGCAGCTCGGAACATGTCGTATCAAGGATTTACCGAAAAAGATGGCGAATATAAAATCATTGCTGAAATTGTAGGGCTGGATCTATTAGGTGTGGCCTTGAAATCACCATTTACTTGCTATCAGAAAATTTACTCGCTTCCGATGTTAACAATTAAGGAGGATAAAGGAACGGGAATCGTTACCAGCGTGCCGTCTGATTCTCCCGATGATTACGCCGCATTGGTTGACCTACAAAAGAAAGCCCCGTTCAGAGAAAAGTACGGCATCCAAGACTATATGGTCATGCCATTTAAGCCTGTCTCCATATTAGAAATACCTGAATTCGGTAACCTCACAGCCGTGTTCCTATATGATAAACTTAAAATCCAAAGTCAAAATGACAAAGATAAACTGACCCAGGCCAAAGAAATGGCGTACCTGAAAGGATTTTACGACGGCGTGCTACTGGTCGGTGATTACAAAGGCGAGAAAATTCAGGATGTGAAGAAAAAATTGCAACAGAGGCTGATAGATGATAACTCCGCTGTAATCTATTACGAACCGGAAAAGACAATCATTTCCAGATCCGGTGACGAATGCGTTGTCGCACTTTGCAATCAATGGTATTTGGATTATGGTAATGCAGAATGGAAGGGCCAAGCAGAAAAAGCTTTGGCCGCAATGAACACGTATCACGATGAAGTGAGGAAAAACTTCCAGGCTACTCTTAAATGGCTTCACGAGTATGCTTGTTCCCGTACCTACGGTCTCGGCACCAAATTGCCGTGGGACACGCAATGGGTCATCGAATCGCTCTCCGACTCGACTATATACAACGCGTACTACACTATATCCCATTATCTGCAAGGCGACAGCTTTAGGGGTAATGTCGAAAATGATTTGAAAATTAAACCCGAAGAGATGTCGATTGAAGTTTGGGATTATATTTTCTTCAAAGACGCTCCCATACCTAAGAACACGAAAATATCTAAAAATAAATTAGATCTGATGAAGAAGTCTTTCCAATTCTGGTACCCAGTAGACCTCAGAGTGTCCGGAAAGGATCTCATTCAGAATCATCTGACGTTCTATATTTACAATCACTGTGCAATGTGGGAGAAAGAAGAAGACAAATGGCCAAAAGGGATCCGAGCAAATGGTCACCTCATGTTAAATTCAGCAAAAATGTCCAAATCTGACGGAAACTTCTTAACACTATCTGAGAGTATCGACAAATTCAGTGCCGATGGAATGAGACTGACTCTAGCTGACGCCGGAGACTCCGTTGAAGATGCTAACTTTGTTGAAAGTACAGCCGATGCCGCTATTTTAAGACTTTACACTTTTATTGAATGGGTGAAGGAGGTCATGGTCACTAAATCAAACTTCAGGACAGGAGAGTACAATTTCCATGATAAAGTTTTTGTCAGTGAAATGAACACAAAAATTATTCAGACTGATGATAACTACAACAAACTGCTGTTCAAGGAGGCCTTGAAAACTGGTTTCTTTGAGCTTCAGGCTGCCAGAGATAAATATAGGGAGTTGTGTTCCGAGGGAGGCATGCACGAGAGCCTTATAACACAGTACATTAGCACCCAGGCGAAACTCATTTCACCAATATGCCCGCATGTCGCTGAACATGTTTGGGAACTACTTGGTAATAAAGGTAGCATTCTTCATGAAAGATGGCCAGTTGCTGGAGAAGTGGATGAGATAGCAGTGAAAGCGAGCAACTATCTCATGGAAGCGGCTCACTCCTTCCGAGTTTATCTCAAAAATCATTGTGCTGTCAAAAAACCAAAGAAAGGAGAAGTCGTCAAACAGGAGTCTAAACCGAACAAAGCTGTTATATGGGTGGCCAAGGAATATCCTAAATGGCAACATATTATTTTGAGCACACTTAAAGAAATGCATGGACCAAATGGTCTTCCCGATAACAAAACAATATCCAGCAAGTTAGCAGAAATAAATGATCTGAAAAAGTATATGAAGAGGGTTATGCCGTTTGTTCAGGCGACCAGAGAGAACATAGAGCGTATTGGCCTTGAAGCTCTCCGCGTGGGATTGGCGTTTGATGAAGCGGCTGTACTACAGGATAATGCACAGTATTTAAGAGATACCCTCGATCTAGAGTACATAGAAATTAAATTGGTAGATGAGGACGCTCCAGAACGGACTCGTACTGAATGCGCTCCCGGGTCACCTCACGCCAGCTTCTTCACACATGTGACCCCGGCGGCGGACGTCGTGTTACTGAACCCCGACCAGCGCTCGGGTCTGTTCACAGTTAGCCTGAAGTTAGGGGAGGGGGAAACACTTGATTCCCTTAAGGAGAAGTTGGCGAAACAAGTCAAGGGGATACGAGATATGGATGCGCTTAAAATTTGGCGATACAAGGACCCGGTCCTCGGACCACGAAAGATTCCCGTCATAGGGGATTACGTCACCAAGTGTGTTGTGTTGGGAGCCGGCTCTGCGTTCAATGTTGACGTTGACAAGAACATAATTGAACTGGTTAATAACGGAACCAATATTAATGTCGGCAACCAACTGCTGTACACATACGACAACTAA

Protein sequence:

>DPOGS200737-PA
MTNLSSTATLDRKGTFKVEYLQEIEKKVQERWDREKIFDMEAPDDGKDYEKFLCTFPYPYMNGRLHLGHTFSLSKCEFATRYYRLKGRKVLFPFGFHCTGMPIKACADKLKREMALYGCPPIFPDDEIVEEKEQGDIVPKDKSKGKKSKAVAKTGAAKYQWQIMQSIGVPEEEIKEFANESYWLEYFPPRAVADLKRMGIHVDWRRKFITTDANPFYDSFIRWQFHHLKQRNKIMYGKRYTIFSPLDKQPCMDHDRSTGEGAGPQEYTLIKMEVLEPFPEVLKQFQGKTLNFVAATLRPETMYGQTNCWVHPEIKYIAFETVKHGVFICTRRAARNMSYQGFTEKDGEYKIIAEIVGLDLLGVALKSPFTCYQKIYSLPMLTIKEDKGTGIVTSVPSDSPDDYAALVDLQKKAPFREKYGIQDYMVMPFKPVSILEIPEFGNLTAVFLYDKLKIQSQNDKDKLTQAKEMAYLKGFYDGVLLVGDYKGEKIQDVKKKLQQRLIDDNSAVIYYEPEKTIISRSGDECVVALCNQWYLDYGNAEWKGQAEKALAAMNTYHDEVRKNFQATLKWLHEYACSRTYGLGTKLPWDTQWVIESLSDSTIYNAYYTISHYLQGDSFRGNVENDLKIKPEEMSIEVWDYIFFKDAPIPKNTKISKNKLDLMKKSFQFWYPVDLRVSGKDLIQNHLTFYIYNHCAMWEKEEDKWPKGIRANGHLMLNSAKMSKSDGNFLTLSESIDKFSADGMRLTLADAGDSVEDANFVESTADAAILRLYTFIEWVKEVMVTKSNFRTGEYNFHDKVFVSEMNTKIIQTDDNYNKLLFKEALKTGFFELQAARDKYRELCSEGGMHESLITQYISTQAKLISPICPHVAEHVWELLGNKGSILHERWPVAGEVDEIAVKASNYLMEAAHSFRVYLKNHCAVKKPKKGEVVKQESKPNKAVIWVAKEYPKWQHIILSTLKEMHGPNGLPDNKTISSKLAEINDLKKYMKRVMPFVQATRENIERIGLEALRVGLAFDEAAVLQDNAQYLRDTLDLEYIEIKLVDEDAPERTRTECAPGSPHASFFTHVTPAADVVLLNPDQRSGLFTVSLKLGEGETLDSLKEKLAKQVKGIRDMDALKIWRYKDPVLGPRKIPVIGDYVTKCVVLGAGSAFNVDVDKNIIELVNNGTNINVGNQLLYTYDN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: