MonarchBase - Protein-coding gene

DPOGS210609
Transcript	DPOGS210609-TA	963 bp
Protein	DPOGS210609-PA	320 aa
Genomic position	DPSCF300168 + 27359-28718
RNAseq coverage	459x (Rank: top 27%)

Annotation
*Heliconius*	HMEL005898	6e-76	82.12%
*Bombyx*	BGIBMGA014414-TA	5e-139	75.79%
*Drosophila*	CG3793-PB	8e-97	55.66%
EBI UniRef50	UniRef50_Q9V3K7	9e-95	55.66%	CG3793 n=30 Tax=Coelomata RepID=Q9V3K7_DROME
NCBI RefSeq	XP_314892.4	9e-98	54.69%	AGAP008768-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|289740867	3e-97	55.99%	leucine carboxyl methyltransferase 1 protein [Glossina morsitans morsitans]
NCBI nr blastx	gi\|289740867	8e-95	56.17%	leucine carboxyl methyltransferase 1 protein [Glossina morsitans morsitans]

Group
Gene Ontology	GO:0008168	1.9e-143	methyltransferase activity
KEGG pathway	hsa:51451	1e-55
	K00599 (E2.1.1.-)	maps->	Naphthalene and anthracene degradation
			Tyrosine metabolism
			Histidine metabolism
			Selenoamino acid metabolism
InterPro domain	[1-321] IPR016651	1.9e-143	Leucine carboxyl methyltransferase, LCTM1 1
	[11-310] IPR021121	2.1e-124	Leucine carboxyl methyltransferase, eukaryotic
	[13-204] IPR007213	1.7e-34	Leucine carboxyl methyltransferase
Orthology group	MCL14248		Single-copy universal gene

Nucleotide sequence:

>DPOGS210609-TA
ATGAATAATATAATATCTTGGAGTGCCGAAGACGAGGCTATCATTGCTACAAACACGGATGCTACTGAATGCAAGCGGTGTGCAGTTGAATTGGGTTATTGGAAAGATGAATACATTTCATATTTTGCTAAACATGTCGATCGAAAAGCTCCAGAAATAAATCGTGGATATTATGCGAGAGTTAAAGCAATGGAAATGTTTATTCATCAATTTTTAGAGAGATGTGGTACCAAGTGTCAGATCATCAACCTGGGATGTGGTTTTGATACTCTGTATTGGCGCCTCAAGGACACTACACAAGCCGTCAGCAACTTTATAGAGTTGGACTTTCCATCGGTAACAAGCAAGAAATGTCACATCATCAAACGTAACAAGCAGCTATTGGAGAAGATTTGCAAAGAAGGCATAAATGGGGAGGTCGTGATCCGGTCTGGTGATCTCCACTCTGACGGTTACCATCTGCTGGGCTGCGACCTGCGTTGTTTGGAGGAGGTCCGTCGCAAGTTGCAGGCGGCCGGCGCCACTGCCGAGGCACCCGCGCTGTTGCTCGCGGAATGCGTGTTGGTGTACCTGAGGCCCGAGGCGGCGCTGGCGCTGCTCCGCCACCTGGCCGCCGCCTTCCCTCGCTGCGTGCTCCTGCTTTACGAGCAGTGTAACCTGTCCGACCGCTTCGGCGAGGTCATGCTGCGCAACCTGAGCGCGCGCGGATGTCCGCTGGCTGGCGCCGAGCACTGCCGCGAGCCGGCGGCTCAAGCCGAACGCCTCGTGTCACTAGGCTTCGACGCGGCGCGCTCCTGGGACATGGAGACCGTGTGGCGCTCCTTCCCCGAGGACGAGCGCTCGCGAGTGGACGCGCTGGAGATGCTGGACGAGCGCGAGCTGCTCCTGCAGCTGAACACGCATTACGCGCTGACGGTGGCCACTCGCGGGGAACTGTTCGCCGACCTCGACCTCGCCGGGTAG

Protein sequence:

>DPOGS210609-PA
MNNIISWSAEDEAIIATNTDATECKRCAVELGYWKDEYISYFAKHVDRKAPEINRGYYARVKAMEMFIHQFLERCGTKCQIINLGCGFDTLYWRLKDTTQAVSNFIELDFPSVTSKKCHIIKRNKQLLEKICKEGINGEVVIRSGDLHSDGYHLLGCDLRCLEEVRRKLQAAGATAEAPALLLAECVLVYLRPEAALALLRHLAAAFPRCVLLLYEQCNLSDRFGEVMLRNLSARGCPLAGAEHCREPAAQAERLVSLGFDAARSWDMETVWRSFPEDERSRVDALEMLDERELLLQLNTHYALTVATRGELFADLDLAG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: