MonarchBase - Protein-coding gene

DPOGS206538
Transcript	DPOGS206538-TA	1026 bp
Protein	DPOGS206538-PA	341 aa
Genomic position	DPSCF300190 - 137459-143417
RNAseq coverage	1008x (Rank: top 13%)

Annotation
*Heliconius*	HMEL011631	1e-56	70.06%
*Bombyx*	BGIBMGA004208-TA	4e-125	63.21%
*Drosophila*	CG10621-PA	7e-92	50.16%
EBI UniRef50	UniRef50_Q2F5Q8	3e-118	63.43%	Homocysteine S-methyltransferase n=11 Tax=Endopterygota RepID=Q2F5Q8_BOMMO
NCBI RefSeq	XP_966501.1	5e-119	63.53%	PREDICTED: similar to homocysteine S-methyltransferase isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91083213	9e-118	63.53%	PREDICTED: similar to homocysteine S-methyltransferase isoform 1 [Tribolium castaneum]
NCBI nr blastx	gi\|114052514	3e-115	64.14%	homocysteine S-methyltransferase [Bombyx mori]

Group
Gene Ontology	GO:0008898	2e-81	homocysteine S-methyltransferase activity
KEGG pathway	tca:662176	1e-118
	K00547 (E2.1.1.10, mmuM)	maps->	Cysteine and methionine metabolism
InterPro domain	[13-322] IPR003726	2e-81	Homocysteine S-methyltransferase
Orthology group	MCL12369		Insect specific

Nucleotide sequence:

>DPOGS206538-TA
ATGACACCAACAAATGAGGACGGTGTGGAACCGCCGCACATAGTTGTTTTAGACGGAGGATTCTCTACGCAACTTTCCTGTCACGTAGGTCATGTCATTGACGGTGACCCTCTCTGGAGCGCCCGCTTCTTGCACACACACCCCAACGAGGTTGTGAATACTCATCTTGACTTCCTTAGAGCTGGGGCCAATTTTATAATTACGAATACATATCAAGCATCTGTCGAGGGTTTTGTGGAACACCTGGATCTGACACCGGAGCAAGGATATGAGCTCATCACCAGAGCTGTCGAGCTCGCGAAGCAGGCTCGTACATTGTATCTTGAGGAGTATGAGAATTACATACAACACGATCACGTCCCACTAGTTGTAGGATCTGTAGGACCATATGGGGCTCATTTGCACGATGGCTCGGAATACGACGGCAGTTACGCGGACACAACATCTGCTCAGACAATGCGTGAATGGCATAGACCTCGAATTCAAGCGTTAATAGAAGCTGGAGTGGATCTGCTAGCTTTAGAGACGATACCTTGTCAAGAAGAGGCTGAGATGTTGTGTGACTTGTTGCGCGAATTTCCCAATATGAAAGCTTGGCTGTCCTTTAGCTGCAAAGATAATCAAAGCATAGCTCACGGTGAAAGTTTTCAAAAAGTGGCTAAGAAATGTTGGGAGTCGAATTCAGATCAGCTGGTGGCTGTGGGGGTGAACTGCTGCGCCCCTTCGTTTGTGACCAGTCTATTAAAGGGGATCAACGACGATAGGCCGCACGACCCCATACCCCTCATCGTTTACCCCAACTCCGGCGAAAAGTACAACCCGCAAATTGGATGGATAGATCGCGATAAGTGCGAACCCGTGGAAGTATTCATCCAGGAATGGTTGGACTTAGGAGTGCGATACGTGGGCGGGTGCTGTCGTACATACGCAGCAGATGTATCAAGAATACGTAACCAGGTCCACTGCTGGAGAGATCGTTGGCGCTTCCAGCACAAGTTTACATCTAACACTCAGAATAATAATTGA

Protein sequence:

>DPOGS206538-PA
MTPTNEDGVEPPHIVVLDGGFSTQLSCHVGHVIDGDPLWSARFLHTHPNEVVNTHLDFLRAGANFIITNTYQASVEGFVEHLDLTPEQGYELITRAVELAKQARTLYLEEYENYIQHDHVPLVVGSVGPYGAHLHDGSEYDGSYADTTSAQTMREWHRPRIQALIEAGVDLLALETIPCQEEAEMLCDLLREFPNMKAWLSFSCKDNQSIAHGESFQKVAKKCWESNSDQLVAVGVNCCAPSFVTSLLKGINDDRPHDPIPLIVYPNSGEKYNPQIGWIDRDKCEPVEVFIQEWLDLGVRYVGGCCRTYAADVSRIRNQVHCWRDRWRFQHKFTSNTQNNN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: