MonarchBase - Protein-coding gene

DPOGS202372
Transcript	DPOGS202372-TA	1425 bp
Protein	DPOGS202372-PA	474 aa
Genomic position	DPSCF300104 + 153006-158352
RNAseq coverage	657x (Rank: top 19%)

Annotation
*Heliconius*	HMEL002887	5e-106	82.46%
*Bombyx*	BGIBMGA013895-TA	0.0	79.11%
*Drosophila*	CG4802-PA	3e-88	60.56%
EBI UniRef50	UniRef50_Q7ZV22	9e-89	57.25%	S-methyl-5'-thioadenosine phosphorylase n=28 Tax=cellular organisms RepID=MTAP_DANRE
NCBI RefSeq	NP_001040514.1	5e-125	79.85%	5'-methylthioadenosine phosphorylase [Bombyx mori]
NCBI nr blastp	gi\|114052284	1e-123	79.85%	5'-methylthioadenosine phosphorylase [Bombyx mori]
NCBI nr blastx	gi\|114052284	9e-126	80.44%	5'-methylthioadenosine phosphorylase [Bombyx mori]

Group
Gene Ontology	GO:0016763	1.2e-123	transferase activity, transferring pentosyl groups
	GO:0009116	1.3e-43	nucleoside metabolic process
	GO:0003824	1.3e-43	catalytic activity
	GO:0005488	2.5e-15	binding
KEGG pathway	tgu:100228406	4e-89
	K00772 (E2.4.2.28, mtaP)	maps->	Cysteine and methionine metabolism
InterPro domain	[202-472] IPR001369	1.2e-123	Purine phosphorylase, family 2
	[204-447] IPR010044	5.3e-90	Methylthioadenosine phosphorylase
	[204-443] IPR000845	1.3e-43	Nucleoside phosphorylase domain
	[97-204] IPR011990	2.5e-15	Tetratricopeptide-like helical
Orthology group	MCL14520		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202372-TA
ATGACTTACGACCTCAAAAGGGAAGAGGAAGTGAAAGAATACGTTGAAAACCTCGGTATTGAATATAGGTTTGGTTGTTACAAAGAGAAAAAACCGGAGGTCTGTCACCTTTTGGGGGATTATTTAGAAGCTATAAAAAAGGATTTTAGCAAAGCGGCGGCGGTTTTCAAGACCAATTGCGACGATTATAATTACGGGAAATCATGTTTAAAGTACGGAAATTACGCGTTGTTGGGAAAAGGCAGGGAAAAGAGTGACACACAGGAGGCATTAAAGTATTTCGAGAAGGGTTGTGAATTGAACGATCCTACGGCATGTTTACATGCTGGGGTGATTTTAACAGCTACTGGACCCGCTGTTACTGTACAACGAGATGTTCCAAAAGGTTACAACTACTTAAAGAAAAGCTGTGATCAAAATGATGCAATGGCTTGTCACTATCTAGCTGGCATGTACTTAACGGGAGTCCCGAAGAATCCGACAGAGTATAACCCACACAATCCAGAGAAGAACAAAAATTTAGACTACCTCATAAAACCTGATCCAATACAGGCTTTTGGTTTTGCCAAAAAGGGTTGCGAGAATGGTAACATATTTGCCTGTGCGAACATCGGTATAATCGGAGGCTCTGGGTTCGATGACCCAGATCTATTTGAAAATCCAATACCCCGTGATGTCGACACTCCATTCGGGAAGCCCTCGGACGTTCTTCTAGAAGGATCTATTAAAGGAGTGTCTTGCGTCCTATTAGCGAGACACGGAAGAAAACACCAGTATCAACCGAGCGATGTCAATTACCGAGCTAATATTTGGGCGTTGAAACAAATTGGCTGTACACATATATTGGCCACTACCGCCACTGGATCGCTTGTAGAAAATTACCGGCCCGGGGATCTTGTTATACTGGACGATTTCATTGACAGAACATGGGGTCGTAAGTGTACGTTCTTCGACGGCACATCGGGTGGACCCCGCGGGGTGTGCCATTTACCCATGAGGCCGGCGTTCTGTGAGCGGGCGAGGGGGGCTCTCGTGACGGCCGCGAACGAGGCGGGGCTACGCTGTCACGAGCGAGGGACTGCGGTCACTATACAGGGACCGAGATTCTCAAGTCGAGCTGAGAGTCTGATGCATCGTCAGTGGGGAGCGCACGTAGTCAACATGACCACCGTACCGGAGGTGGTGTTGGCTAAGGAAGCTGGGTTGAGCTACGCCGCGGTGGCTCTGGTCACCGACTATGACTGCTGGAGAGACAACGAGCAGTCGGTGTCAGTGAGCGAGGTGCTGGAGATGTTCGCGAGGAACATTAAGAAGGCGATCCAGGTGATCGTGGAGGCGGTGGTGCTCCTCGCCGCGGAAGACGACCTGACGTACCTGGACTCACACACGGACCTGGTGTCGTCGGCTGTGATGCTGAAGGACTAG

Protein sequence:

>DPOGS202372-PA
MTYDLKREEEVKEYVENLGIEYRFGCYKEKKPEVCHLLGDYLEAIKKDFSKAAAVFKTNCDDYNYGKSCLKYGNYALLGKGREKSDTQEALKYFEKGCELNDPTACLHAGVILTATGPAVTVQRDVPKGYNYLKKSCDQNDAMACHYLAGMYLTGVPKNPTEYNPHNPEKNKNLDYLIKPDPIQAFGFAKKGCENGNIFACANIGIIGGSGFDDPDLFENPIPRDVDTPFGKPSDVLLEGSIKGVSCVLLARHGRKHQYQPSDVNYRANIWALKQIGCTHILATTATGSLVENYRPGDLVILDDFIDRTWGRKCTFFDGTSGGPRGVCHLPMRPAFCERARGALVTAANEAGLRCHERGTAVTIQGPRFSSRAESLMHRQWGAHVVNMTTVPEVVLAKEAGLSYAAVALVTDYDCWRDNEQSVSVSEVLEMFARNIKKAIQVIVEAVVLLAAEDDLTYLDSHTDLVSSAVMLKD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: