MonarchBase - Protein-coding gene

DPOGS211994
Transcript	DPOGS211994-TA	1338 bp
Protein	DPOGS211994-PA	445 aa
Genomic position	DPSCF300514 + 9472-17343
RNAseq coverage	468x (Rank: top 27%)

Annotation
*Heliconius*	HMEL009358	4e-130	62.72%
*Bombyx*	BGIBMGA009808-TA	0.0	80.04%
*Drosophila*	CG9977-PA	0.0	69.82%
EBI UniRef50	UniRef50_O43865	3e-174	67.48%	Putative adenosylhomocysteinase 2 n=243 Tax=Metazoa RepID=SAHH2_HUMAN
NCBI RefSeq	XP_624152.2	0.0	73.88%	PREDICTED: similar to CG9977-PA [Apis mellifera]
NCBI nr blastp	gi\|307182708	0.0	74.00%	Putative adenosylhomocysteinase 3 [Camponotus floridanus]
NCBI nr blastx	gi\|345486611	0.0	72.25%	PREDICTED: putative adenosylhomocysteinase 3-like isoform 1 [Nasonia vitripennis]

Group
Gene Ontology	GO:0004013	1.8e-302	adenosylhomocysteinase activity
	GO:0006730	1.8e-302	one-carbon metabolic process
	GO:0005488	4.5e-56	binding
KEGG pathway	ame:551762	0.0
	K01251 (E3.3.1.1, ahcY)	maps->	Selenoamino acid metabolism
			Cysteine and methionine metabolism
InterPro domain	[56-445] IPR000043	1.8e-302	Adenosylhomocysteinase
	[208-364] IPR015878	4.1e-73	S-adenosyl-L-homocysteine hydrolase, NAD binding
	[209-362] IPR016040	4.5e-56	NAD(P)-binding domain
Orthology group	MCL10645		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211994-TA
ATGCCGTCCTCTGGTATCCTGAAGAACAGCATGAATGAGGAGTGCGGAGCCTCGCTGAAGAAGCGCCACTCGATAGTGTCCGGGAGAAGTGACTTCTGGTCCTCGTCAGATGAAGACGAGGGAGTCCAACCTCACGAGAAGGCTATCGCTGCCGGCCAGCCGAATCCCCCGTACTGCGTGCGTAACATAGAACAGCATGATTTTGGTAGGAGGGAGATTGAGATCGCTGAACAGGAGATGCCGGGCATAATGGCCTTGAGGGCGAGGGCAAAGGACGATAAGCCGCTAAAAGACGCGAAGATAGTAGGCTGCACACACATTAACGCTCAAACGGCCGTGTTGATCGAGACCCTGGCCGCTTTGGGCGCGACTGTCCGTTGGGCGGCATGCAACATATACAGCACACAGAATGAAGTGGCCGCTGCCTTAGCGGATGCGGGTTACGCTATATTCGCGTGGCGTGGCGAGAGCGAGGAGGCGTTCTGGTGGTGTATAGACCAGTGCTGTACCCCCACCAGCGGCTGGCAACCCAACATGATACTAGACGACGGTGGAGACGCCACGCACCTGATGCTGAAGAAGCACCCGGCCGCCTTCAAACAGATCAAAGGTACGTCAAAGATAAGGGAGAGCATCATAGACGCCCTTAAACGCAGCACGGACCTGATGTTCGGCGGCAAGCAGGCGGCCGTGTGCGGGTACGGGGAGGTGGGCAAGGGCTGCTGCCAGGCGCTCAAGGCGCTCGGCTGTGTGGTGTACGTCACTGAGATCGACCCTATCTGCGCGCTGCAGGCCGCCATGGACGGCTTCAGGGTGGTCAAGCTGAACGAGGTGATAAGACAAGTGGATATAGTCATAACGGCGACGGGGAATAAGGGCGTGGTCACACGGGACCACATGGAGAGAATGAAGAATGGATGTGTGGTGTGCAACATGGGCCACAGTAACACTGAGGTGGATGTACACGCGCTCAGAACACCTGATCTGATGTGGGAGAGGGTCAGGAGTCAGGTGGATCATATAATCTGGGGTAACGGCAAGCGCATCGTGTTGCTGGCGGAGGGCCGGCTCGCCAACCTGTGCTGCTCGTCGCTGCCGTCGTTCGTGGTGTCCGTGACGGCCGCCACGCAGGCGCTCGCACTCATAGAGCTCTACAACGCGCCCGCACACCGATACAAGGCCGACGTGTATCTTCTACCAAAGAAAATGGACGAGTACGTGGCCAGTTTACATCTACCCACGTTCGACGCACATCTCACGGAGCTCACAGACGAACAGGCCAAATATCTAGGTCTTAATAAAGTGGGGCCCTTCAAACCTAACTATTATAGGTACTAG

Protein sequence:

>DPOGS211994-PA
MPSSGILKNSMNEECGASLKKRHSIVSGRSDFWSSSDEDEGVQPHEKAIAAGQPNPPYCVRNIEQHDFGRREIEIAEQEMPGIMALRARAKDDKPLKDAKIVGCTHINAQTAVLIETLAALGATVRWAACNIYSTQNEVAAALADAGYAIFAWRGESEEAFWWCIDQCCTPTSGWQPNMILDDGGDATHLMLKKHPAAFKQIKGTSKIRESIIDALKRSTDLMFGGKQAAVCGYGEVGKGCCQALKALGCVVYVTEIDPICALQAAMDGFRVVKLNEVIRQVDIVITATGNKGVVTRDHMERMKNGCVVCNMGHSNTEVDVHALRTPDLMWERVRSQVDHIIWGNGKRIVLLAEGRLANLCCSSLPSFVVSVTAATQALALIELYNAPAHRYKADVYLLPKKMDEYVASLHLPTFDAHLTELTDEQAKYLGLNKVGPFKPNYYRY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: