MonarchBase - Protein-coding gene

DPOGS211094
Transcript	DPOGS211094-TA	1293 bp
Protein	DPOGS211094-PA	430 aa
Genomic position	DPSCF300007 - 1111303-1113545
RNAseq coverage	3280x (Rank: top 4%)

Annotation
*Heliconius*	HMEL012478	92.09%
*Bombyx*	BGIBMGA011168-TA	93.59%
*Drosophila*	Ahcy13-PA	78.37%
EBI UniRef50	UniRef50_Q27580	78.37%	Adenosylhomocysteinase n=323 Tax=root RepID=SAHH_DROME
NCBI RefSeq	NP_001093271.1	94.19%	S-adenosyl-L-homocysteine hydrolase [Bombyx mori]
NCBI nr blastp	gi\|153791817	94.19%	S-adenosyl-L-homocysteine hydrolase [Bombyx mori]
NCBI nr blastx	gi\|153791817	94.19%	S-adenosyl-L-homocysteine hydrolase [Bombyx mori]

Group
Gene Ontology	GO:0004013	7.4e-200	adenosylhomocysteinase activity
	GO:0006730	7.4e-200	one-carbon metabolic process
KEGG pathway	aag:AaeL_AAEL008341	0.0
	K01251 (E3.3.1.1, ahcY)	maps->	Selenoamino acid metabolism
			Cysteine and methionine metabolism
InterPro domain	[2-430] IPR000043	0	Adenosylhomocysteinase
	[190-350] IPR015878	2.7e-81	S-adenosyl-L-homocysteine hydrolase, NAD binding
Orthology group	MCL12809		Single-copy universal gene

Nucleotide sequence:

>DPOGS211094-TA
ATGAAGCCACCATACAAAATTGCTGATGAGAAATTGGCGGAACTCGGCCGTAAAGAAATTATGTTAGCTGAGAAAGAAATGCCGGGACTAATGGCATGCCGTCGCAAATATGCTCCTAGCAAAATTCTCAAGGGAGCCAGAATAGCTGGAAGTCTTCACATGACAGTACAAACAGCTGTACTTATTGAAACTCTAATTGAGTTAGGTGCAGAGGTACAATGGTCTAGCAGTAACATATTCAGTACACAAGATGAGGCAGCCGCTGCCCTAGTGGCCGTCGGAATACCTATTTATGCCTGGAAGGGTGAAACTGATGAAGAATACATTTGGTGTATTGAACAAACTTTGTTCTTCAATGACGGAAAGCCCTTGAACATGATTTTGGATGATGGTGGAGATCTTACAAACCTGGTTCACAAGAAATATCCACAACTACTTGAGAATATCAAGGGTATCTCAGAGGAAACAACCACTGGTGTTCACAACTTATACAAAATGTTCCGAGAAGGTCTTCTTAAAGTGCCTGCTATTAATGTGAACGACTCTGTAACAAAAAGCAAATTTGATAACTTATATGGCTGCCGGGAGTCACTTCTTGATGGAATTAAAAGAGCAACTGACATTATGGTTGCTGGTAAGGTCTGCGTTGTAGGGGGTTATGGAGATGTCGGAAAGGGCTGTGCCCAAGCATTCAAGGGCTTTGGAGGCAGGGTAATTGTCACTGAAATTGACCCCATTAATGCCCTACAAGCAGCTATGGAAGGTTTCCAAGTAACAACAATGGATGAGGCGGCTGAGATTGGACAAATCTTTGTCACCACCACTGGGAATATTGACATAATATGCAAGGAGCACTTCCTTAAGATGAAAGATGATGCTATCGTTTGTAACATTGGACACTTTGACTGTGAGATTGATGTAGCTTGGCTGGAAAAGAATGCCAAGAAAGTCAATATTAAACAGCATGTGGACCGCTATGAACTTGAAAACGGAAATCATATAATTGTCCTAGCCGCTGGAAGGCTAGTTAACTTGGGATGTGCCACCGGTCACTCTTCATTTGTTATGTCCAACTCTTTCACAAATCAAGTCTTAGCGCAAATTGAACTCTGGACAAAACACAACACATACCCTATTGGAGTCCACACCTTGCCTAAGAAGCTTGATGAAGAGGTAGCAGCATTACACTTAGACCATTTAGGAGTGAAACTTACTAAGCTAACTCCTAAACAAGCTCAGTACATTGGTGTGCCAGTCGAAGGTCCCTACAAGCCTGACCACTATAGATACTGA

Protein sequence:

>DPOGS211094-PA
MKPPYKIADEKLAELGRKEIMLAEKEMPGLMACRRKYAPSKILKGARIAGSLHMTVQTAVLIETLIELGAEVQWSSSNIFSTQDEAAAALVAVGIPIYAWKGETDEEYIWCIEQTLFFNDGKPLNMILDDGGDLTNLVHKKYPQLLENIKGISEETTTGVHNLYKMFREGLLKVPAINVNDSVTKSKFDNLYGCRESLLDGIKRATDIMVAGKVCVVGGYGDVGKGCAQAFKGFGGRVIVTEIDPINALQAAMEGFQVTTMDEAAEIGQIFVTTTGNIDIICKEHFLKMKDDAIVCNIGHFDCEIDVAWLEKNAKKVNIKQHVDRYELENGNHIIVLAAGRLVNLGCATGHSSFVMSNSFTNQVLAQIELWTKHNTYPIGVHTLPKKLDEEVAALHLDHLGVKLTKLTPKQAQYIGVPVEGPYKPDHYRY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: