MonarchBase - Protein-coding gene

DPOGS212538
Transcript	DPOGS212538-TA	1014 bp
Protein	DPOGS212538-PA	337 aa
Genomic position	DPSCF300315 - 60912-62826
RNAseq coverage	977x (Rank: top 13%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA008192-TA	1e-147	74.48%
*Drosophila*	CG2091-PA	3e-84	49.66%
EBI UniRef50	UniRef50_Q16XY1	1e-84	45.45%	Histidine triad (Hit) protein member n=5 Tax=Diptera RepID=Q16XY1_AEDAE
NCBI RefSeq	XP_969966.1	9e-91	54.90%	PREDICTED: similar to histidine triad protein member [Tribolium castaneum]
NCBI nr blastp	gi\|91079214	2e-89	54.90%	PREDICTED: similar to histidine triad protein member [Tribolium castaneum]
NCBI nr blastx	gi\|91079214	1e-89	54.90%	PREDICTED: similar to histidine triad protein member [Tribolium castaneum]

Group
Gene Ontology	GO:0016787	3e-129	hydrolase activity
	GO:0000290	3e-129	deadenylation-dependent decapping of nuclear-transcribed mRNA
	GO:0003824	3.5e-62	catalytic activity
KEGG pathway	tca:658490	3e-90
	K12584 (DCPS, DCS)	maps->	RNA degradation
InterPro domain	[43-317] IPR008594	3e-129	Scavenger mRNA decapping enzyme
	[135-326] IPR011146	3.5e-62	Histidine triad-like motif
	[32-135] IPR011145	1.4e-26	Scavenger mRNA decapping enzyme, N-terminal
Orthology group	MCL15093		Single-copy universal gene

Nucleotide sequence:

>DPOGS212538-TA
ATGTCCGACGGTAAATGCCAAAGCGAACTTATTGAGCCGCCTTGCGCAAAGAAAATTAAAAAAGACGAACAAAATGATAACAGTGTAACAGAAACTGATTTGAAATTGAAAGACTTTATTCCAAGCAAGATTTTAAATAATAATACAAATAGAAAATCTGTTTGTGTGCTTGGAAATTTTAGAAACAAAAGTGGTGTGGCGTTAATAATACTCGAGAAAAATGCTTTCAAGGAAGACCACTTAGACAGTAAGGGTTACTTTTCCGAAGATTGTGAGCTTGCGACATTCTTTCAAAACGATATATACGGAAATTTTGAGTGTTTCCCGAAGCCTGAAATTAACGGTGTTAAGACGACAATTATTTACCCGGCCAGTGACAAACACATAGCAAAATTCAGCAAACAACAGGTCCACATTATATTGGAAACTCCGGAATGTTATAATAAATTAACATTACCACATATTGAAAAGGAACAATTTAGATTACAGTGGGTATACAACATATTGGAAGGAAAAAGCGAGCAAGACAGAATAATACACAACAATAAATGTGAGAAGGAGGGTTTTGTTTTGGTTCCCGATCTTAAGTGGGACGGTATCACTAAGGAGACACTATATTTGCTAGCTATTGTGAGACAGAGAAATATTAAATCACTGAGAGATCTGAATGAAAATCATTTACCGTTGCTGAAGAGGATCAGGGACGAGGGGAAGAAAGCAATTTTCGATAAATACAAAGTTATCGGCAGTCAATTAAGGATCTATCTACACTACCAACCCTCATTTTACCATCTACACATACATTTCACTTACCTCCGTCACGAAGCGCCCGGGATATATGCTGAGAAGTCACATTTACTCGACACTGTTATCGATAATATTGAAATAATGGGTGATTATTATCAAAAAGCTACTTTACCGTTCTGTAAAGGTGAAATTGATTCACTATTTAATGTATATGAAACAAATGGTTACGTTACTAAGATTCAAACGGACGAACTTATTGACAAATAG

Protein sequence:

>DPOGS212538-PA
MSDGKCQSELIEPPCAKKIKKDEQNDNSVTETDLKLKDFIPSKILNNNTNRKSVCVLGNFRNKSGVALIILEKNAFKEDHLDSKGYFSEDCELATFFQNDIYGNFECFPKPEINGVKTTIIYPASDKHIAKFSKQQVHIILETPECYNKLTLPHIEKEQFRLQWVYNILEGKSEQDRIIHNNKCEKEGFVLVPDLKWDGITKETLYLLAIVRQRNIKSLRDLNENHLPLLKRIRDEGKKAIFDKYKVIGSQLRIYLHYQPSFYHLHIHFTYLRHEAPGIYAEKSHLLDTVIDNIEIMGDYYQKATLPFCKGEIDSLFNVYETNGYVTKIQTDELIDK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: