MonarchBase - Protein-coding gene

DPOGS210509
Transcript	DPOGS210509-TA	1443 bp
Protein	DPOGS210509-PA	480 aa
Genomic position	DPSCF300186 + 23847-26354
RNAseq coverage	132x (Rank: top 56%)

Annotation
*Heliconius*	HMEL004632	9e-41	64.83%
*Bombyx*	BGIBMGA012610-TA	2e-133	56.25%
*Drosophila*	Edc3-PB	2e-35	27.46%
EBI UniRef50	UniRef50_D6WQJ4	3e-69	34.86%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WQJ4_TRICA
NCBI RefSeq	XP_974871.1	5e-74	35.11%	PREDICTED: similar to AGAP003131-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91087071	1e-72	35.11%	PREDICTED: similar to AGAP003131-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91087071	5e-69	34.77%	PREDICTED: similar to AGAP003131-PA [Tribolium castaneum]

Group
KEGG pathway	tca:663743	1e-73
	K12615 (EDC3)	maps->	RNA degradation
InterPro domain	[2-75] IPR021024	5.8e-19	Enhancer of mRNA-decapping protein 3, N-terminal
	[179-200] IPR019050	1.2e-10	DFDF motif
	[254-479] IPR004443	2.2e-09	YjeF-related protein, N-terminal
Orthology group	MCL14133		Single-copy universal gene

Nucleotide sequence:

>DPOGS210509-TA
ATGTCGAAGTGGATAGGTTACGCCGTGTCAGTAAACTGTGGCGAGCCCCTGGGATGTTATCAGGGTACTATACTGGAAGCCGACGGTAGCACCATCACGTTGACTAAAGCATTTAGAAATGGCTTCCCTTACCCAAAGTCTCAAGTCACACTGAATTCGGCTGATATAAAAGACTTGAAAATAATTGAAGAAGCACGTACAGAGCCATCGGAACAGACGCACAGCACTGTAGCTGTCACAAAGAGCGCCAAGAAAGGCCAAAGAGCCACTGTATGTGAAAATTTGGAGGCAAATCCCTCACATCCCACTGGATCACAGACCTGCAACAAGACGTGCAGCAGCAGGAGCGCACCCTCGGCGCCGCGGAGCAAGCCGATAGACATCCAGGGGCCGAGGATCAATAGGAATACCCATTCAGGCAGCTACGGCAATGCGAGCTCAACTCCTAAGACGCGCCCTCAGCCCGGGGGGGAGCGAGCGAGGAGGAGGAATGAGGCCTGCTTCGGACACGATGCGGACCCCGCGCTAGGAGACGACTTCGACTTCGAGGGAAACCTCGCGCTCTTCGACAAACAGGCGCTGTGGGAGGAGATGAGGACGACCGCCGCCACCAGGCCGGACGTGGTGCGAGCGGCGGACGAGGCAGCGCGGTACAGACACGACGAGAACGTGCTCGGGAGTGCGCCCCCCGCGGACCACATCACTGTCCCCGCGGACAGGAGGGGGCCCGTGGTGTACGCCGCGGACGACGGCCGCCGGGTGCCCTCGGTCACCCTCGATCTGCGCCGAGACTTCTGGCTCGGTCTGCGGCGGCTCGGGCTGCTGGAGGGCGCGCAGGTGCTGCTGGCGCGCGCCGCCGCGGACCTGGCGCTGCGGCTGGCGGGCGGCGGGCGGCGCCTCGAGCCTCGCAATGCCCACCAGGCGCCCGTGGCCGCCGTGCTGGCCGGGGTGCACGACGGCGGTGTGTGCGGACTCGTGGCCGCGAGGATTCTGGCGGCGCACGGCGTTGCGGCGCATGCCTTCCTGTCGGGGACGACGCGCGAGCCGCCCGGAGCGGCGTTTCGGCGTGAGCTAGGCGCGCTGGCGGCGGCGGGGGTGGCGCGGGCGGAGCGACCGGACGAGCTGCCGCCGGCAGACGTTGTGCTCCTGGCGCTGTCCTCGCCGGAAGAGCGCGAGTGTCAAGAGCCACAAGACACGCACGAGGCGGCGCTGGCGTGGGCGAGGGCGGCGCGCTCGGCGTGCGTGGCGCTGGAGCCGCCTGCGGAAGGCTGGCCGGGTGTTTCGTGCCGCGCGTCCGTAGTGGCGGGCCTGCCGGCTGCTCTGTCCCCATCCTTGGGCCGGGTGTATGCGGCCAACGTCGCGGCTCCGGCCCGCCTGTGGCGCGAGTTAGGCGTGTCCTACCGCCCGCCCTTCGGAGCCGCCTCGGTACTGGCGCTGGACTGA

Protein sequence:

>DPOGS210509-PA
MSKWIGYAVSVNCGEPLGCYQGTILEADGSTITLTKAFRNGFPYPKSQVTLNSADIKDLKIIEEARTEPSEQTHSTVAVTKSAKKGQRATVCENLEANPSHPTGSQTCNKTCSSRSAPSAPRSKPIDIQGPRINRNTHSGSYGNASSTPKTRPQPGGERARRRNEACFGHDADPALGDDFDFEGNLALFDKQALWEEMRTTAATRPDVVRAADEAARYRHDENVLGSAPPADHITVPADRRGPVVYAADDGRRVPSVTLDLRRDFWLGLRRLGLLEGAQVLLARAAADLALRLAGGGRRLEPRNAHQAPVAAVLAGVHDGGVCGLVAARILAAHGVAAHAFLSGTTREPPGAAFRRELGALAAAGVARAERPDELPPADVVLLALSSPEERECQEPQDTHEAALAWARAARSACVALEPPAEGWPGVSCRASVVAGLPAALSPSLGRVYAANVAAPARLWRELGVSYRPPFGAASVLALD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: