MonarchBase - Protein-coding gene

DPOGS215203
Transcript	DPOGS215203-TA	1257 bp
Protein	DPOGS215203-PA	418 aa
Genomic position	DPSCF300143 - 53743-60525
RNAseq coverage	17754x (Rank: top 1%)

Annotation
*Heliconius*	HMEL009664	0.0	86.63%
*Bombyx*	BGIBMGA008682-TA	3e-58	89.47%
*Drosophila*	exba-PC	4e-166	64.04%
EBI UniRef50	UniRef50_Q9VNE2	6e-164	64.04%	Protein extra bases n=89 Tax=Eukaryota RepID=EXBA_DROME
NCBI RefSeq	NP_001091797.1	0.0	88.24%	eukaryotic initiation factor 5C [Bombyx mori]
NCBI nr blastp	gi\|189031276	0.0	92.12%	eukaryotic initiation factor 5C [Helicoverpa armigera]
NCBI nr blastx	gi\|189031276	0.0	92.36%	eukaryotic initiation factor 5C [Helicoverpa armigera]

Group
Gene Ontology	GO:0016070	7.8e-45	RNA metabolic process
	GO:0005488	1e-38	binding
KEGG pathway
InterPro domain	[254-416] IPR016021	7.8e-45	MIF4-like, type 1/2/3
	[252-408] IPR016024	1e-38	Armadillo-type fold
	[325-410] IPR003307	1e-26	eIF4-gamma/eIF5/eIF2-epsilon
Orthology group	MCL10854		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215203-TA
ATGAGTCAGAAGGTAGAAAAACCAGTATTATCGGGTCAACGGATCAAGACCAGAAAAAGAGATGAGAAAGAGAAGTATGACCCTAACGGGTTCCGCGACGCGTTGGTGTCGGGTCTGGAGCGAGCGGGGGACCTGGACGCGGCCTACAAGTACCTAGACGCGGCCGGGTCCAAGCTCGACTACCGCCGCTATGGCGAGGTCATCTTCGACGTGCTCATCGCCGGAGGGCTACTGCTGCCCGGCGGCTCGGTGTCTATGGACGGGGAAACTCCCAAGACTAACACTTGCATCTTCAACGCCAGCGAGGATATGGAGTCTATGAGGAACTTTGAACAGGTATTTGTCAAACTGATGCGTCGTTACAAATATCTCGAGAAGATGTTCGAGGAGGAAATGAAGAAGGTGCTGGTATACCTCAAGGGATTCGAACCTCTACAACGCATCAAATTGGCACGAATGACTGCTCTGTGGATCGGCAACGGCTGTGTGCCCCCCTCGGTGTTGCTGGTGCTGGTGAACGAGCATCTGCTGAAGGAGAATCTGGCGCTGGAGTTTGTGCTGGAGGTGTTCGCTACTGTTAAGGCGGAGAAGGGAGTCGCCAGTTTGGTCACCGCGCTCAAGAGAGGACAACTAGAGGGCAGACTGTTAGAGTTCCTCCCTCTGAACCGGCGCAGTGAGGACGTGTTGGCTAGCGCCTTCGCATCCCGCGGTCTCGCAGAGCTCTTGAGGCTGCACCGGGCTCAGGCGTCCCAGGAGGCTCGCCGCGAGCTGACCCAGGCGCTGCAGGAACAGCTGGCGGACGAGCGACCCGTCAGGGACCTCATCACAGACCTCCGAGACATGGCGCAGAGGCTCGACATACCTGACCACGAGGTCGTCGCTATTACCTGGCAATGCGTGATGTCCCGCGGCGAGTGGAACAAGAAGGAGGAACTGCTAGCGGAGCAGGCCGCCAAACATCTCCGACATTACACGCCGCTACTGGCAGCGTTCGCTCAGTCCGCGAAGGCTGAGATAGCTCTGCTCACTAAGGTTCAAGAGTACTGCTACGAGAATATGAGCTTCATGAGGGCCTTCAGTAAGCTGGTGCTGATGCTGTACAAGAGTAACGTGCTGAGTGAGGAGGTGATCCTCAAGTGGTACAGAGACCCCAACTCCAGCAAGGGGAAGGTCATGTTCCTTGACCAGATGAAGAAGTTTGTGGAGTGGCTTCAGAGCGCCGAGGAGGAATCGGAGAGCGGCGAGGAGGAAGATTAG

Protein sequence:

>DPOGS215203-PA
MSQKVEKPVLSGQRIKTRKRDEKEKYDPNGFRDALVSGLERAGDLDAAYKYLDAAGSKLDYRRYGEVIFDVLIAGGLLLPGGSVSMDGETPKTNTCIFNASEDMESMRNFEQVFVKLMRRYKYLEKMFEEEMKKVLVYLKGFEPLQRIKLARMTALWIGNGCVPPSVLLVLVNEHLLKENLALEFVLEVFATVKAEKGVASLVTALKRGQLEGRLLEFLPLNRRSEDVLASAFASRGLAELLRLHRAQASQEARRELTQALQEQLADERPVRDLITDLRDMAQRLDIPDHEVVAITWQCVMSRGEWNKKEELLAEQAAKHLRHYTPLLAAFAQSAKAEIALLTKVQEYCYENMSFMRAFSKLVLMLYKSNVLSEEVILKWYRDPNSSKGKVMFLDQMKKFVEWLQSAEEESESGEEED-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: