MonarchBase - Protein-coding gene

DPOGS215965
Transcript	DPOGS215965-TA	2733 bp
Protein	DPOGS215965-PA	910 aa
Genomic position	DPSCF300078 - 730857-735879
RNAseq coverage	2311x (Rank: top 5%)

Annotation
*Heliconius*	HMEL005887	0.0	80.29%
*Bombyx*	BGIBMGA000528-TA	1e-36	32.27%
*Drosophila*	NAT1-PC	7e-91	42.24%
EBI UniRef50	UniRef50_D2A1L4	3e-176	42.09%	Putative uncharacterized protein GLEAN_08408 n=2 Tax=Tribolium castaneum RepID=D2A1L4_TRICA
NCBI RefSeq	XP_969772.2	0.0	43.18%	PREDICTED: similar to eukaryotic translation initiation factor 4 gamma, 2 [Tribolium castaneum]
NCBI nr blastp	gi\|189236794	2e-179	43.18%	PREDICTED: similar to eukaryotic translation initiation factor 4 gamma, 2 [Tribolium castaneum]
NCBI nr blastx	gi\|189236794	2e-174	44.30%	PREDICTED: similar to eukaryotic translation initiation factor 4 gamma, 2 [Tribolium castaneum]

Group
Gene Ontology	GO:0016070	1.7e-79	RNA metabolic process
	GO:0005488	8.4e-63	binding
	GO:0005515	3.8e-52	protein binding
KEGG pathway	tca:658277	3e-180
	K03260 (eIF-4F, EIF4G)	maps->	Viral myocarditis
InterPro domain	[111-337] IPR016021	1.7e-79	MIF4-like, type 1/2/3
	[108-339] IPR016024	8.4e-63	Armadillo-type fold
	[120-335] IPR003890	3.8e-52	MIF4G-like, type 3
	[817-904] IPR003307	1.8e-18	eIF4-gamma/eIF5/eIF2-epsilon
Orthology group	MCL11904		Single-copy universal gene

Nucleotide sequence:

>DPOGS215965-TA
ATGGCATTCCATAGTACGGAGCACGACCTTGCCGAGACATCGCTAAGTCCCCGGGCGGTGCGGCGACCCCTTGCCAATATCGAGCGACGCCTCATCTTCAACTCTTTAGAACACTTAAAAGTCAAAATTTCAGGCTCATTTATTTTGAGCGTAAATGCATCGAGTTGTGAGAGGCGAGTTGTGTGCGCGATCGCGGGCGTGTTCGCGTGTGCGTGCGGACGGTCGTGCGGCGGTGGTGTGTGTGTGAGGCGGCGACACCGGCCGCAAGAGGTCCCCCCGAGGCGGCGCTGGGTCCCGCCATCCACGCAGCGGCACCACGATGTGCCCGACGGCGAAGCCAAGCACGACATCATCCATAGGAAAGTGCGTGGCATACTTAACAAACTCACGCCGGAGAAATTCCAAAAGCTGAGCGATGATCTACTCGCATTGGAATTGGATTCGGACAAGGTGCTGAAGGGGGTGATCCTTCTAATATTCGACAAGGCACTTGATGAACCTAAGTACTCGTCGATGTACGCTCAGCTGTGCAAGCGGCTCAGCGAAGAGGCGCCCAACTTTGAGCCGCCCGGCTCCCCCTGTACTTTCAAGCTGCTCCTGCTCAACAAATGTCGCACCGAATTCGAAAACCGCGCCCAGGCATTCGCAGCCTTCGAAGACAAGGCTCTCACTCCTGAGGAAGAGGAGAAACGGCATTTAGCCAAGTGTAAAATGCTCGGCAACATCAAATTCATCGGCGAACTGGGCAAGTTGGAGATCCTCGCGGAGTCGATCCTTCACCGTTGCATCCAGAACCTGCTGGCTCGCCGCGCTGCCGCCGAGCACCATGAAGACCTGGAGTGTCTGGCGCAGCTGGTGCGGACATGCGGCCGCGTGCTCGACTCAGAGCGCGGCCGCGGTCTCATGGATCAATATTTCGCACGAATCGAAACGTTGTCCAACTCGCGCGACCTCGCCCCTCGCATCCGGTTCATGTTGCGGGACGTGGTGGAGCTGCGACGCTCAGGTTGGCTGCCACGCACGGCGGTGTCAGCCGAGGGCCCGGTGCCCATACACCAGTTGCGCGCCGACGACGAGCCACCGCCTCGCCGCGAGCGCGAGCGGGAGCGCGACTCTCTGTTCAGGGGCGGGATGCGCTCGCGGCCCCTGGACGACGTGCTGGCCGGTCTCAGCCTGCAGCCAGCCGCCGCGCTCGTGCCGCCGCCGGACAAATTGTTCGGGAACGGTTTCGCTCCGCCGGCTTTCCGCCAGCGCTCGGCGCCCGGCTACTACCCGCGCTCGCATTACAAGCACCAACAGCATCAGCACGCGCCCTCCGCGGGCAAGGAGGGCTCGCGCTCCGGCAAGGCTCGTGTGGCGGTGGCAGCGGGCGCTCTGCAAGACGTCCAGATGCGCCCCGCCGCCAACTCTCTCATGTTCACGGCCAACAGGCTGTCTCGCCCTCCGCCCTCGCAGCTGCCACTCGCCTCCCAAAACGTGCTGACGCCAACATTCGCCAGTGCTCCGCCTCTTATGAAAGAGCCCTCCATCACTATCAAGCCCGCGCCCGACAAAAAGGATAAACCGAAAAAGGACAAGGGGTTGAACAAGGAGGAGGCGTGTCGCCTGGGCATCGAAGCGGTGAGTGCGCTGGCTGACAGCGACGAACGCATCGACCAACCGGAGCCGGAGCCCGAGCAAGAGCACGAGCCGACGCTGGCGGCGCCTCTGCGGCGTCTGCACGACCTCCAGCTGCCCGACAAGTTGCTAAGGCGCGTCATCGCCGCGGTGCTGGAGCACGCGGTCACGGCAGACATACGACCGCCGGCTGACAACGACACCGAACCAGACGGTGACGCCAATGATGAAGACGAGCGTGTGACTCGTCTGCTCTGGGCCGCCTGTAGTGTGGTGCGCGCTGTTAAACGAGCGCCCCTGGGCGAGCCGCTCAGGGCGCTCCTGCAGGCGCACCACCCCCACCGCCGTCTACCCGGCCTTCTGGCACACGCCATCAGACAGAAGTTAATATCGCTGTCAGAAGTAGGCACGTGGTGCGAGGGTGGTCAGTATCACCCGTTATTACTGGAAGTGCTGCAGTCCCTACGAGAACTCGTCGGCCTGGAGCGCCTACAAGACATGCTCGAGGATAGTAAGGTGAACCTATGCGCCTATGTGTCGGAGCGGGAGGGTGGTGCGGGCGGTCTTGATGCTCTGGAGGCTCGCGGTCTCGGCGCGTTGGTGCCGCAGCTGCGGGTGCAGGCGGCGTTGGCGCGACAGCTGGCCACGGAGCCGGCTCCGACCGCGCTCTACCGCTGGATCAAGGCCAACGTGGAACCCTCCGTGAGACACAACGCCGCATTCGTGTCAGCGTTGGTGGCGCTGGTCGCGGAGCACGTGACGGCGGCGGCGGGCGGCGCCTCGCCGGACAAGGCTGCACTCGAACGTGAGAAAGCGCTGGCCGAGGCCTACGCTCCACTCCTGACAGCCCTGCTCGAGGGCCGCTCTGATCTACAGCTTGCGGCCGTATACGCCGTGCAGGTGCATGCACACCATCATCGGTACCCTAAAGGTATGTTGCTACGCTGGTTCATGTACCTGTATAACTTGGAGGTATGCGAGGAAGACGCTTTCCTGCGCTGGCGCGAGGACGTCACCGATGCCTACCCTGGTAAGGGAGAGGCTCTGTTCCAGGTGAATACGTGGCTGACATGGCTTCAGCAACAGGAGTCCGAGGACGAGGAGGCAGAGGACTGA

Protein sequence:

>DPOGS215965-PA
MAFHSTEHDLAETSLSPRAVRRPLANIERRLIFNSLEHLKVKISGSFILSVNASSCERRVVCAIAGVFACACGRSCGGGVCVRRRHRPQEVPPRRRWVPPSTQRHHDVPDGEAKHDIIHRKVRGILNKLTPEKFQKLSDDLLALELDSDKVLKGVILLIFDKALDEPKYSSMYAQLCKRLSEEAPNFEPPGSPCTFKLLLLNKCRTEFENRAQAFAAFEDKALTPEEEEKRHLAKCKMLGNIKFIGELGKLEILAESILHRCIQNLLARRAAAEHHEDLECLAQLVRTCGRVLDSERGRGLMDQYFARIETLSNSRDLAPRIRFMLRDVVELRRSGWLPRTAVSAEGPVPIHQLRADDEPPPRRERERERDSLFRGGMRSRPLDDVLAGLSLQPAAALVPPPDKLFGNGFAPPAFRQRSAPGYYPRSHYKHQQHQHAPSAGKEGSRSGKARVAVAAGALQDVQMRPAANSLMFTANRLSRPPPSQLPLASQNVLTPTFASAPPLMKEPSITIKPAPDKKDKPKKDKGLNKEEACRLGIEAVSALADSDERIDQPEPEPEQEHEPTLAAPLRRLHDLQLPDKLLRRVIAAVLEHAVTADIRPPADNDTEPDGDANDEDERVTRLLWAACSVVRAVKRAPLGEPLRALLQAHHPHRRLPGLLAHAIRQKLISLSEVGTWCEGGQYHPLLLEVLQSLRELVGLERLQDMLEDSKVNLCAYVSEREGGAGGLDALEARGLGALVPQLRVQAALARQLATEPAPTALYRWIKANVEPSVRHNAAFVSALVALVAEHVTAAAGGASPDKAALEREKALAEAYAPLLTALLEGRSDLQLAAVYAVQVHAHHHRYPKGMLLRWFMYLYNLEVCEEDAFLRWREDVTDAYPGKGEALFQVNTWLTWLQQQESEDEEAED-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: