MonarchBase - Protein-coding gene

DPOGS200999
Transcript	DPOGS200999-TA	3060 bp
Protein	DPOGS200999-PA	1019 aa
Genomic position	DPSCF300147 - 159518-166184
RNAseq coverage	236x (Rank: top 43%)

Annotation
*Heliconius*	HMEL013789	3e-112	45.58%
*Bombyx*	BGIBMGA009069-TA	5e-126	60.23%
*Drosophila*	CG9004-PA	6e-114	43.68%
EBI UniRef50	UniRef50_F4WKN2	1e-157	41.21%	Nucleolar MIF4G domain-containing protein 1 n=6 Tax=Formicidae RepID=F4WKN2_ACREC
NCBI RefSeq	XP_001600662.1	2e-151	41.35%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|332024937	4e-157	41.21%	Nucleolar MIF4G domain-containing protein 1 [Acromyrmex echinatior]
NCBI nr blastx	gi\|189234299	2e-164	42.07%	PREDICTED: similar to CG9004 CG9004-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	1.1e-30	binding
	GO:0016070	4.3e-19	RNA metabolic process
	GO:0005515	4.3e-19	protein binding
KEGG pathway
InterPro domain	[352-565] IPR016024	1.1e-30	Armadillo-type fold
	[652-758] IPR003891	9.5e-23	Initiation factor eIF-4 gamma, MA3
	[363-562] IPR003890	4.3e-19	MIF4G-like, type 3
	[354-563] IPR016021	3e-07	MIF4-like, type 1/2/3
Orthology group	MCL13856		Single-copy universal gene

Nucleotide sequence:

>DPOGS200999-TA
ATGAAAAAACCAAATAATAAGCCAAAATTTACAAATACACGTAAAGTGCTTCGAAAACAAAAGAGACAAGAAAAGAAAGTAAAACGGAAAGAACATTATTTAAAAAAGAATATAGATTCTACTGAGCTTCACCGGTCCACCTCACCGGGAAAGTTTGTAAAAATAAGACCCGAAACATCTGAACCTGATAATGTGGTTAAGAAAAATAAAAAACCAAAAAATCCGCCTACTGTTCAAGAATTATTAAAATTGGAGCAAGAAAAAGAGAAGAGAGCCACTGATAAATTAAAATCGATGATGAATGAACAAAGAAGGAAGATGTTATTGGAAGCTAATGATGCGGAGGATAAGATTATTAAGAAGCTAGAGAAACAGCTCGGCTTGAACAAGACTCGAAACAAAAATAACTTTTTTGCTGACGATGGGCTGGATTATTTACTAGAGGTGTGTGATAGAACGACGTCAGAACAAATTGTGGCAGCGGAAAAACATTTGGCTGAAGTTGAAAGAGATTCCGACTTTGAAGATGATTTGGCTGCGGTTACAGGAAAAGAGCCACATCGTAAAAAGGAAAAGGAAAAAGAGATAACAGAAGACGGACATGATTCAGTTGATGATATGGATGAAGATGATGAGTTAGGAAGTGATGATGATATGCTGGGTGAAGACAGTGAAATGAGTGAAGATGGAACCGATTTTAAAGATAATGGTGAGTCTGATGATGATGGAGAAACTGGTGATGATGGAGAAGATGACAGTGAAGATGATGGTGATGAAGAACCAGAACGAAAAAAAAGATCAAATAACAAGAACAATAACAAGACAAAGGAAAAGATAATTGCAGAAGAAGATTTGAGTAAAATATTTAGTGACGATGAAGTGTCACATTTATCCGATGATGAAGAGTTGAGCGGAGGTGAAGAGAATTCAGAAATAGAACCTAAAGAGAAGCCGGATGTATGGGAGGACATTTATGGAAGGAAGAGAGATAAAGAAGGGAACATCATTAAGGAGGAAAAAGGCATTTACATCCCACCACATTTGAGGAACAAGGACTCAACATCTGAGAAGGAGATGGCACAACTGAAACGGCAAGTTAAAAGTGTTCTGAACAAGTTGGCTGGTACAAACCTTCACTGGGCTTGCACCAGTATAGAGAATCTGTACACCAGCAACAGCAGACACTCGATGAATACAGTATTGACATCGCTGTATATGGAGGGAGTCGTTGGAAGGTCTATGACTCCGGAGAGGATGCTGGCAGAACATGCGGCTATGATAGCTGTGTTGCATGCCAATGTTGGCTCCGAAATTGGAGCACATTTCTTGGAGGAGTTGTGTAAGAGGTTTGACGCAATGATGGACACACCACAACCAGTCGAGGACAAGACCTTAGACAATCTAGTTGCTTGCTTGGCACATTTGTTTTGTTTCAAGTTGTACCAATCTACGTTACTATTCGATATTCTGTCGCGTCTGACGCACACGTTGTCCGAGAAGTGCATAGACGTGTTGTTAGTGTGCGTGAGGTGCGCCGGCGCAGCTCTAAGGAAGGAAGCGCCTCTCGAACTCAAGACCTTCATACATGACACACAGGCTCGGAGTACCAAGATAGGGGCTGGTGTGACAGACGGGTCCCGTATAAAGTTTCTACTAGAAGTACTGCTGGCTATTAAGAATAATAATTTAAACAAAATACCCAACTACGATCCGAGCTACGTGGAACACCTGAAGAAGATGACTCGGAGTATTGTCAGGAAAGGAAATTATATAACACCCTTGAACATACGGCTGGAGGATCTATTGAAAGCCCAGGAACGCGGCAAGTGGTGGGTGGTCGGGTCGGCCTGGGAGGGGCAGGCTGAGGTCGGAGACAAACAGACAGAGAAACAGACAACGCACGCTGACCAGAGAATGATGGAACTGGCGAGGAAACAGAGAATGAATACCGATGTCAGGCGGAGCATCTTCTGTGTTATTATGTCTGCTGAGGACTACATGGACGCCTTTTCTAAGTTGGAACAGCTCTCCTTGAAGGGACAACAGCAGCGTGAGATATCGCATGTGTTGTTGTCTTGCTCTCTCCATGAGAAGGCTTACAACCCCTACTACAGTGTGCTGGCTGACAAACTGTGCAGTGTAGATAGGAAATATCAGCTATCAATACAGTACTCTGTGTGGGACAAAATAAAGGAAATTGAAACTCTATCCAAACAGTCAATGACCAACTTGGCACAGTTTCTCATCCATCTGTTTGTATCCAAAGCACTGCCGCTGTCCATTCTCAAGGAACGCGGCAAGTGGTGGGTGGTCGGGTCGGCCTGGGAGGGGCAGGCTGAGGTCGGAGACAAACAGACAGACAAACAGACAACGCACGCTGACCAGAGAATGATGGAACTGGCGAGGAAACAGAGAATGAATACCGATGTCAGGCGGAGCATCTTCTGTGTTATTATGTCTGCTGAGGACTACATGGACGCCTTTTCTAAGTTGGAACAGCTCTCCTTGAAGGGACAACAGCAGCGTGAGATATCGCATGTGTTGTTGTCTTGCTCTCTCCATGAGAAGGCCTACAACCCCTACTACAGTGTGCTGGCTGACAAACTGTGCAGTGTAGATAGGAAATATCAGCTATCAATACAGTACTCTGTGTGGGACAAAATAAAGGAAATTGAAACTCTATCCAAACAGTCAACGACCAACTTGGCACAGTTTCTCATCCATCTGTTTATATCCAAAGCACTGCCGCTGTCCATTCTCAAGATAATCCAATTCTCCGATTTAAACAAGAAGACCGTCCGGTTCATGAGACAGATACTCCTGGCTGTCATAATGAATGATAACTTGCAAGCGTCGCTGGAAGTGTTCCACAGGATAGCCAAACCCCCGAAGCTGCACATGTTTAGGGAGAGTCTGAGGTTATTCATTCAGCACTTCCTAATAAAGAACGCCGGCAAGCAGAGCGCGGTGTTGAGTGAAGAGGAGATGAGGACCTTGAGGGAACGGGCACAGGAAGTTGATAAGATTCTCACCATGCACGAAACTAAATTGAGATTTTGA

Protein sequence:

>DPOGS200999-PA
MKKPNNKPKFTNTRKVLRKQKRQEKKVKRKEHYLKKNIDSTELHRSTSPGKFVKIRPETSEPDNVVKKNKKPKNPPTVQELLKLEQEKEKRATDKLKSMMNEQRRKMLLEANDAEDKIIKKLEKQLGLNKTRNKNNFFADDGLDYLLEVCDRTTSEQIVAAEKHLAEVERDSDFEDDLAAVTGKEPHRKKEKEKEITEDGHDSVDDMDEDDELGSDDDMLGEDSEMSEDGTDFKDNGESDDDGETGDDGEDDSEDDGDEEPERKKRSNNKNNNKTKEKIIAEEDLSKIFSDDEVSHLSDDEELSGGEENSEIEPKEKPDVWEDIYGRKRDKEGNIIKEEKGIYIPPHLRNKDSTSEKEMAQLKRQVKSVLNKLAGTNLHWACTSIENLYTSNSRHSMNTVLTSLYMEGVVGRSMTPERMLAEHAAMIAVLHANVGSEIGAHFLEELCKRFDAMMDTPQPVEDKTLDNLVACLAHLFCFKLYQSTLLFDILSRLTHTLSEKCIDVLLVCVRCAGAALRKEAPLELKTFIHDTQARSTKIGAGVTDGSRIKFLLEVLLAIKNNNLNKIPNYDPSYVEHLKKMTRSIVRKGNYITPLNIRLEDLLKAQERGKWWVVGSAWEGQAEVGDKQTEKQTTHADQRMMELARKQRMNTDVRRSIFCVIMSAEDYMDAFSKLEQLSLKGQQQREISHVLLSCSLHEKAYNPYYSVLADKLCSVDRKYQLSIQYSVWDKIKEIETLSKQSMTNLAQFLIHLFVSKALPLSILKERGKWWVVGSAWEGQAEVGDKQTDKQTTHADQRMMELARKQRMNTDVRRSIFCVIMSAEDYMDAFSKLEQLSLKGQQQREISHVLLSCSLHEKAYNPYYSVLADKLCSVDRKYQLSIQYSVWDKIKEIETLSKQSTTNLAQFLIHLFISKALPLSILKIIQFSDLNKKTVRFMRQILLAVIMNDNLQASLEVFHRIAKPPKLHMFRESLRLFIQHFLIKNAGKQSAVLSEEEMRTLRERAQEVDKILTMHETKLRF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: