MonarchBase - Protein-coding gene

DPOGS207071
Transcript	DPOGS207071-TA	3321 bp
Protein	DPOGS207071-PA	1106 aa
Genomic position	DPSCF300001 + 2454735-2468930
RNAseq coverage	2045x (Rank: top 6%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA013025-TA	0.0	79.10%
*Drosophila*	eIF3-S10-PA	0.0	53.10%
EBI UniRef50	UniRef50_G6CI19	0.0	99.91%	Putative eukaryotic translation initiation factor 3, theta subunit n=2 Tax=Obtectomera RepID=G6CI19_DANPL
NCBI RefSeq	XP_973312.1	0.0	66.45%	PREDICTED: similar to eukaryotic translation initiation factor 3, theta subunit [Tribolium castaneum]
NCBI nr blastp	gi\|91089945	0.0	66.45%	PREDICTED: similar to eukaryotic translation initiation factor 3, theta subunit [Tribolium castaneum]
NCBI nr blastx	gi\|91089945	0.0	61.43%	PREDICTED: similar to eukaryotic translation initiation factor 3, theta subunit [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3.2e-11	protein binding
KEGG pathway
InterPro domain	[369-494] IPR000717	3.2e-11	Proteasome component (PCI) domain
Orthology group	MCL14160		Single-copy universal gene

Nucleotide sequence:

>DPOGS207071-TA
ATGGCGAGATACGGTCAGAGACCGGAAAATGCTCTTAAGAGAGCCAATGAGTTTATGGACTTGGAGAAGCCTGCAAGGGCGCTTGATACCTTGCAGGAAGTGTTTCGAAACAAAAAATGGGCTTACAATTGGTCCGAATCTGTCTTAGAACCGATCATGTTCAAATACCTGGAACTATGCGTCGATTTACGCAAGTCTCATATTGCCAAAGAAGGGCTGTTTCAATACAGAAACATGTTTCAATCAGTAAACGTTGGTTCATTAGAACAAGTTATCAGGGGATATCTCCGGATGGCTGAAGAGCGTACAGAGTCTGCTCGAGAACAATCCACCCAGGCAGTAATTGACACAGATGATCTTGATAACCTTGCAACACCTGAGAGTATTTTGCTAAGTGCTGTCTCAGGGGAAGATGCCCAGGACCGCTCTGATAGAACAATATTAACACCATGGGTGAAATTTCTTTGGGAGTCCTACTGCCAGTGTCTGGAGCTCCTGCGGACGAATGCACATGTGGAGACCCTATACCATGACATAGCTCGCATGGCATTCCAGTTCTGCTTGAAGTATTCAAGGAAGACTGAGTTTAGGAAGCTTTGTGATAAACTCAGAAAACATCTTGATGATATTTGCAAATCCGTGTCTCAGCCAGGCAATGTTAGTATCAGTAAGCCTGAAACACAGCAGCTCAACTTGGAAACCAGATTGTTCCAACTGGACAGTGCCATTCAGATGGAGCTGTGGCAAGAAGCCTACAAAGCAATAGAAGACATCCATAATCTCATGAACATGTCCAAGAAGACGCCAGTCGCCAAAACCATGGCTAATTATTATGGCAAGCTGGCTCTCGTCTTTTGGAAGGCTGGACATTGCTTGTTCCATGCAGCTGCCCTGTTAAAGCTTTTCCAACTGTCTAGAGAAATGAAGAAAAATATCACTCAGGAGGAATTGCAAAAGATGGCATGTCGAGTCTTGGTGGCTGTGCTATCGGTCCCCTTACCATCGCTTCATCCTGAGTTCGATCGTTTCGTTGAAACTGACAAGAGTCCTGTTGAGAAGGCACAGAGATTAGCAGTGTTGCTTGGACTCGCTCAACCTCCGACCAGAGCTAGCTTACTGAAAGACGTGGTCCGTATGAACGTGGTGTCGCTGGCGTCGCCACAGCTGCAGCAGCTGTACTCGTGGCTCGAGGTGGAGTTCGATCCCCTGTCCATCTGTCAGAACGTCCAGAGCGTCGTCAGAACACTGCAGGAGGATCCTAACTCCCCGCTGGCACAATACTCGGTGGCTATAACGGATGTAGCGCTGGTACGTCTCATTCGTCAAGTCGCTCAGTGCTACGCCTGCATTCAATTCTCCAGACTGTTGGAGCTGGCTGCCACCGACGACCTCTTCCATATCGAACGTCTGCTCGTCGACTGTGTCCGCCATAATGATATGCAGATACGGGTGGATCATGCTAACAAATGTGTCCACTTCGGCGTGGAAGCTGGAGGCGGTGAATGGTGTTCTACTGCTGACGAGGCGTGCGGCGGGGCCATACTCCAGGCAACGCCCGCTGAACAGGTTCGCGAGCAGCTCGTCCGTGCTGCGGAGGTAGTTTCTCGTGCTGCTCAGACATTGTTCCCAGCTCGTCGTCGTGCCGATCGCGAGCGTGCTAGGGCCGCCATGGTGCAGCACTATCACGAGAACAAACACGCTGAACATCATCGCGTTCTACAAAGACATAAGATCATAGAGGAGAGGAAGGAGTACATTGAGAGACTCAACACTGTCAGGGAGGAAGAGGAGTTGCGCCGTCAAGAAGAGCAGTTGCGCGCAGCAGCGGCAGCGGAGGCACGCCGTCAAGAACAGGAAAGAGAAGAGAGGGAGAAGAGGAGACACGCCTCGGAACTAGCAGCAATGAAGGAGAGGAATCTGAGGGAGAGAATCGCTCACATCTCACAGACTATGCACGGGAAGAAGGTGCTGCAAAAGTTGGATGAGGAGGATTTGAAGAAAATGGACGCCGAAGCCATTGCTCAACGCGAGGCCGAAGAACTGATGAAGGAACGTCGGGAGCTTGCAGCTCGTCTTAAGTCTCAAGAGAAGAAGGTTGATTACTTCGAGCGGGCCAAGCGTCTGGAGGAGATTCCACTCCTACAGAAGAGTTTGGAAGAGAAGCAAGTGCAGGATAAAGCATTCTGGGAACAGCAGGAGAAGGAACGCATCGCCCAACTCATCGAGGCGCGTGGCCGTGATGTAGCTACAGCAACACGTCTGTCTCGTATGTCGGTGCACCGCGAACAGTTCACGACTCGACTGAACAGCGAGCGTGGCGCATTGTACCACAGCAGGCTGGCAGAGTTCACCGAAACCATCACCAGGGAGAGGGAGGCGCGACTCGCTCATAGGAGACAGCAGAGGATCGAGAAGAGACGAACAGAGTGGCTGACGGAGAAGCGTCGCATGGAAGAGCGTGCTGCGGAGGAAGCTCGCAAGGCACAGGAGGAACATGAGAGGAGGGAGAAGGAGAGAAAGCAGGCGGAGGAACTGGCCGCCCTCAAGGAGAAGAAGGAGAAGTCACTCAAGGAGCATCAAGAAATGTTGGCTAGGGCTGAAGCAAAGGCTCGCGCTATGGAAGCTGAAGTCACCCGCAAGCTAGAGGAACAAAAAGCGGCCGCGTTGTCCAGCTGGAGGAGACCCGGACCTCCGGCCAAGGAACCAGAGAAGAAGGAACCCTGGCGGCCCAGTCGCCTTCGCGAGCCCGTTGCTGATGAACGTCCACGCTCTCCAGGACGTAGAGATGAAGAGAAACGCGAGGAAAGACCTCGCGATATTAGCTTCAAGGATGACAGGCCAAGAGAAGAACGCAGCTACAGGGACGATAAGAACAGGGATGATCGGCCGAGAGATGACTCTGGATGGCGTTCAGCTAACCGGGATGCAGACCGGGATAGGGATAGAGAAAGACCGCGCTACACCGGTCGTTCAAGCGGCCCCGAGTCCGGCAGCTGGCGTCGTGGCCCTTCAGACCCAGCGCCCTCCGCCGAGCGTTCGTCAACTTGGCGCACCAAGGAGGCGTCTCGTGACGACCGTCGTGATGACCGCCGTGATGACCGCCGTGATGATCGTCGTGATGACCGCCGTGATGACCGCTACCGTGATCCGCCGCGTGATCGTGATGGATATCGTGATAGACCGCCGCCACGACGCGACGAGCGTGATCCGCCTCGTAGAGATGATCGTGATCGCCGCGATGATCGCGAACGTCGCGTGCCCCCGCGCAGAGAGGACAAACCCCGTGACCCGGACGACTTCCAAACCGTCTCCAAACGTTAA

Protein sequence:

>DPOGS207071-PA
MARYGQRPENALKRANEFMDLEKPARALDTLQEVFRNKKWAYNWSESVLEPIMFKYLELCVDLRKSHIAKEGLFQYRNMFQSVNVGSLEQVIRGYLRMAEERTESAREQSTQAVIDTDDLDNLATPESILLSAVSGEDAQDRSDRTILTPWVKFLWESYCQCLELLRTNAHVETLYHDIARMAFQFCLKYSRKTEFRKLCDKLRKHLDDICKSVSQPGNVSISKPETQQLNLETRLFQLDSAIQMELWQEAYKAIEDIHNLMNMSKKTPVAKTMANYYGKLALVFWKAGHCLFHAAALLKLFQLSREMKKNITQEELQKMACRVLVAVLSVPLPSLHPEFDRFVETDKSPVEKAQRLAVLLGLAQPPTRASLLKDVVRMNVVSLASPQLQQLYSWLEVEFDPLSICQNVQSVVRTLQEDPNSPLAQYSVAITDVALVRLIRQVAQCYACIQFSRLLELAATDDLFHIERLLVDCVRHNDMQIRVDHANKCVHFGVEAGGGEWCSTADEACGGAILQATPAEQVREQLVRAAEVVSRAAQTLFPARRRADRERARAAMVQHYHENKHAEHHRVLQRHKIIEERKEYIERLNTVREEEELRRQEEQLRAAAAAEARRQEQEREEREKRRHASELAAMKERNLRERIAHISQTMHGKKVLQKLDEEDLKKMDAEAIAQREAEELMKERRELAARLKSQEKKVDYFERAKRLEEIPLLQKSLEEKQVQDKAFWEQQEKERIAQLIEARGRDVATATRLSRMSVHREQFTTRLNSERGALYHSRLAEFTETITREREARLAHRRQQRIEKRRTEWLTEKRRMEERAAEEARKAQEEHERREKERKQAEELAALKEKKEKSLKEHQEMLARAEAKARAMEAEVTRKLEEQKAAALSSWRRPGPPAKEPEKKEPWRPSRLREPVADERPRSPGRRDEEKREERPRDISFKDDRPREERSYRDDKNRDDRPRDDSGWRSANRDADRDRDRERPRYTGRSSGPESGSWRRGPSDPAPSAERSSTWRTKEASRDDRRDDRRDDRRDDRRDDRRDDRYRDPPRDRDGYRDRPPPRRDERDPPRRDDRDRRDDRERRVPPRREDKPRDPDDFQTVSKR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: