MonarchBase - Protein-coding gene

DPOGS210135
Transcript	DPOGS210135-TA	3183 bp
Protein	DPOGS210135-PA	1060 aa
Genomic position	DPSCF300261 - 69199-73787
RNAseq coverage	1326x (Rank: top 10%)

Annotation
*Heliconius*	HMEL011607	84.90%
*Bombyx*	BGIBMGA003759-TA	78.41%
*Drosophila*	Spt5-PA	66.26%
EBI UniRef50	UniRef50_Q9V460	66.26%	Transcription elongation factor SPT5 n=16 Tax=Metazoa RepID=SPT5H_DROME
NCBI RefSeq	XP_001604079.1	68.06%	PREDICTED: similar to GA20489-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|340717676	68.13%	PREDICTED: transcription elongation factor SPT5-like isoform 2 [Bombus terrestris]
NCBI nr blastx	gi\|340717674	66.78%	PREDICTED: transcription elongation factor SPT5-like isoform 1 [Bombus terrestris]

Group
Gene Ontology	GO:0032784	0	regulation of transcription elongation, DNA-dependent
	GO:0006357	0	regulation of transcription from RNA polymerase II promoter
	GO:0032968	4.4e-13	positive regulation of transcription elongation from RNA polymerase II promoter
KEGG pathway
InterPro domain	[1-1060] IPR017071	0	Transcription elongation factor Spt5
	[234-320] IPR005100	7.5e-25	Transcription elongation factor Spt5, NGN domain
	[522-583] IPR008991	8.8e-20	Translation protein SH3-like
	[133-228] IPR022581	6e-15	Spt5 transcription elongation factor, N-terminal
	[232-323] IPR006645	4.4e-13	Transcription antitermination protein, NusG, N-terminal
	[531-558] IPR005824	8.8e-07	KOW
Orthology group	MCL11512		Single-copy universal gene

Nucleotide sequence:

>DPOGS210135-TA
ATGTCGGACTCGGAGGGCAGTAATTACTCCGGGAGTGGCTCGGACGCAGGTAGTGTTGTGTCTAATCGGTCCAGACGCAGCGCTGCATCAAATCGCTCTGCTAAGTCGGGATCTCGCTCCCGATCTCATTCTGGCAGCCGTAGTCCCTCGAGATCACCTTCAAGGTCACGATCGAGGTCCAGGTCACGTTCTCGCTCACGATCCAGAAGCCGTTCCGCTGGTTCCGATGGCAGCCGAAACAGGGATGATGAGGCTAAGGAGGCTTCTGGTGATGAAGAAGTTGAGGATGAGCAAGAGCCCGAAGGGGAGGACCTGGTGGACTCGGAAGAGTATGATGAGGACGAGGAAGAGGAACGACGTAGGAAGAAGAGGAAGAAGGACAGTCGCTACGGAGGATTCATTATAGATGAGGCTGAGGTAGATGATGAAGTCGATGAAGACGATGAGTGGGAGGAAGGCGCCCAGGAAATGGGTATCGTCGGTAATGAGGTGGATGAGATCGGACCCACAGCCAGAGAAATAGAGGGCCGACGCAGAGGAACCAATCTGTGGGACTCACAGAAAGAAGAAGAAATAGAGGAATACTTGAGAAATAAATATGCTGATGAATCAGCGGCGCTCAGACACTTTGGTGAGGGCGGTGAAGAAATGTCTGATGAGATCACTCAACAGACCTTGCTGCCCGGCATCAAGGATCCTAACCTGTGGATGGTGAAATGCAGGATCGGTGAAGAGAAGGCGACTGTGTTATTGCTTATGAGAAAATTTATTACCTACCAGAATTCAGAGGAACCTTTCCAAATAAAGTCGGTGGTGGCTCCGGAAGGAGTCAAGGGCTTCATCTACATTGAGGCATACAAACAGACACATGTGAAAGCCATCATAGACAAAGTGGGTAATTTGAGAATGGGCACATGGAAACAGGAGATGGTACCCATCAAGGAAATGACAGATGTTTTGAGGGTTGTTAAGGAACAGTCAGGTTTAAAACCGAAACAGTGGGTGCGACTCAAGCGAGGCCTCTATAAAGACGATATAGCTCAAGTAGATTACGTAGATTTAGCACAAAACCAAGTTCACCTGAAACTTCTTCCTAGAATAGACTACACAAGACTCAGAGGAGCTCTAAGGACCGTGCAGAGCGAGAGCGAAGCGGCCAAAAGGAAAAAAAAGCGGCGACCTGCGGCCAAACCTTTCGACCCCGAAGCTATTCGCGCCATCGGCGGCGAAGTGACTTCGGACGGTGACTTCCTCATATTTGAGGGAAACAGATACTCCAGAAAGGGTTTCCTGTACAAGAACTTCACCATGTCCGCGATATTGGCGGAGGGCGTCAAACCCACGCTCACGGAACTAGAAAGATTCGAAGAGCAACCGGAAGGTATAGACATCGAGCTGGCGGCGCCCGCCAAGGACGACCCCACTAGTCTGCACTCGTTCTCGATGGGAGATAACGTGGAGGTGTGTTCCGGTGATCTGGCCAACCTGCAGGCCAGGATCATAGCCATAGATGGCTCCATGATCACCGTCATGCCGAGACACGACGCTCTGAAGGATCCGCTCGTATTCAAACCCAACGAACTACGGAAGTACTTCAAACAGGGAGACCACGTGAAAGTCTTAGCGGGAAGATACGAGGGCGACACCGGTCTCATCGTCCGAGTGGAACCTCACAGGGCGGTCCTCGTGTCGGATGTGACGATGCACGAGCTGGAGGTGTTGCCCAGAGACCTGCAGCTGTGTTCGGACATGGCGACCGGCGTGGACTCGCTGGGACAGTTCCAGTGGGGGGACATGGTGCTGCTGGACTCGCAGACGGTCGGCGTCATCGTCCGACTCGAGAGGGAGAACTTCCACGTGCTCGGCATGCAGGGGAAGGTGATCGAGTGCAAACCTCAGGCGCTGCAGAAGAGAAGGGAGAACAGGTTCACCATGGCGCTCGACTCCGAGCACAACTCCATACAAAAGAAAGACATCGTCAAGGTCATCGACGGACCGCACGCGGGCCGCGAGGGAGAGATAAAGCATCTGTACAGAAACTTCGCCTTCCTGCAGTCGAGGATGTACCCCGACAACGGAGGAATCTTTGTGTGCAAGACGAGACACCTGCAGCTGGCGGGAGGCGCCAAGAACGCCGCCGCCAGCAACGGACTCGCTCTCGCGTTCATGTCGCCGAGGATACAGTCACCCATGCACCCGTCGGGCAGGGGAGGGGGCCGGGGCCGCGGCCGGGGAGGGAGGGGGGCTGTCGCCAGGGACAGGGAGCTCATAGGACAGACCATCAATAGAGACGCCACGGGCAGCACCGCGCGCGTGGAGCTGCACACCATGTGTCAGACCATCTCCGTGGACCGCGGACACATCGCGGCGGCCGGCGGCCCCAACGGCATCGCCCGCGGGGGAGCCTCCAGTTATGGCCGCACCCCCATGCGGGCGGGCGCGCACACGCCGACTTACCGCGAGGCGGGGCTGAAGACGCCGCTCCAGGGCAACGCAACGCCGATCTACGAGGCGGGAGCTCGCACGCCTCACTACGGGTCCAGCACGCCGGCGCACGAGGGCGGCAGGACACCGGCCCACCCCGCCTGGGACGCCGCCGCCCACACGCCGCGTCCCGACCACGATCTGCTGCTGGCGTCCGCCTCTCCTCCGCCCGCCGCCTCCTCCTCGCACTACGACGCCGCCTACCAGCAGGGGCCCTTCACGCCGCAGACGCCGGGCACCATGTACGGCTCCGATCACACCTACAGCCCGTACCGACCCAGCCCGAGCCCCGGCACTTACGCCGGCTACCTGGCCACACCCAGCCCGGCGCCCTACTCGCCCCGCTCGCCCTACACGGCCGAGGACGCCGACGACTGGCACGCGCCCGACCTGGAGGTACGCGTGCGGGGCGGAGCGGAGCCGGGCCTGCGGGGGCAGGCGGGAGCGCTGCGGAGCGTGTCGGGCGCCACGTGCGCCGTGTACCTGCCGCTGGAGGACCGCGTGCTCAACCTGCCCGCGCACCTGCTGGAGCCCGTGGTGCCTCACAGCGGGGACCGGGTCAAGGTGATCGCGGGCGAGGACCGGGAGGCGGTCGGCCAGCTCATCTCCATCGAGAACCAGGAGGGGGTCGTGAAGTTCGGCTCCGACGACATCAAGATCATGCAGCTGAGACATCTCTGCAAGATGGCCTCCAACTGA

Protein sequence:

>DPOGS210135-PA
MSDSEGSNYSGSGSDAGSVVSNRSRRSAASNRSAKSGSRSRSHSGSRSPSRSPSRSRSRSRSRSRSRSRSRSAGSDGSRNRDDEAKEASGDEEVEDEQEPEGEDLVDSEEYDEDEEEERRRKKRKKDSRYGGFIIDEAEVDDEVDEDDEWEEGAQEMGIVGNEVDEIGPTAREIEGRRRGTNLWDSQKEEEIEEYLRNKYADESAALRHFGEGGEEMSDEITQQTLLPGIKDPNLWMVKCRIGEEKATVLLLMRKFITYQNSEEPFQIKSVVAPEGVKGFIYIEAYKQTHVKAIIDKVGNLRMGTWKQEMVPIKEMTDVLRVVKEQSGLKPKQWVRLKRGLYKDDIAQVDYVDLAQNQVHLKLLPRIDYTRLRGALRTVQSESEAAKRKKKRRPAAKPFDPEAIRAIGGEVTSDGDFLIFEGNRYSRKGFLYKNFTMSAILAEGVKPTLTELERFEEQPEGIDIELAAPAKDDPTSLHSFSMGDNVEVCSGDLANLQARIIAIDGSMITVMPRHDALKDPLVFKPNELRKYFKQGDHVKVLAGRYEGDTGLIVRVEPHRAVLVSDVTMHELEVLPRDLQLCSDMATGVDSLGQFQWGDMVLLDSQTVGVIVRLERENFHVLGMQGKVIECKPQALQKRRENRFTMALDSEHNSIQKKDIVKVIDGPHAGREGEIKHLYRNFAFLQSRMYPDNGGIFVCKTRHLQLAGGAKNAAASNGLALAFMSPRIQSPMHPSGRGGGRGRGRGGRGAVARDRELIGQTINRDATGSTARVELHTMCQTISVDRGHIAAAGGPNGIARGGASSYGRTPMRAGAHTPTYREAGLKTPLQGNATPIYEAGARTPHYGSSTPAHEGGRTPAHPAWDAAAHTPRPDHDLLLASASPPPAASSSHYDAAYQQGPFTPQTPGTMYGSDHTYSPYRPSPSPGTYAGYLATPSPAPYSPRSPYTAEDADDWHAPDLEVRVRGGAEPGLRGQAGALRSVSGATCAVYLPLEDRVLNLPAHLLEPVVPHSGDRVKVIAGEDREAVGQLISIENQEGVVKFGSDDIKIMQLRHLCKMASN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: