MonarchBase - Protein-coding gene

DPOGS204026
Transcript	DPOGS204026-TA	3570 bp
Protein	DPOGS204026-PA	1189 aa
Genomic position	DPSCF300138 - 54637-68117
RNAseq coverage	430x (Rank: top 28%)

Annotation
*Heliconius*	HMEL004952	0.0	62.81%
*Bombyx*	BGIBMGA004879-TA	0.0	51.93%
*Drosophila*	lds-PA	0.0	40.24%
EBI UniRef50	UniRef50_P34739	1e-178	40.24%	Transcription termination factor 2 n=14 Tax=Drosophila RepID=TTF2_DROME
NCBI RefSeq	XP_002056599.1	0.0	40.32%	GJ10137 [Drosophila virilis]
NCBI nr blastp	gi\|195395955	0.0	40.32%	GJ10137 [Drosophila virilis]
NCBI nr blastx	gi\|195395955	0.0	38.61%	GJ10137 [Drosophila virilis]

Group
Gene Ontology	GO:0003677	2.7e-69	DNA binding
	GO:0005524	2.7e-69	ATP binding
	GO:0004386	4e-12	helicase activity
	GO:0003676	4e-12	nucleic acid binding
KEGG pathway
InterPro domain	[637-963] IPR000330	2.7e-69	SNF2-related
	[630-842] IPR014001	1.9e-29	DEAD-like helicase
	[1042-1126] IPR001650	4e-12	Helicase, C-terminal
Orthology group	MCL11474		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204026-TA
ATGGAGAATTCATATGTTGAATACCGTGATACAACTGGTGTCGAAAGTGATTCGGATACTGAAATTATTGACAATAGTTATACAGACGAATCTTTCGCTAAATTAAAAACCCCTGGAAAAAAGAACCATACAGCATTTGTGCCTGAATCGGATGACACAGTATCAGAAGACGATGATGTTTCAAAAATCAATCTATCTAAGTCAGTGCAAAGCAGAAGCAGTGTTAATCGTCATGTTGTTCTAAGTAGTGACGATGAAAAAAGTAAAAGGGGCAGTATACAAAAACAGTCTGATGCTTCAAATAACATTGTTCTAAGTTCTTCAGAAGATGAGGCTGAAGATTCACCTGAAATAAAACCGAGACGGCGTCCCAAAACCTCTCCTCGGCTGTCAGAGTCGTTTATTGGACGTAAAACAAAAAAACGTATATTTCTCATAGACTCGGACACTGAAAACTCTATAATAGTTGAACATGACAATAACCGGAAACTGAAATGTGTTAAGGACACTCCGGCTAAGATCGATAAGAACGATTTACGAAAAAGTATACTGGATATAAAGAATATGAGTATACAAAGTAATGATAGTGTACGGACTGATGATGGCGACGGAACTGATGATGAACAGATAAGTGGTGATGAAAAGACTGAGGGAAGAGATGGAACTGATCAGGACGAGGGAAGCCACAGTGATAGTGTTCACAGCAATGATGATCAGAACATTGAACATAGTAGACAGAGAGTTAGTGACAGCGGACACTCTGATGACAACACTGATCTTCAGGACACTGAAACGAGACGTGATATATCATCAAGAGGTGATGATTTAGATGAAAGTGATGGAAATGACAAAAACGAAGGTTACTCCAGTGACGACGGTCCTGATGAAGATCAGCTAGTGATGTCCAGAGCTACGAGGATGAGTATAATGGGTATACTGCCGAAGGAGAACGATAGTGATGACTCAGATTACCTGCAGTCTGATGATACCAACCAGACATCACGAGGTAGTTCTTTGGACCTCCCGACTGACCCACCAGCCGGCAATGAAACACCCAAGAAAGATGGAGACACATCAAGATTGACGTGCTCACCTTTTCAGAGTCCACTCCATGATATCACGAATGAAGTCAACTCACCAAATAATTCCAAGAACACTCCGGATATCTGTGATCTGACCAGATCTGAGCCTTGTGATCTACGGAACAGGGTTTTAGATAAGTTGAACAGTACCCAGACCAAATATGTGGAGAAGGTTATTGACGATGACGTCACCATCATAGATGCGAAACCAGAGGTCATAGCCCTCAGCAGCGATGAAGATGAGGTGAGAGATGAGAAGAAATCCCCCAATACAAAGGGTAACCTGAAAGCGGAGCCGACATCGGTTAGGAAGGACAACACCATCAAGCAGTACCTCCTGCCGCCCAGTTATCCCAACCAGGTGGTGTACGTCAAGAAGAATGTTCGTGAAAACGAACTCTCCAAGCTCAACGGACTCAAAGAAGACTTGCAGAATATCAGATATCTCCTGGAGAATATGGATATGAACTCGCTACCTGACGGAGGGCTCAAGCTGATAGAACGACTCACGACCCTGGAGGCGGAAGTCAGGAAACAGGGGGACAAAGTGGCCAACATGGTGATAGAGCCAGATGAACCTACTCGCGCGGATGTAGCGAGGGATGGCTTCGACAAAGAGAACAAGGGTCTGTCCTGGGACGACATACAGAAGGCGAGTAATGCGGTCCAGCCCAGGATGTTCGGCAAACAGGCGATGGCCACCCACATGGCGGAACGTAACCTGATCCTGGAGCGTCTCCGCGACCTGTACGAGTCCTTGGCTTCCCGTCCGTCGGAACAGCACCACCACCACCAGCCGGCGCCGCTCGTCACCTCTCTCATGGACCACCAGCTACACGCCCTCGCCTGGCTGCACTGGAGGGAGACGCAGAAACCACGGGGAGGGATACTGGCTGACGACATGGGCCTGGGCAAGACGATCACCATGATAGCTCTGGTAGTGAGCGACAAGGAGAAGAACATCGACCACCAGCCAGACGATGACGATCATGGAGGGAGGTCCAGATTGGCTCGCGGCGGCACGCTGGTGGTGTGTCCGGCGTCGCTGATGCAGCAGTGGGCGGGCGAGGTGGCGAAGCACTGCCGGCCGCACGCCGTGTCCGTGTGTCACCACCACGGAGCCGCCCGCGCCACGCAGCCCCACCGCCTCGCCAGCTACGACCTCGTCATCACCACCTACAACATCCTGCAGAGGGAGAGCGAGAAGGGCGGGGTGTTGACCCGCGTCCGCTGGCGCCGCGTCATCCTGGACGAGGCGCACGTGGTCCGTAACCACAAGTCGTCGACGTCGCTGGGCGTGTGCAGCCTGTCCTCCTGGGCTCGCTGGGCGTTGACCGGGACCCCGCTACATAACAAGGACCTGGACCTGTTCGCCTTGCTGAAGTTCCTCAAATGTACACCCTTCGACGACCTCGCGATGTGGAAAAAGTGGATCGATAACAAATCTCTCGGCGGCCAAGAACGACTGAGCACCATCATGAGGTGCATCATGCTGAGGAGGACCAAGCAGCTGCTGCAGGAGAGGGGCCAACTCACCTGTCTGCCGGAGCGGAGCGCGCACCACGTGGACGTCACGCTGCACAAGGACGAGATGAACGTGTACCAGAAGGTGTTAGTGTTCTCCAAGACCCTGTTCGCTCAGTTCCTCCAGCAGCGCGCCGAGCGTATCGGGGACTCCGCCCCCGGGAAGGACTCCGAGTACCATAAGATGCATAAGAAAATGATCGCTTTACAAGGAGCGAAACCAGTGAAATCTCACGAGATCTTAGTCCTTTTGCTGCGTCTCCGTCAAGTGTGTTGTCACTGTGGCCTGATAGCGGCCATGTTGGATCCAGACGACACGGCGGACGTGGTCGAGGACCAGGGAGGAGCCGACCTCATGGAAGAACTCAACAAACTGTCGCTAGAGGACTCGCGCTCTAAGAGAAAGATATTCAGCTCTTATACTGACTTAGATTTTAAAATTATTGAAAGAAAGAATTGTCGTTTTTCATTTCCAAGTGAGAAGGCGGTGGTGGTGTCTCAGTGGACGTCCGTGCTGCGCCTGGTGGAGCGCGCCCTGACCGCGCTGGGCGTGAGCAGCGTCACGCTCAGCGGCGCCGTGCCCGTCACCGCGCGGGCGGCGCTCGTTAACGCCGTTAATGATGCCAAATCAGATGTCAAGGTGATGTTGTTGTCGCTGTGTGCGGGCGGTGTGGGTCTCAACCTGTGTGGGGCAAACCACCTTCTCCTGCTGGACCCTCACTGGAACCCGCAGCTGGAGGAACAGGCCCAGGACAGGATATACCGAGTGGGACAGACTAAACACGTGCATATATACAGGTTCATGTGCGTGGGTACAGTGGAGCAAACGATCAGACAGCTGCAGGACGTCAAGCTAAAGATGGCGGACAGCGTGCTCACCGGCGCCAGGAACACGAACGCCTCCAAACTCACCATAGAGGACCTCAAGATGCTGTTCAACATGGGACCGCAGAGCGACTCATAG

Protein sequence:

>DPOGS204026-PA
MENSYVEYRDTTGVESDSDTEIIDNSYTDESFAKLKTPGKKNHTAFVPESDDTVSEDDDVSKINLSKSVQSRSSVNRHVVLSSDDEKSKRGSIQKQSDASNNIVLSSSEDEAEDSPEIKPRRRPKTSPRLSESFIGRKTKKRIFLIDSDTENSIIVEHDNNRKLKCVKDTPAKIDKNDLRKSILDIKNMSIQSNDSVRTDDGDGTDDEQISGDEKTEGRDGTDQDEGSHSDSVHSNDDQNIEHSRQRVSDSGHSDDNTDLQDTETRRDISSRGDDLDESDGNDKNEGYSSDDGPDEDQLVMSRATRMSIMGILPKENDSDDSDYLQSDDTNQTSRGSSLDLPTDPPAGNETPKKDGDTSRLTCSPFQSPLHDITNEVNSPNNSKNTPDICDLTRSEPCDLRNRVLDKLNSTQTKYVEKVIDDDVTIIDAKPEVIALSSDEDEVRDEKKSPNTKGNLKAEPTSVRKDNTIKQYLLPPSYPNQVVYVKKNVRENELSKLNGLKEDLQNIRYLLENMDMNSLPDGGLKLIERLTTLEAEVRKQGDKVANMVIEPDEPTRADVARDGFDKENKGLSWDDIQKASNAVQPRMFGKQAMATHMAERNLILERLRDLYESLASRPSEQHHHHQPAPLVTSLMDHQLHALAWLHWRETQKPRGGILADDMGLGKTITMIALVVSDKEKNIDHQPDDDDHGGRSRLARGGTLVVCPASLMQQWAGEVAKHCRPHAVSVCHHHGAARATQPHRLASYDLVITTYNILQRESEKGGVLTRVRWRRVILDEAHVVRNHKSSTSLGVCSLSSWARWALTGTPLHNKDLDLFALLKFLKCTPFDDLAMWKKWIDNKSLGGQERLSTIMRCIMLRRTKQLLQERGQLTCLPERSAHHVDVTLHKDEMNVYQKVLVFSKTLFAQFLQQRAERIGDSAPGKDSEYHKMHKKMIALQGAKPVKSHEILVLLLRLRQVCCHCGLIAAMLDPDDTADVVEDQGGADLMEELNKLSLEDSRSKRKIFSSYTDLDFKIIERKNCRFSFPSEKAVVVSQWTSVLRLVERALTALGVSSVTLSGAVPVTARAALVNAVNDAKSDVKVMLLSLCAGGVGLNLCGANHLLLLDPHWNPQLEEQAQDRIYRVGQTKHVHIYRFMCVGTVEQTIRQLQDVKLKMADSVLTGARNTNASKLTIEDLKMLFNMGPQSDS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: