MonarchBase - Protein-coding gene

DPOGS200847
Transcript	DPOGS200847-TA	2271 bp
Protein	DPOGS200847-PA	756 aa
Genomic position	DPSCF300071 - 125497-132147
RNAseq coverage	835x (Rank: top 15%)

Annotation
*Heliconius*	HMEL012340	85.06%
*Bombyx*	BGIBMGA009903-TA	86.31%
*Drosophila*	CG6418-PB	58.59%
EBI UniRef50	UniRef50_B3M5L4	60.13%	GF23818 n=1 Tax=Drosophila ananassae RepID=B3M5L4_DROAN
NCBI RefSeq	XP_624210.1	61.62%	PREDICTED: similar to CG6418-PB [Apis mellifera]
NCBI nr blastp	gi\|322799398	64.83%	hypothetical protein SINV_08125 [Solenopsis invicta]
NCBI nr blastx	gi\|383857449	62.91%	PREDICTED: ATP-dependent RNA helicase DDX42-like [Megachile rotundata]

Group
Gene Ontology	GO:0005524	1.1e-42	ATP binding
	GO:0008026	1.1e-42	ATP-dependent helicase activity
	GO:0003676	1.1e-42	nucleic acid binding
	GO:0004386	2e-28	helicase activity
KEGG pathway	ame:551822	0.0
	K12835 (DDX42, SF3B125)	maps->	Spliceosome
InterPro domain	[278-478] IPR014001	2.1e-57	DEAD-like helicase
	[283-452] IPR011545	1.1e-42	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
	[516-597] IPR001650	2e-28	Helicase, C-terminal
Orthology group	MCL13907		Single-copy universal gene

Nucleotide sequence:

>DPOGS200847-TA
ATGAGTTACAATTCGAGTGGGGGCAAGGGGTTCGGATTTTCCGGATTCACGATGCCAAAACGGAACCCTTCGAACGTTTCACTACACGCTGTTCCTCCGCCTCCTTCCCAAATGAATGCTGTCCCTCCTCCGAATCCCGGGTTATCGAAGCAGGGTTATTCAACTATGAACGCGATAACACAGAACGCCATCGGTGGTACTTGGGGTACACTTGGGAAAAAGCGAGCTAAGACTGAAGATGAGTATTTTGATGAAGATGATGAGCCTCCGACTCCAGCTCTTGCTTATATACCAGCACCAGGGAGCCCTACTAATGAAGCCAACAGCTCTAGGGCAAATGAAGAAGAGGAAGATCCCCTGGACGCGTACATGGCCGGTCTGGAGAAACAGGCGGCTAAAGATATGAAGGTTAGCAAAGAGAATGCCGTTAGTGGAAAAGGTGACGCCGGGAGAGGGACCAGAGGAGATATTGATGAGATGGACGACGAAGAAAGTTACTATAAATACATGGAAGATAATCCACTCCAGACAGCCGATGATGGCTCCGACGTTGAAATAGAGTATGATGAGGATGGAAATCCTATCGCTCCTCCTAAGAAAAAGTTTATAGATCCGCTGCCACCGATAGACCATTCGGAGATTCAGTATGAACCGTTCGAAAAGAACTTCTATACACCACACGAAGATATAGAGAAACTAGAGCAGCATCAGGTGGAAGAGCTGAAGAAAAACTTGGGGGTCAAGATTTCCGGACCTGATCCTCCGAAACCTGTGAGTAGTTTCGGTCATTTGGGCTTCGATGAACAGCTGATGAAGGCTATTCGAAAGTCAGAGTACACTCAGCCGACGCCGGTGCAGGCGGCTGGCATACCAGCGGCGCTCTCCGGAAGGGATCTCATAGGTATTGCCCGCACTGGTTCTGGTAAAACGGCAGCATTCCTCTGGCCACTGCTCGTCCACATCATGGATCAGAAAGAGTTGGCTCCGGGGGATGGGCCCATCGGACTCATACTGGCCCCCACTTCCCTCAACCGAATATACATGGAGGCGAAGAAATTTGGCAAAGTATACAACATCAGATGTGTTTGTTGTTATGGAGGGGGGTCCAAGTGGGAGCAGAGTAAGGCTTTGGAAGGGGGCGCGGAGATAGTCGTTGGCACTCCGGGGCGGGTCATCGACCTGGTGAAATGCAAGGCGACCAATCTTCAGCGCGTCACGTACCTGGTGCTGGACGAGGCCGACCGGATGTTCGACATGGGGTTTGAGCCTCAGGTCCGTTCCATCTGCAGTCACGTCCGTCCTGAGCGCCAGGCCCTGCTGTTCTCCGCGACCTTCCCTCGTCGCGTGGAGCGCCTCGCCCGTGACGCTCTTCACGACCCCGTGCGAGTCCAACACGGAGCGGCCGGAGAAGCCTCCAAGCTGGTGAAACAACGTGTCACTATCTTCAATAAACCGGAAGAGAAGTGGCCCTGGCTGTTGGAGAATTTAGTCGACTTCCTGTCGTCGGGGAGCGTGTTGATATTTGTTACGAAGAAGTTGGAAGCGGAACAGACAGCAGCAAACCTCGGCGTGCAGCAGTATGACGCGCTGCTGCTGCACGGAGACCTGGAGCAGGCGGACAGGAACAAGGTCATCACGGCCTTCAAGAGACAGGAGAGCAACATACTCGTCGCCACCGACGTAGCTGCTCGCGGTTTGGACATCCCTCACATCCGCACGGTGGTGAACTACACCGTGGCGCGCGACATCGACACACACACACACAGAGTGGGCCGCACGGGGAGGGCCGGCGTCCCGGGGACGGCGCACACGCTGCTGTCCCGGGACAGGGACAAGGACTTCGCGGGACACCTGCTCAGGAACCTTGAGGGAGTGCAGCAGGAGGTGCCGGAGGAGTTGATGCAGCTAGCGATGCAGTCAACGTGGTTCCGGAAATCACGGTTCAAGAAGGGGAAGGGCAAGAATCTGAACATAGGCGGCTGCGGACTCGGTTACAAAGAGCGTCCCGGGCTGCCCGCCTACAACGACGAGGTGTCTCTCACAGCGAGCGTGGAGAAGACGGTAGAGAAGGCCGGGGGCCCCGCCACCGACCGCCTCGCCTCGCTCAAACAAGCCTTCCGCTCACAATACAACCAGTTCACCGCGTCGTCTGACCACTCGTGGGAGCAGACGCGGCCCGTCCTCCAGCCGGGGGTGAACGCGCCGGCCAACGCGAACACGGACAAAACCGAGAGACTGCGCAAGAGCGGCAAGAAGAGCCGCTGGGAATAG

Protein sequence:

>DPOGS200847-PA
MSYNSSGGKGFGFSGFTMPKRNPSNVSLHAVPPPPSQMNAVPPPNPGLSKQGYSTMNAITQNAIGGTWGTLGKKRAKTEDEYFDEDDEPPTPALAYIPAPGSPTNEANSSRANEEEEDPLDAYMAGLEKQAAKDMKVSKENAVSGKGDAGRGTRGDIDEMDDEESYYKYMEDNPLQTADDGSDVEIEYDEDGNPIAPPKKKFIDPLPPIDHSEIQYEPFEKNFYTPHEDIEKLEQHQVEELKKNLGVKISGPDPPKPVSSFGHLGFDEQLMKAIRKSEYTQPTPVQAAGIPAALSGRDLIGIARTGSGKTAAFLWPLLVHIMDQKELAPGDGPIGLILAPTSLNRIYMEAKKFGKVYNIRCVCCYGGGSKWEQSKALEGGAEIVVGTPGRVIDLVKCKATNLQRVTYLVLDEADRMFDMGFEPQVRSICSHVRPERQALLFSATFPRRVERLARDALHDPVRVQHGAAGEASKLVKQRVTIFNKPEEKWPWLLENLVDFLSSGSVLIFVTKKLEAEQTAANLGVQQYDALLLHGDLEQADRNKVITAFKRQESNILVATDVAARGLDIPHIRTVVNYTVARDIDTHTHRVGRTGRAGVPGTAHTLLSRDRDKDFAGHLLRNLEGVQQEVPEELMQLAMQSTWFRKSRFKKGKGKNLNIGGCGLGYKERPGLPAYNDEVSLTASVEKTVEKAGGPATDRLASLKQAFRSQYNQFTASSDHSWEQTRPVLQPGVNAPANANTDKTERLRKSGKKSRWE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: