MonarchBase - Protein-coding gene

DPOGS206415
Transcript	DPOGS206415-TA	3030 bp
Protein	DPOGS206415-PA	1009 aa
Genomic position	DPSCF300181 - 14898-30371
RNAseq coverage	38x (Rank: top 73%)

Annotation
*Heliconius*	HMEL007597	0.0	63.36%
*Bombyx*	BGIBMGA013851-TA	0.0	57.42%
*Drosophila*	mle-PA	3e-87	38.22%
EBI UniRef50	UniRef50_UPI000224708C	7e-118	37.24%	UPI000224708C related cluster n=1 Tax=unknown RepID=UPI000224708C
NCBI RefSeq	XP_001600929.1	9e-119	37.24%	PREDICTED: hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|345489731	2e-117	37.24%	PREDICTED: putative ATP-dependent RNA helicase DHX30-like isoform 2 [Nasonia vitripennis]
NCBI nr blastx	gi\|345489731	3e-116	37.48%	PREDICTED: putative ATP-dependent RNA helicase DHX30-like isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005524	2.7e-18	ATP binding
	GO:0004386	2.7e-18	helicase activity
	GO:0003676	2.7e-18	nucleic acid binding
	GO:0008026	8.6e-06	ATP-dependent helicase activity
KEGG pathway
InterPro domain	[317-502] IPR014001	5.2e-19	DEAD-like helicase
	[562-665] IPR001650	2.7e-18	Helicase, C-terminal
	[335-477] IPR011545	8.6e-06	DNA/RNA helicase, DEAD/DEAH box type, N-terminal
Orthology group	MCL17432		Patchy

Nucleotide sequence:

>DPOGS206415-TA
ATGTTTGTACGAAGATATTTCAAATCAGTAAATCATAGTCAATTACTCTCTGAGTATAATTCCTATAGAAGTGGATACAAAGGAATTAAATTATGCCAAGAAAGTAAATTGGTAAATTACAGTTCCAATGCACAAATTAAAGAATGTTTATTCCAAAATTATAGCATAGGAACATTATATTCAAAAAGATATTACTCAAAGAAATTTATTGAAGAACTATTTCATGAACAAAACAGTGAAAATGAAAAAAAATTTTCAAAAGACCTATTCAGCAATCCACGAGCTACACTCAACGAACTCGCATCTAAGGTCCCAGAGAAAATATTTGACATACATTTCAAACAAACTATTGTCGCACCTAAAGGTATCAAGAAAAAACCCATACAAAATGACTGGATATGCACATACACATTTATTTGGCCAGAAAAGATGAAATTTGAAAGTGCAGCGATATCTAAACGACAGGCAGCTGACAAATCGGCCACACAAGCATTACATTGGCTTTATAATAATAAACGTATAGATATCAACGGTAAACCTATTTACAACGAGAACACGCTCAAGGAATTACAGAGCACATTAAATAATCCGTTAAACGCATCAATAAGTGAGAATTCGTTAGAACGTATCACAAGGATTTGGGAAGATTATGAAAGAGATATAAGTAAGTATTTATATGAACAAAAATTAATAAAACACATCTATGAAAGGACATTTGATGAAGCCAAACAAGCTTTGAATGTTACGACGATTCACAAAGATTCAACTTTAGATGAGACAGATTGTTCTGAAGACGTGTCAGAACAGGAGAACATAGCGGATGAACTAACAGATACAAGAACAAACATACATCCAGTTTTCGGGAAACCGGTGAAGCCCACGGCACAAGCGTTAGCGAGACGCGAGCGAACACTGAGACACACATTCAAAAATTACGACGAAGAGTTAACACCGCTACCTATAGACGAGTATTCCAATGACATAACATCAGCGTTGGATGACAGTCGCGTGTTAGTAATAATTGGCGCTGCGGGGTGTGGAAAATCGACTAGAGCACCCGTCGCAGTCCTAAGACAGCTCTGCGACAAAATGAACGCAATCGTGTCGCAGCCGCGACGTGTCGCAGCTATCGGGCTTGCGCAACGCGTGTCTGACGAGTTAGGCGAAAAGGTCGGTGAAACTGTTGGTTATCAAGTCCGTTTGCAGTCTGTGCCACCCAGACCTCCCGGCGGCGCCATCTTGTATTGCACTTCCGGTGTCTTATTAAAGAGGTTGCAGATGAATCCAGGTCTTGAAGGTTGTACCCACGTGTTCATAGACGAAGCACACGAGAGAGATGTTAATACAGATATAACGCTGTTGCTACTGAGACGGGCCTTGGACATAAATCGGCACCTGAAGGTGATCGTCATGAGCGCCACCCTCGATACAGGAGTCTTTACTAGATACTTCGACGACTGTCCGGTCATCCAGGTCCCCGGGAGAACATTCCCGGTTGAAATTTCGCATTTACCAGATATAGAGAAAAGATTCAATATAAGACTACCCTCAAGCTTGGAGAGCTGCAGAAAAGTTGGAAAGCCACAGATCAATTGCCAAGAAATAGTCCAAGTCATTAAATCCATAGACAATACTTGTCCCGAGGGCGCCATTCTAGTGTTCCTCCCCGGCTGGGCCGAAATCAAGCAAACTCAGCAGCTATTACAGGACCAGTACAAGGATTCGCCTCTACACATGATATTCCCGGTACATTCAAGGCTATCAACATCAGAACAAACGAAGATATTCTCAAAGTGCCTCGGTATCCGCAAGATAGTACTAGCCACTAACATAGCCGAGACATCTATAACAATACCTGACGTGGTTCACGTCATAGACAGCGGGATACACAGGGAGAATAGACTGCGAGATACTACTAATATCAGTAGCTTGGAAACAGTTTGGGCGTCTAAAGCTAGCTGTACACAGAGAGCGGGGCGAGCGGGGCGTGTTAAACCCGGTCATTGTTACAAAATGTATACCAAAGAAAAGGAAGAAGAATTCCAAGCTCACACTACTCCGGAGATATTGAGAGTCCCTTTAGAACAAACTGTATTGGATTGTAAAACCTATGCCCCAGATGATAGAGTCGAAGATTTCTTATCTCAACTCCCGGAACCGCCGAGCGATAAGGCGGTTCGATTTGCGGTCAATGACCTCGTGGATTTGGGTGCGCTCACCCATAACCAAAAATTGACTCGCCTGGGCGCAATACTATCAAGGGTCAGCATACACCCGCGTTTGTGTTTCAGCGTTTTAAACGCTGCGTTTATTGGAAATATAATAGCGGGCGTGCGGACCGCTCTCGCCACCGAACAAGAGTTCTTCGAAGACTCCGGAGATAGGAGGAACGGTCTTGAAGGTTGTACCCACGTGTTCATAGACGAAGCACACGAGAGAGATGTTAATACAGATATAACGCTGTTGCTACTGAGACGGGCCTTGGACATAAATCGGCACCTGAAGGTGATCGTCATGAGCGCCACCCTCGATACAGGAGTCTTTACTAGATACTTCGACGACTGTCCGGTCATCCAGGTCCCCGGGAGAACATTCCCGGTTGAAATTTCGCATTTACCAGATATAGAGAAAAGATTCAATATAAGACTACCCTCAAGCTTGGAGAGCTGCAGAAAAGTTGGAAAGCCACAGATCAATTGCCAAGAAATAGTCCAAGTCATTAAATCCATAGACAATACTTGTCCCGAGGGCGCCATTCTAGTGTTCCTCCCCGGCTGGGCCGAAATCAAGCAAACTCAGCAGCTATTACAGGACCAGTTCAAGGATTCGCCTCTACACATGATATTGCCGGTACATTCAAGGCTATCAACATCAGAACAAACGAAGATATTCTCAAAGTGCCTCGGTATCCGCAAGATAGTACTAGCCACTAACATAGCCGAGACATCTATAACAATACCTGACGTGGTTCACGTCATAGACAGCGGGATACACAGGGAGAATAGACTGCGAGATACTACTAGTGAATAA

Protein sequence:

>DPOGS206415-PA
MFVRRYFKSVNHSQLLSEYNSYRSGYKGIKLCQESKLVNYSSNAQIKECLFQNYSIGTLYSKRYYSKKFIEELFHEQNSENEKKFSKDLFSNPRATLNELASKVPEKIFDIHFKQTIVAPKGIKKKPIQNDWICTYTFIWPEKMKFESAAISKRQAADKSATQALHWLYNNKRIDINGKPIYNENTLKELQSTLNNPLNASISENSLERITRIWEDYERDISKYLYEQKLIKHIYERTFDEAKQALNVTTIHKDSTLDETDCSEDVSEQENIADELTDTRTNIHPVFGKPVKPTAQALARRERTLRHTFKNYDEELTPLPIDEYSNDITSALDDSRVLVIIGAAGCGKSTRAPVAVLRQLCDKMNAIVSQPRRVAAIGLAQRVSDELGEKVGETVGYQVRLQSVPPRPPGGAILYCTSGVLLKRLQMNPGLEGCTHVFIDEAHERDVNTDITLLLLRRALDINRHLKVIVMSATLDTGVFTRYFDDCPVIQVPGRTFPVEISHLPDIEKRFNIRLPSSLESCRKVGKPQINCQEIVQVIKSIDNTCPEGAILVFLPGWAEIKQTQQLLQDQYKDSPLHMIFPVHSRLSTSEQTKIFSKCLGIRKIVLATNIAETSITIPDVVHVIDSGIHRENRLRDTTNISSLETVWASKASCTQRAGRAGRVKPGHCYKMYTKEKEEEFQAHTTPEILRVPLEQTVLDCKTYAPDDRVEDFLSQLPEPPSDKAVRFAVNDLVDLGALTHNQKLTRLGAILSRVSIHPRLCFSVLNAAFIGNIIAGVRTALATEQEFFEDSGDRRNGLEGCTHVFIDEAHERDVNTDITLLLLRRALDINRHLKVIVMSATLDTGVFTRYFDDCPVIQVPGRTFPVEISHLPDIEKRFNIRLPSSLESCRKVGKPQINCQEIVQVIKSIDNTCPEGAILVFLPGWAEIKQTQQLLQDQFKDSPLHMILPVHSRLSTSEQTKIFSKCLGIRKIVLATNIAETSITIPDVVHVIDSGIHRENRLRDTTSE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: