MonarchBase - Protein-coding gene

DPOGS215847
Transcript	DPOGS215847-TA	2520 bp
Protein	DPOGS215847-PA	839 aa
Genomic position	DPSCF300073 + 731323-733842
RNAseq coverage	151x (Rank: top 53%)

Annotation
*Heliconius*	HMEL007460	0.0	60.19%
*Bombyx*	BGIBMGA002947-TA	0.0	48.52%
*Drosophila*	CG9247-PA	1e-49	28.10%
EBI UniRef50	UniRef50_UPI0002063298	1e-88	33.33%	UPI0002063298 related cluster n=3 Tax=unknown RepID=UPI0002063298
NCBI RefSeq	XP_001861848.1	5e-87	27.01%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|328776161	5e-88	33.33%	PREDICTED: probable exonuclease mut-7 homolog [Apis mellifera]
NCBI nr blastx	gi\|270003369	4e-95	28.98%	hypothetical protein TcasGA2_TC002596 [Tribolium castaneum]

Group
Gene Ontology	GO:0003676	2.6e-45	nucleic acid binding
	GO:0008408	4.4e-31	3'-5' exonuclease activity
	GO:0005622	4.4e-31	intracellular
	GO:0006139	4.4e-31	nucleobase, nucleoside, nucleotide and nucleic acid metabolic process
KEGG pathway
InterPro domain	[287-575] IPR012337	2.6e-45	Ribonuclease H-like
	[382-569] IPR002562	4.4e-31	3'-5' exonuclease
	[619-718] IPR002782	1.7e-12	Protein of unknown function DUF82
Orthology group	MCL15536		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215847-TA
ATGGACTTAAATAAGTTAGTCCATCAAAATCAAACAATAAAAATCATACCATCGTTAGAGGACTCTCTACGAGGACTTGGCCTGAATAGTGATCTAGATGAAGAAACTGAGATTTGGTTTAATCAATTGAAAATCAAATGGAAAACATGGAAGAAAAGCCCTACGATTGAGCGTCACTTTGACTCATTTTTTCAGTTCTGTCAAGATCCCTTCAGAGTTGCCCTAGTGTGCATTGTCAAATGTGATGAACCAAAAGATCGTAAGCCTAAATCTCTCTCTTATTGCATACTTGAAATTATATTTAAATGGTCCCAGACAAATGGCAGATTACCTGAAGAGACTCTGAAACTTCCAGCGTACAATATAGCAACACAACAGAGAAATCAACATTTTCTTTATTTAGCAGTTAAAACTTATCAATTGTATACTATAAAAGAGACTGTACTTCCTCTTGTAAAAGATATGATAAGAAATGATAATTGCAAACAAGCATCACAAATTGTAATTGCAATGGAACTCTTTGATGAAATTCCTGTTGAAGATTTACTGTTTCCATTGGTTTTGCAAGATACGCCAAACCTAATTGATGAATATTTGTCAGAATCTCCAAATCAAATTCAACCATTTTTATTATTTTTAGATAGACTGTTAGACAAAAACTTTAGTATAAGAGACTATGCTCAAAAATTTATTGAAGAAAATAAAATTTATAATGTTAAATATGATAAAATTCATTATAAACCTCTGGGAAAATTAGTCGCTCGGCTTTGTAATAAATTTAATGTTCCAATAGAGTCATGTAAAAACTTGAGTAAGAATCGTACCACAGGAGGGCTGAGGTATTTAATTCATCAGAGATATGTTGAACACAACTTGAGCCCCTCAGTTTGGGATGATTTGGTAAAAGATTCTTTGAAGCAAAGTACTGACTGTGCTAAAGAATTTGTTGATATGTTAGCAATGTATGACATAAATGAATCACTTAAGTGGTCTTCATATTTCGAAATATCAAATGATTGTCTTCCTCATGCTCTTCAGAATTTAACAATAAAAGATAATCCTATAGAAGAAGAAAATTGGGACTCAACTGACAATGCAGCTCAGAACTATTATAGACTTCCAATATCAGAAGAAAATATTTTAATTATTGACACAGCAGAAAAGTTTGATGAATTAATCTCAAAGTTGTCAAATTGTCCTATCATCAGCTTTGATTGCGAATGGAAACCATCATTTGGTGCTGCTAAATCTCGAATGGCTCTCATTCAAATTGGTACATTTGATCAAGTTTATCTTATTGACACTCTTATATTAAACAACAAGCAATACATGGGTAGTTGGTGCCGGTTTAATAAATATGTATTAGATAATGCGGAGATAATAAAATTGGGTTTTGGAGTTGAACAGGATCTGAATGAAATGAAGTCTTTAATTATTGGTTTGAATAATATCAAGGTTAAAGGTGAAGGACTTTTAGATTTAGGTTTACTGTGGAAAAATCTTGTCAAATGTGGCTTGTCATTACCAAGTAACAGTGATAATGGAGGTAACAGTCTCAGCTCTTTGGTCCAAACTTGCTTTGGATTGCCCTTGGAAAAATCTGAGCAATGTTCAAATTGGGAGTTAAGGCCCTTAAGAAATACTCAGATTCACTATGCTGCTTTGGATGCTTTTGTTTTGTTAGAGATATACAAATACCTTCAAAATCTTTGTGTAGAACAACATATTAATTTTGAGGAAATTTGTAATGATGTAATGTTGGATAGAAAACTGAAATGTCTAAAAAAGAATAAAGTAGTTGATTGTCTGCAGACAACAAAAAATATAAAGGTGAGAACTCCTATGGACGTTAAAATTCTTCTTGAACATGACAATGCACATTTACGATATTATCTAAGATACTGTGGTATTGACACTACTATTACAACTTCCCATATGTTATGGCACGATACTATTAAATTAGCCACATCTGAAAATCGTTTAATATTGACATCTAAATTGAAGTTTTCACCATCTAGCAGATTTTCACAAAACTTTATCTTAGATATAGGTAAAGGAAGCATCAAGGATCAATTATTAAAAATTCTTAAACATTTTAATGTGGGCCTTCAAAAGAATTATATTTTGACAAGATGTATAGAATGCAATTCTACAGATGTAAAATATTACTCTATTAATGATCTCAAAGATATATGTAGAAAATATAATGGTGGTAGCCACAAGTCTTCCGATCAGATCAGAAGGAGTGCTAGTGACAATGAAGATGATAATGATTATTCTGAAAACTTTCTCAGTGATTCAGAAGGGGAAGACATACATTTATACAAACCATTTCCAATACAGGACAAATGGTATACATCTAGCAGTGGAGCTAAAATTAATATGAATCAGATTGAAAAGTTATGTGCTTCCAATAAAACTTCACATATTTGTGAAAATTGTGGAAAACTATATTGCGATGAAGAGCCGTTGCTTAAATCAATACACGAAGTAATCATGTCTATAACAAATTTTAATTAG

Protein sequence:

>DPOGS215847-PA
MDLNKLVHQNQTIKIIPSLEDSLRGLGLNSDLDEETEIWFNQLKIKWKTWKKSPTIERHFDSFFQFCQDPFRVALVCIVKCDEPKDRKPKSLSYCILEIIFKWSQTNGRLPEETLKLPAYNIATQQRNQHFLYLAVKTYQLYTIKETVLPLVKDMIRNDNCKQASQIVIAMELFDEIPVEDLLFPLVLQDTPNLIDEYLSESPNQIQPFLLFLDRLLDKNFSIRDYAQKFIEENKIYNVKYDKIHYKPLGKLVARLCNKFNVPIESCKNLSKNRTTGGLRYLIHQRYVEHNLSPSVWDDLVKDSLKQSTDCAKEFVDMLAMYDINESLKWSSYFEISNDCLPHALQNLTIKDNPIEEENWDSTDNAAQNYYRLPISEENILIIDTAEKFDELISKLSNCPIISFDCEWKPSFGAAKSRMALIQIGTFDQVYLIDTLILNNKQYMGSWCRFNKYVLDNAEIIKLGFGVEQDLNEMKSLIIGLNNIKVKGEGLLDLGLLWKNLVKCGLSLPSNSDNGGNSLSSLVQTCFGLPLEKSEQCSNWELRPLRNTQIHYAALDAFVLLEIYKYLQNLCVEQHINFEEICNDVMLDRKLKCLKKNKVVDCLQTTKNIKVRTPMDVKILLEHDNAHLRYYLRYCGIDTTITTSHMLWHDTIKLATSENRLILTSKLKFSPSSRFSQNFILDIGKGSIKDQLLKILKHFNVGLQKNYILTRCIECNSTDVKYYSINDLKDICRKYNGGSHKSSDQIRRSASDNEDDNDYSENFLSDSEGEDIHLYKPFPIQDKWYTSSSGAKINMNQIEKLCASNKTSHICENCGKLYCDEEPLLKSIHEVIMSITNFN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: