MonarchBase - Protein-coding gene

DPOGS210007
Transcript	DPOGS210007-TA	1194 bp
Protein	DPOGS210007-PA	397 aa
Genomic position	DPSCF300327 - 15726-18281
RNAseq coverage	4x (Rank: top 89%)

Annotation
*Heliconius*	HMEL012953	8e-14	23.78%
*Bombyx*	BGIBMGA008388-TA	4e-48	44.55%
*Drosophila*	CG43088-PA	1e-12	22.56%
EBI UniRef50	UniRef50_UPI000206043F	1e-90	43.25%	UPI000206043F related cluster n=2 Tax=unknown RepID=UPI000206043F
NCBI RefSeq	XP_001946870.1	9e-98	45.27%	PREDICTED: similar to conserved hypothetical protein [Acyrthosiphon pisum]
NCBI nr blastp	gi\|328697775	2e-96	44.75%	PREDICTED: putative nuclease HARBI1-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|328697775	6e-95	45.50%	PREDICTED: putative nuclease HARBI1-like [Acyrthosiphon pisum]

Group
Gene Ontology	GO:0016788	1.2e-10	hydrolase activity, acting on ester bonds
KEGG pathway
InterPro domain	[146-342] IPR006912	1.2e-10	Putative harbinger transposase-derived nuclease
Orthology group	MCL10304		Insect specific

Nucleotide sequence:

>DPOGS210007-TA
ATGGTTGACTGGGATTTAGTATTAATAGCACTTCTAGCTGAAGATGAAGAGAGACAAATAAGAACTGCAAATTTGACGAAAAGACAATTCTGGGTGCATAATTTATGGAGAACAAGATCTACAAATGGTGAATTCAGCAACTTGTTTAATGAGTTGAGATACGACTTGCGAAAGTTCTATGATTATTACAGAATGGACTATGAAAAATTTGAAAAGTTAAGTTATTTGCTAAAATCGCATATAAAGAAAATTAAAACTAATTTTCGATCGCCTATACCTGTTACAGAGAGATTGTCTGTATGTTTAAGGTATTTAATTACAGGAGCTTCTTTTAAGTCTTTAGCTTTTAGCTATCGTATGGGATTCACTACTGTGCGTAATATAGTCCACGAAACCTGTCAAGCCATATTTACTGTACTAAGGTCTACTGCATTGCCGAAACCCACGAGCCAACAATGGCAGTCAATTGCAACCGACTTTGATAAATTTTGGAATTTTCCTAACTGCATTGGTGCCATAGATGGTAAGCATTTCAAGATTAGAGCTCCTAATAACAGTGGAAGTATGGATATCAACTACAAGAAGTTCTTTAGCATCGTTTTATTAGCCGTCGTGGATGCAAAATACAAATTTGTGATTGTAGATGTCGGAGCATATGGTCGAAATAGCGATGGCGGTACACTTCAAAGCTCTAAATTTGGTTCGAAACTACGTAATGGTTTTTTATGCATACCACCGGAAAAGGCTTTACCACATTCAACTCAAAAATTACCTAACGTATTTGTCGCCGATGAAGCCTTTCCACTAACAGAAAATATTATGAGACCATACCCCTCACATCTTTTAAATGATGAAAAAAAAAGGATATTCAATTATCGCTTAAGTAGAGAACGGCGTATTGTAGAAAATGCTTTCGGAATGTTACAAGAAAGATTTGAATTATTTCAAAAAGGTATAAAAGTTCAACCAAAGTACATTAACAACATTATACTAGCAAGCACGTGTTTGCATAACTTTATCATTGATGGTCATTCTATGGACGCCCTTAGCTCTAATACTAATAATGCAATCGATAGAACCAATGATTCAGTTTTTAACAATCTGGATGGGATGGTTGTAAGAGATTGTTTCACGGAATATTTTTCTAATGTTGGTAACGTGTACTGGCAAAATGAAATTGTTAATAGATGTTAG

Protein sequence:

>DPOGS210007-PA
MVDWDLVLIALLAEDEERQIRTANLTKRQFWVHNLWRTRSTNGEFSNLFNELRYDLRKFYDYYRMDYEKFEKLSYLLKSHIKKIKTNFRSPIPVTERLSVCLRYLITGASFKSLAFSYRMGFTTVRNIVHETCQAIFTVLRSTALPKPTSQQWQSIATDFDKFWNFPNCIGAIDGKHFKIRAPNNSGSMDINYKKFFSIVLLAVVDAKYKFVIVDVGAYGRNSDGGTLQSSKFGSKLRNGFLCIPPEKALPHSTQKLPNVFVADEAFPLTENIMRPYPSHLLNDEKKRIFNYRLSRERRIVENAFGMLQERFELFQKGIKVQPKYINNIILASTCLHNFIIDGHSMDALSSNTNNAIDRTNDSVFNNLDGMVVRDCFTEYFSNVGNVYWQNEIVNRC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: