MonarchBase - Protein-coding gene

DPOGS210426
Transcript	DPOGS210426-TA	1221 bp
Protein	DPOGS210426-PA	406 aa
Genomic position	DPSCF300062 - 414206-419056
RNAseq coverage	2006x (Rank: top 6%)

Annotation
*Heliconius*	HMEL021573	2e-159	77.54%
*Bombyx*	BGIBMGA002756-TA	2e-114	64.10%
*Drosophila*	CG1882-PA	2e-114	53.71%
EBI UniRef50	UniRef50_E1ZYV7	4e-124	56.25%	Abhydrolase domain-containing protein 4 n=14 Tax=Coelomata RepID=E1ZYV7_CAMFO
NCBI RefSeq	XP_001608148.1	5e-124	58.40%	PREDICTED: similar to GA15096-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|350424130	5e-125	59.53%	PREDICTED: abhydrolase domain-containing protein 4-like [Bombus impatiens]
NCBI nr blastx	gi\|332017035	4e-127	62.20%	Abhydrolase domain-containing protein 4 [Acromyrmex echinatior]

Group
KEGG pathway
InterPro domain	[114-129] IPR000073	3.8e-10	Alpha/beta hydrolase fold-1
Orthology group	MCL11993		Single-copy universal gene

Nucleotide sequence:

>DPOGS210426-TA
ATGGGAAGTGAATTAAAACTTGAAAAAACAAAATCCAGTGTTCTACATAGAACCTGGATTGGAAATGTAATTTTATACTTGTGGAATTGGACCGGCCGTTGGTTCAGCTGGACTCGTCAATCGGACTCCATGTTGCGGAATGTCGAACAACTAATATTATCATGTGTGAAGACGGCGTACAAGCGATTCTATGTGGACATAGGTTCAGTGGTGGGACAATGTGACAAAATTTGGACGATATCTTTAAATGAAGACTCCCCAAAGACACCGCTCGTTATGTTACACGGAATGGCCTCCGGGCTAGCGTTGTGGTGTCCCAACCTTGACGCGCTCGCAGCCACACGACCCGTCTACGCCATGGACTTATTAGGTTTCGGTAGGAGTTCCCGCCCGAAGTTCTCGTCTGATGCTGAGAAGGTCGAGGCTCAGTGGGTGGAGTCGGTTGAGGAGTGGCGGCGGGAGGTGAAACTCGAACAGTTCATACTGCTGGGACACAGTCTTGGAGGGTACATCGCTACGGCGTACGCTCTCAAGTATCCCGAAAGAGTCCGTCACCTAATCCTGGCCGATCCCTGGGGCTTCGCAGAACGCCCGGACAATATCAACGAGAAGTTCCATATTCCTTTCTACATCCGGGTTGTGGCCACTATCTTCCAGCCTCTGAACCCTCTGTGGCCGGTGCGAGCCGCCGGTCCGGCCGGGAAATGGCTCGTCAGCAAAACCAGACCCGACATCGCAAGGAAGTACACCAACTACGTGAAGGACGCCGACACTGTTATACCGGAATATATATACCAGTGTAACTCACAGACACCTAGCGGCGAGAGCGCATTTCACGCGCTAATGAACGGTTTCGGGTGGGCGAAGCACCCTATGTCTCGTCGGGCGGGGCAGTTGTCTCCGTCCCTGGGAGTGACCGTGCTGTACGGGGCGCGCTCCTGGGTTCAGACCGGGGCGGGACAGATAGCTGAAAATAGACCCGGGGCTGAAACACACGTACAGGTAATAAATGGAGCTGGTCATCACATATATCTGGACAAAACGGAGTTGTTCAATAAGTACGTACTGGAGGCGTGCGAAAGAGGCGACAGTCCGCGCCGACTCGTGGACCAGCCTCGAGAACAGTCCGCCAACAGTGCCACAAGCGAGTCGACTGGTGGAGCGACTAGTCGACCAACTAGTGGAGCGGCCGGCGACCAAACTCCGTCTCCACAAACCTAG

Protein sequence:

>DPOGS210426-PA
MGSELKLEKTKSSVLHRTWIGNVILYLWNWTGRWFSWTRQSDSMLRNVEQLILSCVKTAYKRFYVDIGSVVGQCDKIWTISLNEDSPKTPLVMLHGMASGLALWCPNLDALAATRPVYAMDLLGFGRSSRPKFSSDAEKVEAQWVESVEEWRREVKLEQFILLGHSLGGYIATAYALKYPERVRHLILADPWGFAERPDNINEKFHIPFYIRVVATIFQPLNPLWPVRAAGPAGKWLVSKTRPDIARKYTNYVKDADTVIPEYIYQCNSQTPSGESAFHALMNGFGWAKHPMSRRAGQLSPSLGVTVLYGARSWVQTGAGQIAENRPGAETHVQVINGAGHHIYLDKTELFNKYVLEACERGDSPRRLVDQPREQSANSATSESTGGATSRPTSGAAGDQTPSPQT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: