MonarchBase - Protein-coding gene

DPOGS206791
Transcript	DPOGS206791-TA	1692 bp
Protein	DPOGS206791-PA	563 aa
Genomic position	DPSCF300001 - 4791613-4827851
RNAseq coverage	55x (Rank: top 69%)

Annotation
*Heliconius*	HMEL008469	7e-92	71.95%
*Bombyx*	BGIBMGA000574-TA	7e-76	63.52%
*Drosophila*	sowah-PG	5e-46	33.26%
EBI UniRef50	UniRef50_UPI00020629E3	3e-47	45.60%	UPI00020629E3 related cluster n=1 Tax=unknown RepID=UPI00020629E3
NCBI RefSeq	XP_001604980.1	1e-79	34.80%	PREDICTED: similar to LD31582p [Nasonia vitripennis]
NCBI nr blastp	gi\|328777922	3e-92	38.53%	PREDICTED: hypothetical protein LOC410299 [Apis mellifera]
NCBI nr blastx	gi\|328777922	4e-95	38.26%	PREDICTED: hypothetical protein LOC410299 [Apis mellifera]

Group
KEGG pathway
InterPro domain	[273-389] IPR020683	3.8e-16	Ankyrin repeat-containing domain
Orthology group	MCL13311		Insect specific

Nucleotide sequence:

>DPOGS206791-TA
ATGTCCCATCCAGCAGAATTAAGTTTTGACGAAATACTTAAGTTTATGCTAGCAAATAATGGAAAAGTTACAAACCATGAGTTAGTGAAACATTTCAAAGTGTTTTTAATGAATCCGGACATGAGAGATGAAGCCCGAAACACTTTTAAAAAGCATGTTAATGCTTTAGCCATAATTAAAAACCAAAACAATGAGAAGTGGTTAATTTTAAAAAAGAAATATTTAAATAATCCTGTCAAACAAAATGAGGAGGTTGTGGAATCAAAAATTACTGAATTGCCTGTGGTACCAAATGTATCTAACATGGAAACAGAATCTGTTCCTCAGTCAACATATAAGCATCCACCACCATTACAACTTAACCAAGATTTCAATATCTTAGCAAATATTATACAAGACTCATCAGCAGCTGCAACACCAACACAAGCATCAGAAATACCCTTAGAAATTCCAGTCAGTGAAAGCAAAGAGTCTTTGACAGCTGTGGAGGAAACCCCACCCAAAGTTCATCCACGAAGAAAATCTTCTGATAAAATTTTAGCAGAGAAAAGATCAAGTGTTGCTAGCCTAAATTTAGGGTCTCGTTCATCGATACCAAGTCAAGACCTCTCAGAATTAAGTGAGAAGTCCACCTTAACGTTATCATCTTCTAGAAGTGAAAGTATGTTAATTGACCATGAACAAAAAATATCTGTTAAAGAAAGGAAGCAAATGTTTAACAGAATGGCATCGGAGAGTGATGTTCTCAAGACGCAAAAATTGAGCTTTAATAATTCGAGTGTTGACGAAGAAGACAGAGCGTCGCTTGAACAAAAGGAAACGGATCCATTGGATTCCAAGCAGAAACAGTGGATCCTATGCGCTGCGAGGGGCGAGTACCATTCTCTTGCCAAAATGTGCAAAGAGAACGCCAAATTAGTTCGTACAAAGGTAAGTTACTGCTGTTATACCGCAATGCATTGGGCTTGTAAAAGAGGGGATGAAAATTTGGTGAAGCTGCTCGCTGGCATACATCGACACATAGTGAACGAACGTTCGGGCTACACACCATTACACATTGCGATGCAGTTCAGACATGAAAACGTCTATAGACTCCTGGTCGAAATGTACGATGCTGATCCAAATATGAGAGATTGGTCCGGTAAAAAGGCGCGACAATATCTTGTGCATATGGATACGTCCCTGTCACCAGGGTCTTATAGAAAACCGGATACGAATGTCGGTCGTAGTGTTACTTCGCAACCTTCTGTGAAGGTTCAGAAGAGTTATGTTCAACAATTGAGCAAGAACGAAAAGGAAGGTTTCTTACGCATCGGCTCCTTAAACGTGCGCGTCAAGAAGACTACAGAGGCATTCAGTAACTTCCTGGGTGTTGGCGCTACAAGGACGGCGTACGTTCATAAACGAGCTGATGTCGAGAGACGGTCAGATGACGGTGAACTACACAAATCATGGGGTTCCGCAGATAATATACAGAAGGATGATAAGTCTATGCCACCTCCGCTGAGCAGTAAAGTGCGTCGTCGGGGTGCCAGCGGCCGAAGAGGAGTTGCAAGTCACAGTAGAAGCACGCCGTCTACACCAGACCAGCCACGTGCGCAGATAGGTCTAAACGAAGAAGGTGACTCGGACTCCGACACTGCAGCTGGTTTCCATTCAGCCTGGAGGCAGCAGAGGTCGTCAAACCATTAG

Protein sequence:

>DPOGS206791-PA
MSHPAELSFDEILKFMLANNGKVTNHELVKHFKVFLMNPDMRDEARNTFKKHVNALAIIKNQNNEKWLILKKKYLNNPVKQNEEVVESKITELPVVPNVSNMETESVPQSTYKHPPPLQLNQDFNILANIIQDSSAAATPTQASEIPLEIPVSESKESLTAVEETPPKVHPRRKSSDKILAEKRSSVASLNLGSRSSIPSQDLSELSEKSTLTLSSSRSESMLIDHEQKISVKERKQMFNRMASESDVLKTQKLSFNNSSVDEEDRASLEQKETDPLDSKQKQWILCAARGEYHSLAKMCKENAKLVRTKVSYCCYTAMHWACKRGDENLVKLLAGIHRHIVNERSGYTPLHIAMQFRHENVYRLLVEMYDADPNMRDWSGKKARQYLVHMDTSLSPGSYRKPDTNVGRSVTSQPSVKVQKSYVQQLSKNEKEGFLRIGSLNVRVKKTTEAFSNFLGVGATRTAYVHKRADVERRSDDGELHKSWGSADNIQKDDKSMPPPLSSKVRRRGASGRRGVASHSRSTPSTPDQPRAQIGLNEEGDSDSDTAAGFHSAWRQQRSSNH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: