MonarchBase - Protein-coding gene

DPOGS213539
Transcript	DPOGS213539-TA	3252 bp
Protein	DPOGS213539-PA	1083 aa
Genomic position	DPSCF300033 - 469550-472894
RNAseq coverage	117x (Rank: top 58%)

Annotation
*Heliconius*	HMEL005478	0.0	64.65%
*Bombyx*	BGIBMGA011821-TA	3e-139	66.99%
*Drosophila*	Cep135-PB	1e-18	26.17%
EBI UniRef50	UniRef50_UPI0002246959	8e-50	25.98%	UPI0002246959 related cluster n=2 Tax=unknown RepID=UPI0002246959
NCBI RefSeq	XP_975548.1	1e-38	31.94%	PREDICTED: similar to AGAP010985-PA [Tribolium castaneum]
NCBI nr blastp	gi\|345484545	3e-49	25.98%	PREDICTED: centrosomal protein of 135 kDa-like [Nasonia vitripennis]
NCBI nr blastx	gi\|242005075	4e-92	25.40%	hypothetical protein Phum_PHUM055770 [Pediculus humanus corporis]

Group
KEGG pathway
Orthology group	MCL25890		Lepidoptera specific

Nucleotide sequence:

>DPOGS213539-TA
ATGGGTGACGTTTATTTTGATTTAAAAAGGAAACTTGAAGATCTAGGATATACTAATACATTGTCATTGGATTCGGTGCCTTTAGTTCAATGTATTGTTGCTGATTTACTACAAACTACCCGTAGCTTACAACATTATATGGATTTATCCAAAGAGGCCCTAATGCAACGAGATGCTCTTATGATTGAAGCCGAACCCTATAAATGTGATAATATTAAATTAATACAGGAAAACAATCAATTACATAAAGAAATTATGCTTGTTAAAGAGGAGCATCTAAAAATAACAAAAGAAAGCCGACGTAAAATCAAAAATCTTACTGATGAATTGTCAAAAAAGGAAGCATTGATAAGTAAATTACAACATGATATAAGAGATCTCAGTTTAAGAGGGTTATGTGCGGAAACACAGAGCAGCCGTAATAAGAGCAAAAGAAAAGATGGAGGTGACTGTTTAACATCCAAAGTTTGCATATGTCATGATACAAACACTTATGAAAAAGATGCCATGGAAAAGAATAGAACTATTCAGTCCCTGGAGGAAAAACTAGCTGAGTATAGTGACGAAATAACTCTTCTTCAAAACCAAGTTGAACAGAGAGATAATGAAATAGTTAGGCTGAGTATACTTTTAGATGGAGGCAGACCTGTTACAGCTGTGAGTAAAGACTTTTACAATGAACAACCTAACATTAAATTACAAAATCTAACAAAGCAAATGAAAGAATTGGAGAGAGCCAACGAATCACTGAAGAAAGAAGTAGCTAGTAGTCTTGAGAAACAACACGAAGCTATGCTCCGTGCTCTGTCTCTAGCAGATAAGAATAAAAAGCTTCAAGAGGAAGTGCAGCAAGTGGATAAATTAGCATTAAAACTTGAAGATGACTGTAATAAAAGATTAGCGTCCATGATGAATGAGATGAATTTCTTGCAAACAAGATTAGATGGTTTGAGTATGAAAAATTCAGAATTAGAAAAGGAGGCATCACAGAGATATTCAAAAGATAGTTCCACCCATACCCAAAAACTCCAAGAGAACTTAGCCGCTGCTTTGATGGAGAAAGAGGTGCTACATAAAGAAATTAAAGATCTAGTAGATCTCAATAAGAGCTTACAAGAAAAAATTGTGTCACTAACAGAGGTCAATAGAAACTTCAATAGCAATGTTACACCAGAAATTGTTGAAGACACTCCCCATCTAGTGAAGGAAGAATTAAAAGAATTATTACAAGAAGAAAGAAGGAAATATGAAACTTATATTGTAAGTCTTGAAGAAAAATTATCTGAAACCATAAATCTTTTCAACAAACATGCCTCTAGAGAAAAGGATTTAATTCCAGCATCGTCGAGCTTGTCTTGCGATAACAGCTTTATAAGAGATCTACATAACAAATTATGTAAAAGCGAGCAGCAGATTCTAATGTTGAAGAAGGAAAATGACGAATTACAGACAAAAATATATAACACAGAAGAGGGTAGCAAACATAATTATAAAGACATAATAAAACAATTGAATGACGAAAATACAGAGCTATCAAAAGAAAATATATCTCTCAGTAGACAAGTTAGTCAATACAAGTCTCTGAATACTAATGATAGGGGTGATTACTGTAGGAAAGATTTACAAAAACTTAATGAAAAAATTGACGATATGTCGAGAGAAATCCAGGTGTTAAAGAAAGATAAACAGGAATACCACATGAGGTACAAGGAAGCCATGGAGCTGGCTGATAAGTTAAAAAGAGATTTAGCATATAAGGTCAAAGAAATGGAACATTTAGAAGAAGAAAATTGTTCATACAAAATGAGCCATAGGACCGGACAAGCGTCTGCCGATCATTTAAAAGAAGAATGTAATTATTTAAGAGAGCAAATGAAAAAGATGCAATCTGATTACATCAAAGAGAAGACATTAGCAAACCAAATAAAAAATATACAACTCGAAACGGAAAGAAGCAGTGCGGAGGCACATAACGAATTATTGTCACTACAAAAGAAACTCAGTTTATTGAAAGACAGCAACGAAACTTTGGAAAATAAATGCAGAGATTTACAGTCTGAAATTATAAAACTGAGAAATGACAATATGAATTTAGTAGATAATATCAAATTAATAGATAAAGAAAGGGACAAACTAGTCATTGAGTTAGATCAGAAAACTGAAAATATAAGTGTTTATCTTGTCTTTGAATTAAGTGTCTCATATGAGTTAAGTAAACTCGAAAATGAATTGAGTGACGCAAAGAGAAAACTTAATATGAACAAAGTAAGCGAACACAAAGTAGTGGACTATGAATCACAAATAACTTTCCTTAATGGTGAAATATTAAGGCTGACACAGCAGCTGGATACATCGGTGATGGAAAATAAACATTTACAAAATAGTTTAGCCGATGCCAATGGACATTTGAAAATAACGAGAATTGAACTAGAAAAATCTAAAAAGGACGTCGACGGGCTCAAACAGCAATTGCAACATTACGTAGCTGAAATTAGAAGAATTGAGGAGCTTTTATCTCAAAAGGAAGCCGAAAGATCAGATATGTTAGAACACTTTGCTAGTTTATCTGTCGAAGCTAACATTTTAGAAAACACAAATCACTCATTGGAGAGCGAGTCCGCGTCTAAATCAATGCAACTTCAGTCATATGTTAGTAAAATTCAAAATTTAGAAGAAAAACTTGTGGACAAAGAACACATTATTGACAGTCAGTCAGCTAGAATAGCAGCTATGACCTGCAAGATAAGTTCATTAGAAAATGAAATAAAACTGATGACAGAAGAGAAGAATATCCTGGAGCAAAATGTTAGCTGCCTTAAACAAATGTGCAACAATCTACAAAGCAACAAGATGCCTAAAAGTGATGATAATTCAGAAATCAAGTTATATGAAAATAGAATACGAAATCTGTCTAGTGTTAAAACTCAATTGGAATCTGAGAAGGAGGATTTAAAGGAGAAGTTGCGGACAACCGAAAGATTACTATCCAACACGAGAAGGGAGTGCATAGAGTTGAAATTAGCTTTACAAGATGCTACGTCGGAAACAAAATCTCTTCAAGAACATGTCAGCAGACTTAGGACAGCGGATGACGAACAGAATGTATTAGCCACCGCCGAGTTGAATCTCAACCTGCCTTTAATGTTGGAAGAAACGATACACGAGCTCAGCCATGAAGACGAGTACAGTGATAGATGTAATTCAAACTTAAATAAAAGTTTCACAAAGTATACTCACAGCAGCACTTTATAG

Protein sequence:

>DPOGS213539-PA
MGDVYFDLKRKLEDLGYTNTLSLDSVPLVQCIVADLLQTTRSLQHYMDLSKEALMQRDALMIEAEPYKCDNIKLIQENNQLHKEIMLVKEEHLKITKESRRKIKNLTDELSKKEALISKLQHDIRDLSLRGLCAETQSSRNKSKRKDGGDCLTSKVCICHDTNTYEKDAMEKNRTIQSLEEKLAEYSDEITLLQNQVEQRDNEIVRLSILLDGGRPVTAVSKDFYNEQPNIKLQNLTKQMKELERANESLKKEVASSLEKQHEAMLRALSLADKNKKLQEEVQQVDKLALKLEDDCNKRLASMMNEMNFLQTRLDGLSMKNSELEKEASQRYSKDSSTHTQKLQENLAAALMEKEVLHKEIKDLVDLNKSLQEKIVSLTEVNRNFNSNVTPEIVEDTPHLVKEELKELLQEERRKYETYIVSLEEKLSETINLFNKHASREKDLIPASSSLSCDNSFIRDLHNKLCKSEQQILMLKKENDELQTKIYNTEEGSKHNYKDIIKQLNDENTELSKENISLSRQVSQYKSLNTNDRGDYCRKDLQKLNEKIDDMSREIQVLKKDKQEYHMRYKEAMELADKLKRDLAYKVKEMEHLEEENCSYKMSHRTGQASADHLKEECNYLREQMKKMQSDYIKEKTLANQIKNIQLETERSSAEAHNELLSLQKKLSLLKDSNETLENKCRDLQSEIIKLRNDNMNLVDNIKLIDKERDKLVIELDQKTENISVYLVFELSVSYELSKLENELSDAKRKLNMNKVSEHKVVDYESQITFLNGEILRLTQQLDTSVMENKHLQNSLADANGHLKITRIELEKSKKDVDGLKQQLQHYVAEIRRIEELLSQKEAERSDMLEHFASLSVEANILENTNHSLESESASKSMQLQSYVSKIQNLEEKLVDKEHIIDSQSARIAAMTCKISSLENEIKLMTEEKNILEQNVSCLKQMCNNLQSNKMPKSDDNSEIKLYENRIRNLSSVKTQLESEKEDLKEKLRTTERLLSNTRRECIELKLALQDATSETKSLQEHVSRLRTADDEQNVLATAELNLNLPLMLEETIHELSHEDEYSDRCNSNLNKSFTKYTHSSTL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: