MonarchBase - Protein-coding gene

DPOGS208041
Transcript	DPOGS208041-TA	5814 bp
Protein	DPOGS208041-PA	1937 aa
Genomic position	DPSCF300203 + 85394-92657
RNAseq coverage	376x (Rank: top 32%)

Annotation
*Heliconius*	HMEL004046	0.0	65.21%
*Bombyx*	BGIBMGA001470-TA	0.0	57.09%
*Drosophila*	CG14200-PA	4e-16	39.05%
EBI UniRef50	UniRef50_UPI0002063DA8	6e-59	38.95%	UPI0002063DA8 related cluster n=1 Tax=unknown RepID=UPI0002063DA8
NCBI RefSeq	XP_001866907.1	6e-49	42.34%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|328784181	2e-58	38.95%	PREDICTED: hypothetical protein LOC551566 [Apis mellifera]
NCBI nr blastx	gi\|328784181	2e-91	24.07%	PREDICTED: hypothetical protein LOC551566 [Apis mellifera]

Group
KEGG pathway
Orthology group	MCL26674		Lepidoptera specific

Nucleotide sequence:

>DPOGS208041-TA
ATGTGTGAACAGAGTGAAGTTAATTATTTGGATGGAGATATAGTATGGGTAAAGCTAGGATCTTGCTGGTGGCCAGGTGAGGTGGTGGGTACAGAGAAACTACCACCGGACCTCCTACCATCATTTCGAAAGCCACCTATTGCTGTTGTCAAGTTTTTTCAAGAAGATTCTTATGAATATGTGAAAAACCTTAATTCAATATTCAAATACAACTGCAGTAGAAAAAATGAATTCATTAATAAAGGGCTATATATGTATAGAACAAAACATGGTCTCATGGAGAAATTCCCTGAGGATGTTATCAGGGCGGAAACTGCTGTGGGTGGTGATATAACGATATTAACTAGAGATGAATTCCAAGAAACAAAGAAAGAAAGCTATGCGGGGCTTTTCGGTGATCCCGCAAAGAAAAATACCCCCATCCACAAGAAAGGTAAAGGTGGAAGAGGACGGCCGCCTGACACAGCTAAGTTATCAACACCAATGAAAAAGTTCAAGGAAAAGACAAACTATAAAGTACATATATTATTACAAGGATCAAAAACTCCCAGCCAAAATAATGAGACATTATCAACACCCTCTACTAGCAGGGCCGGATCGGAACCCACAGAGATGTCACCTGAAAAATCCATTGAAAAGAGTGAAAATCAAAGTGAATCTGAGGAAGCTGATAAAACACCTCAACCAGCCTCATTTAGTACTCCAACAATGTCTAGTTCGGGACTGTATGTATGTCATGCGTGTCAGTTTTCAACACAACGCCTCAATGTACTGATTCTACATAACAAAACACATAGTGTATCATTTACACCATACTCACCATCACCAGTCAAAAAGAAACCGCTCAGTAAAATTAAATCAACGCCCGTTACGTCTAAAACTCCTAAAGAACGCAAGCGTAGAACGGAGAAGTCCGAAAAGAAAGAAAGAAAGACGCAGAGCAATAAGCGTTCAGCTGAAACAGAGACTATATCGGAAGTGAAGAAACCTAAAACGGATGAAGAAATTAAAAGCAGTCTTTTAGCAGACTGGGACGATGGTGATGAAGAGTCAGCTGATGAGTCCTCGACTATAGTAACGGCCGGATCCCCGGAAGTGCCTATGGCGGCAGAATCGCCAGCAGTGCCAACGCCAGCAGAACTGCCAAACAATCAGGATACTGTCGAGGATAAAAAAGATTCACCAACTCAAAAGCCGGAGTCATCCAGCGATTCCAAATACGAATTCTGTGAAGACGAAGATTGGCCGATTGAAACAGATATTGGAAGGAAAATACCTCGCGTCAAGAGCTCGTCGAAACGTAACGGCGATAAGAAAAGTGTGAGCATCGATGAAGAAGAAATGGCCAGGGAGGTGGCTGAGCTGCTCAACAAAACTGCGCTTCCGGAGCTGCCGTCGGCACCGGAACCATTGAAAGTCGAGGAAAATTTTCCGGAGGGCTCGATAGCGAAATCTCCAGATAAAAAGACCGATAAATCACAAGATCAAAGTTCCCCGGAAAAAAAAATACAAAATGACAACCAACCACCTAAAACAATATTCAAAACGAAAACTTTTTTTCGAAGTCGACACTCTAGAAGCCAGGATGCAATAGGAAAATATGTTGCGGAACAATTAAACGCAGCAGAAAGAATGGATCTGTCTGAGAGTGAATTAAACGGGTCTGAAGTGGCTTCGTCCCCAGAAATAAGGGAATCGCCTCAACAGATAAAGGTTGCACGTCTAGCGCCAAAGATACAATTCAAGAAAAGCAAAGCGGAAGCTGCACAACAAAAGGAAATGGAAAAACATAAGACGGAAAAGATTGACGAAGAATCTACGAATGCTATTAAGGATGTAGATATTCATGAAGATATGACTCATATAGAAGACAAAGATAAAGATGATAACTTAATGAGTGATATAAGCATATCAACCGACGAAAAATTGTATAAAAATAAACAAAAGCATAACTTAAAAGACAGCACAAATGATGTTTTAAATGATGAAGAAAATTTTGATTCCCCTAATCATTCTGATTCACCGTCAAAAAATGTGGTTCCGAAGAAAGAGGATAGTTCAAAAATATTAAGTTTTTCAGAAAAATCATTTGAGCCCTATATGAATGAGTCGACAGCATCGGCCGTTGATGCGTTACTGAGCGTGTCGAGAGAAGCTGATCGTGTTACTAAAGTTATAAGTGACGATCCTCCCGAGGATTTGTTTGAAGACGACGTAAAAGACAGCATATCCGTTAACATTAATGGTTTCAGCGACAGTGACCACAACAATATAACACAAAACGAAGATAACATCGAAAAAACAAATGATTCGACTGAAAAATTGGTGGATAACGAAGTATCTGATGCAAAAGTGTGTGATGAACAAGAGGAAAAACTTTCACAAAATAGTATAAATGATAATATTTCTGTGAAAGCTCATAAAGACATGGAAGACATAGCAGAAGTTGTGGATACGACTAAACTTGATGTAGTTAATTCTAAATTGATCTCAATTGAACCGGACAATAATTTTCCCGTAGAAAGTATCCCTTCTGAATCTGATTTGCAAGTAGCAGAAGCTCTCATTAATTTACCTACGACGACATTAAATAACAAACTGCCCGACGGCCACACAAACGAAACAAGTGTCAAAGAAGATAAAGAAACTACTAATATCACTAATGACGTACCTTTACAAAGCAGTCAAAATTTCTCCTTAGAAGAAGAACCAGACATCACACCAATCCAAACAAAAATTATGGTTAGTCCAAACAAAGAAATTAATTCGCGATATGAAACAGAACAAGAGAAAAGTGAAAATTTAAACGCAGCGAAGTCTTTAGTACAAATGTCGGAATCCATAGACCATAAAATTAAAATGTCTGAAAATAAGTCACCAAAGGAAAAACTTAGTATTTCACAACGAAAAGATGACTTATGTAATGAAAGTTCCATTGAAGTAACCCAAAAGCTAAGTGTGTCTACCAATGACTTCAGCAATGAATCTAAGACACATTGCGTCTCACCAGATTTACATTTACATTCACCGAAATTGTTGAAAATTCTGGAAGAACCGGGTTTGCCTAAGATAGCTGCTAGGAGAACTGTTACAAAACAAATTATTGTACCTCGCAAAGAGAAAATTTTAAATGTTGAAGCTGGAAAATCGCCTTTAAAGCCAAAAACGCAATCACCCAAACAAAAAATCATTATTCGTAGGACAACACCAAGTAAAAACTTGCTAAACAATATTGGTGAAATAACAACACCTGATAAAATAATTTTATCCCGAACAAATAAATCGTCACAAGATGGTTCGTCTGTACAAACCTATACAATTCAAACCTCTCCCGACATATCGCCCACAAGCGATCCTAATACTATCATAATTCAGCCAAAACTTCGTCAAGTTGTGAAACCAGTGTCTAAATTACAAAAAATTAAATCTCAACCCCAAACAATAATTGCCCCTAGTAAAGAGAGTAAAATTACACAAAACACGAAAAGTAAGGATGACTCTGTATTTGATATTAATTCTATGCCAATCGTGTTGACACCAGAGAGTATTGAGAAAATGCCCATCGTTATGTCCGATGGAAATATCATTACGAACTCTAGTAATCCACCAAAACTAGTAAAGACCAAACAAACTATAGCAGACAGTGGAAAGATGTCGCCTGGGCCTATCAAAGAAATAAAACCCATGATAATGAGTAACGAAGTAAGTAAAGCTACTACACCTAATATTCTCTCTAAATCACAAAAATTACGAGGAACAAAACCAATGCTTGTGATAGATAAGACTACAGGCAAACAAAAAATTATAATGACGAAGACAGAACAATCGAAAGAAGTTAAACAGCAAGCGACATTAATACAATCAGCACCTCAGAATTCGCAGAAAGCGGAAAAGTTCATAATTTTACCATCACAGAATTCTCCTCGCTCTGGAAGGACGCAAAAAATTGTTATCGATCCTCAAACCGGTAAGGCGCATGTTCTTGTAGGAAAATCAGAATCGCAATTAAGTACAGCTGAAAGTAATAAACCGGTTTCAGCGAAACTGATACCATCGCCATCAGATTCTAACACCCCCGGTAATACCGTTATGATAATTACGAACGCCCAAGGAGGACAATCTAGAATAGTCCTGACACCCGAACATGAAAAAATATTGTTCCCAAACAAGCAACAGCCAGCGATGTCTCAACTTAAGCCTGTAACGCATCGTATCACATCAGGTTCGGGAACTGTACAAAAAACTATAGTTTCCACAGCTACTGGGTCTACGAAAACTCAAACGCGAATCGTCCCTAAACAAAAGAGTGCTATAATTACGTCCAAGGGTCAACTAATAGTGGGTGGCCGTGTGGCGACTACTACTCAAAACATTGCACCATTACCTGAAATCAGACCAGCTCCAAAACGAATATTGGCCTCGGAGCCCAAGAGATTAGTCCAAACAATACAAAAAAATTCCTCGGAACCATTAATATTCTTACGCCAGAATTCCAGCGCTGTGATGCAACTTACTGTAGCCCAATTTGAACATCTCCAAAGAACCGGTCAAATAATACAGAAAGCCCCCACGCCTGTTCAAGAGAATAAAATAGTTGTCCAGAAGTCAATTACCATTTCACCAAAAGAACCAGTGTCCTCGATACAAAAGCAAAGAGTCAGAAAACAGACAAACGAGTCTCCGGCCCCTATGAAAAAAATAAAACATGAAATAGCGATAGCACCTGCACCCGCGCCTGTGACTATGCCAGCTCTAACACCAATCGCACCACCACAAGTACCGAACGTTTCGAGTACTACTACCAATATGTCAACCTCTAACTACTCAGATTTAGAAAACCTAGAAGAACTTCTGCCATCAACGGCAATAGTAAGACATTCGGAACCGACACTAATACAGCCTCAGTCTGAACTCAATCAGCCTCCACCTGCCGCTCTCTCTGATGGACAACTGCTGGCAGTGCCTGGAGAACACTTCGGAGGTCCGACGGGCTCATTTTACCTATGTGTAGAAGATAATGGCAATTTCACCGCGATAGACAATCGTCCTTTAATACTTGAAAACAATCAGTTAGTGCCGATGCCCGATCCTTTGCCGGTGCCAGTCGCTCACCCCGAACGTAGGGACATTTTAGAGGCCGCGCTGGCTAATAGTGATGTTTTTCACGGTGAAACAACGCGTGACGAGGCTCCAGATTTTAGAGATTTAAATGCGAACGTTTCGGTTCACTGTCGAGTCTCAGAAACTAGCACAACACTCAACCAGCCCATCATGACGCCGGTCGAAGTGCCTTCAAAAGTCGACAGTGAACCAACAACAGTCCCGTCTAACTTGGAGGATGGATTGGCCGTGATAGGTGTCACACCACACACCGTGCCGACCTCCCTCGAGCTGCCGATAACTGTAACAGATCCAAGGATAGCACCTAAAACAACCGATCCGCTTAGCAACAATAATTACGGAACATCCTTACTACCTTCTCCGAACACCGAATTGACGTTTTCCACAACAGAAGACGCTGATATATCCATGGTCGGTCCAATATCGATGCCAATTCTCACAGATGATGATAACGTTGGGGGGAAGTCCATGCCGATTCTGACGGATGAGGTTACGGAACGAACAGTATCCTCAGTGGACTCTACGATTGGATCTCCTTCATCCATAGATGTAAGGGAATCTGAGAACGAGGACAGCAGTCAGTGGCCGCGACGACTCCTCACTCCGTGTTCAGACACGTCAGAAACGTCATCAGAAATACCCTTACAACCCGTCATGCAACTATCAGTTAATGATCTGTCCCACGACGGCTAA

Protein sequence:

>DPOGS208041-PA
MCEQSEVNYLDGDIVWVKLGSCWWPGEVVGTEKLPPDLLPSFRKPPIAVVKFFQEDSYEYVKNLNSIFKYNCSRKNEFINKGLYMYRTKHGLMEKFPEDVIRAETAVGGDITILTRDEFQETKKESYAGLFGDPAKKNTPIHKKGKGGRGRPPDTAKLSTPMKKFKEKTNYKVHILLQGSKTPSQNNETLSTPSTSRAGSEPTEMSPEKSIEKSENQSESEEADKTPQPASFSTPTMSSSGLYVCHACQFSTQRLNVLILHNKTHSVSFTPYSPSPVKKKPLSKIKSTPVTSKTPKERKRRTEKSEKKERKTQSNKRSAETETISEVKKPKTDEEIKSSLLADWDDGDEESADESSTIVTAGSPEVPMAAESPAVPTPAELPNNQDTVEDKKDSPTQKPESSSDSKYEFCEDEDWPIETDIGRKIPRVKSSSKRNGDKKSVSIDEEEMAREVAELLNKTALPELPSAPEPLKVEENFPEGSIAKSPDKKTDKSQDQSSPEKKIQNDNQPPKTIFKTKTFFRSRHSRSQDAIGKYVAEQLNAAERMDLSESELNGSEVASSPEIRESPQQIKVARLAPKIQFKKSKAEAAQQKEMEKHKTEKIDEESTNAIKDVDIHEDMTHIEDKDKDDNLMSDISISTDEKLYKNKQKHNLKDSTNDVLNDEENFDSPNHSDSPSKNVVPKKEDSSKILSFSEKSFEPYMNESTASAVDALLSVSREADRVTKVISDDPPEDLFEDDVKDSISVNINGFSDSDHNNITQNEDNIEKTNDSTEKLVDNEVSDAKVCDEQEEKLSQNSINDNISVKAHKDMEDIAEVVDTTKLDVVNSKLISIEPDNNFPVESIPSESDLQVAEALINLPTTTLNNKLPDGHTNETSVKEDKETTNITNDVPLQSSQNFSLEEEPDITPIQTKIMVSPNKEINSRYETEQEKSENLNAAKSLVQMSESIDHKIKMSENKSPKEKLSISQRKDDLCNESSIEVTQKLSVSTNDFSNESKTHCVSPDLHLHSPKLLKILEEPGLPKIAARRTVTKQIIVPRKEKILNVEAGKSPLKPKTQSPKQKIIIRRTTPSKNLLNNIGEITTPDKIILSRTNKSSQDGSSVQTYTIQTSPDISPTSDPNTIIIQPKLRQVVKPVSKLQKIKSQPQTIIAPSKESKITQNTKSKDDSVFDINSMPIVLTPESIEKMPIVMSDGNIITNSSNPPKLVKTKQTIADSGKMSPGPIKEIKPMIMSNEVSKATTPNILSKSQKLRGTKPMLVIDKTTGKQKIIMTKTEQSKEVKQQATLIQSAPQNSQKAEKFIILPSQNSPRSGRTQKIVIDPQTGKAHVLVGKSESQLSTAESNKPVSAKLIPSPSDSNTPGNTVMIITNAQGGQSRIVLTPEHEKILFPNKQQPAMSQLKPVTHRITSGSGTVQKTIVSTATGSTKTQTRIVPKQKSAIITSKGQLIVGGRVATTTQNIAPLPEIRPAPKRILASEPKRLVQTIQKNSSEPLIFLRQNSSAVMQLTVAQFEHLQRTGQIIQKAPTPVQENKIVVQKSITISPKEPVSSIQKQRVRKQTNESPAPMKKIKHEIAIAPAPAPVTMPALTPIAPPQVPNVSSTTTNMSTSNYSDLENLEELLPSTAIVRHSEPTLIQPQSELNQPPPAALSDGQLLAVPGEHFGGPTGSFYLCVEDNGNFTAIDNRPLILENNQLVPMPDPLPVPVAHPERRDILEAALANSDVFHGETTRDEAPDFRDLNANVSVHCRVSETSTTLNQPIMTPVEVPSKVDSEPTTVPSNLEDGLAVIGVTPHTVPTSLELPITVTDPRIAPKTTDPLSNNNYGTSLLPSPNTELTFSTTEDADISMVGPISMPILTDDDNVGGKSMPILTDEVTERTVSSVDSTIGSPSSIDVRESENEDSSQWPRRLLTPCSDTSETSSEIPLQPVMQLSVNDLSHDG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: