MonarchBase - Protein-coding gene

DPOGS206638
Transcript	DPOGS206638-TA	3285 bp
Protein	DPOGS206638-PA	1094 aa
Genomic position	DPSCF300048 - 429940-482861
RNAseq coverage	100x (Rank: top 61%)

Annotation
*Heliconius*	HMEL011147	0.0	68.43%
*Bombyx*	BGIBMGA008339-TA	0.0	60.95%
*Drosophila*	CG32529-PA	6e-20	33.48%
EBI UniRef50	UniRef50_UPI00022C8AB8	2e-42	39.22%	UPI00022C8AB8 related cluster n=1 Tax=unknown RepID=UPI00022C8AB8
NCBI RefSeq	XP_001816051.1	4e-60	42.86%	PREDICTED: similar to AGAP004446-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270006002	2e-59	43.61%	hypothetical protein TcasGA2_TC008137 [Tribolium castaneum]
NCBI nr blastx	gi\|383863458	2e-83	30.02%	PREDICTED: uncharacterized protein LOC100880619 [Megachile rotundata]

Group
KEGG pathway
Orthology group	MCL25466		Lepidoptera specific

Nucleotide sequence:

>DPOGS206638-TA
ATGCGGTCACAAGCTGCAAAACCCTTACCTAAAAAGGGACCTTTGGCTAAAACATCTTTTAAAGCTAGTACCGCTACAAAACAAGTTAAGAAAAAAGCAGTAGCAACTAAAAAAGTGAAAACACTTCAAAAATCAACGACAAAAAGTCCAAAAAAGAATACTAGTGACGAATCCAAAAAGGACAATGATTCGTCAAATAAAGAAAAAAATGATTCCACGTCCGATACTGAAAAGGCTGGACCTTCCAAGACGATTAATATTAGAGAGGAGTCTCCTATGAAAAAAGGGAAAAAAGACCCAAAGGAAGCAAAAGACAAGAATAAAGCTGCCCCTAAGAAAGTTCTCTCAAAAAAACCTATTAAATTAACAAAAAAGGCCAACCCCGCAGTTAAAACTAAAAAAGACAGTGATGAAGTAAAGTACAAAATAAACTTAGAATCTGTTAAGAAAACGTCTGCAAAAAATCCAAAAGCAAAGACAAATATTAAAAAAAGCAATACAGGAAATCAAAAAAAGAAAAGTAATTTACAAAGTAAGGAGAGTGAAGTAAAAACTTTAGACAAGCATGATGAAGACGAAAAATGTCCTAAAGATAAAGTTAAAGATTCTTCGAATATTTCTACCATAACTGAGAATAAAGAAGACAAACCTGATAAAGATATTGCAGAGTCTGAAAAGAAATCAGAAAAGAAAGAGGAATCCAATAAAATTCTTAAGGGTAATAGCAATTTTTCGGAAACTGCATATCAAAGTATAACAGTTACCAAAAGCACTACTCAATCAGAAACACAAAAAACTGAAACAGAACGGCCTCCGAAATTTTTTACTTCCATCAGATCTCCGAGAACAGTCGATATAGACGTTAAATGTTGTAAGAATTCTAAAGGAAATTTGAGTGTTTCTGAAAGATTTATATCTCTTAAATGCGAAAGTAAAACGGATGACCTTAACAAAGATAAAAATACGTCAAATAATCTCGTATCTCAGGGCCCAGAAATAGACGTTTATACTTTCACAGAAAAGGTTGATTCACCAAAGAGCATATTATCTGATTTTAGAAATCCGATAAATAAAAATATTGGAAGAGTACGGCCAATTGCTAGAGTAAAAGGAACCGTTATAGATAAAAAATTAGATAATGAAAGGAAAAAGTTCTCTCCACATAGACCCATTGAGGAAGTAGTCAAACAACTTAAGGCAAATAAAAGAACAGAAGATTTAAGCTTGTCAAAAAATAATTCAGCTGCAAGTTTGGACTTTAATGTTTTCAACGACGAAAAAGAAGAAGTGCAACCACCTATTGTAAGTAAATCATACAAAATGGTAGCTAGAAAGTCTAGCATTACTGGTAAACCATTCAGCCCTATAAAATTCCTTGACCAAGATTCTCCTCCAAAACAAGAGGTAAAGACTCCAACTAAAGTTACCAATACAAAAAAAAATATTAGCAGATCTAAGAAACCACGGAAGAAAAGTACTTCATCTGATGATGAAATGAATACGTCAACTTTTGCACTCAATACAAAGACATTTCATTACACTTCTTCAGAAGAAAGCGTCAGCGAATCAAATGATGATAATGATCAAGTAGAATCTTCCGAATCCAGTTCCTCGAAGACTAAAAAGACAAGGAATAAAAAGTATAAGAGAATAACCGATGGTGCTAAGAAATCAAATTCTAAGGAATTGAAAGAATTGTCAAAAGATTCCTTGATTGATATCAAAGATACTTCTGCGTTACTAGGAAATGAAAAACCTAGCAAAAGGCGGCTAAAACTTTTATCAATGTGGTCAGGGCCGAAGAAACATAGAATGGCCTCTCTCAACGCTCTTGCAAAAGTACATTGTTTATACGAAAATGAAAGCAGAACTCATATGGAACTAGGTCTAATGAAGACAGTTGACAGGCAAGCTATGCCAAGTACATCTAAATCTAATTTGCCAAAGAAAAAAGAAACAAAAACTAGGGATTCCGACAAACAAGAAAGTACGTCAGAGTCTGAATACGAAAATAAAAAGGAAACGGAAAAAGACAGTTCGGAGAGTTCAGATGATAATCCGCCACAGAGAACTTTACGTGGCGTACCTGGAATAAGGAGTGCTGGTAAATATTGGGATCCGAGATCCTCTACGTCTTCCAGTGAAGATAGTGAATTAGAATCTAAAAGCAAAAATATCGCAACTGACAAAAAGAAAGCCTCCACCAAACCATCAGCTAAGTCAGATTCTGATAAGCCACCTCCCAAAATGAAGAAAACAGCTGGCGTTCCAGTAAAGAAGAAGCGTAACAGAAATGAAGTTGTTATGGACTTAAAAGATATGGTTGTTCAGAAACGTATGGCAAGCTTAAATGCCACTGCTATTCTAGCCGCCAGTTACGAGAAACGATCGCCTAAATCAAGCAAAGACGACACAACGTCAGACTCGTGCTCAGACGATTCTTTTTCACAGAAGCCAAAAAACGGATTAACTTCCGGCATAAAGTCGGAATTAAAAATAGAAGATACTAAAAAAGAATGCGAAGAGTTGTCTGATAGGAATCAAAAAGTTGAAGTAATCGTCAACCAAGATACAGATGTAACGATCACCGGCGTATATTCAACTCATCTTCATGAAGGATTCTGCACCGTATCGGGAATGCAATATCGTATCTCTTCAACAAGCCACACTCAAACAACAGCCACCGCTAATTGCGAAAAGGAGGGTTGTTCCCGAGAAGATGGTTCTCGTTACACACCCCTCTCGGCTCTGTCGTCTATGCAGCCTCCGGCGGACCACTCCCATCATCCACATCCAGTTCCGGAACTTGGCGGTTTGGCGAGGCGAGCTGCTGGTTGTTCCAGCGCATTCTCAGCACCCTCACCAGCTGCACATCATGACCCAGTTCAGCGGGAAGCTTCGCGTCGCTCCCGCAGGTGTACCCCTCCTCCTTCCCCCGCACCAGCTCCCCGCACACCCCGCAACCGTCACCCTCTCCCGCCCCGCACCCCGCCACCCCCGCTCGTATACGACGCAGCTTTCTTTAGTTCGTATGTACGCCACTTCACGCCACTCGCCAGTCGACTGTCAACCACGGAGGCGGGCGGTTTTATCGCTCTATCGGATAGCCGCGCCAACTGTAAACACGACGCACTATCTGCGCACCGCTTCCGTTCGCGAAATAACCTCAATCCATCGCTAGTGTCGTGTTGTGCCAAACCAGTGGATCTGGATTCAACACAAATTGGGCTACGGCCAACATACACAGCCAACTGCATCGAAGGGTGCCACAACCCCGTCGATTGA

Protein sequence:

>DPOGS206638-PA
MRSQAAKPLPKKGPLAKTSFKASTATKQVKKKAVATKKVKTLQKSTTKSPKKNTSDESKKDNDSSNKEKNDSTSDTEKAGPSKTINIREESPMKKGKKDPKEAKDKNKAAPKKVLSKKPIKLTKKANPAVKTKKDSDEVKYKINLESVKKTSAKNPKAKTNIKKSNTGNQKKKSNLQSKESEVKTLDKHDEDEKCPKDKVKDSSNISTITENKEDKPDKDIAESEKKSEKKEESNKILKGNSNFSETAYQSITVTKSTTQSETQKTETERPPKFFTSIRSPRTVDIDVKCCKNSKGNLSVSERFISLKCESKTDDLNKDKNTSNNLVSQGPEIDVYTFTEKVDSPKSILSDFRNPINKNIGRVRPIARVKGTVIDKKLDNERKKFSPHRPIEEVVKQLKANKRTEDLSLSKNNSAASLDFNVFNDEKEEVQPPIVSKSYKMVARKSSITGKPFSPIKFLDQDSPPKQEVKTPTKVTNTKKNISRSKKPRKKSTSSDDEMNTSTFALNTKTFHYTSSEESVSESNDDNDQVESSESSSSKTKKTRNKKYKRITDGAKKSNSKELKELSKDSLIDIKDTSALLGNEKPSKRRLKLLSMWSGPKKHRMASLNALAKVHCLYENESRTHMELGLMKTVDRQAMPSTSKSNLPKKKETKTRDSDKQESTSESEYENKKETEKDSSESSDDNPPQRTLRGVPGIRSAGKYWDPRSSTSSSEDSELESKSKNIATDKKKASTKPSAKSDSDKPPPKMKKTAGVPVKKKRNRNEVVMDLKDMVVQKRMASLNATAILAASYEKRSPKSSKDDTTSDSCSDDSFSQKPKNGLTSGIKSELKIEDTKKECEELSDRNQKVEVIVNQDTDVTITGVYSTHLHEGFCTVSGMQYRISSTSHTQTTATANCEKEGCSREDGSRYTPLSALSSMQPPADHSHHPHPVPELGGLARRAAGCSSAFSAPSPAAHHDPVQREASRRSRRCTPPPSPAPAPRTPRNRHPLPPRTPPPPLVYDAAFFSSYVRHFTPLASRLSTTEAGGFIALSDSRANCKHDALSAHRFRSRNNLNPSLVSCCAKPVDLDSTQIGLRPTYTANCIEGCHNPVD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: