MonarchBase - Protein-coding gene

DPOGS203491
Transcript	DPOGS203491-TA	2472 bp
Protein	DPOGS203491-PA	823 aa
Genomic position	DPSCF300055 - 814195-823173
RNAseq coverage	11x (Rank: top 83%)

Annotation
*Heliconius*	HMEL014295	3e-55	40.39%
*Bombyx*	BGIBMGA008297-TA	3e-89	44.68%
*Drosophila*			%
EBI UniRef50	UniRef50_E2A5X5	4e-13	26.57%	Glutamine-rich protein 2 n=1 Tax=Camponotus floridanus RepID=E2A5X5_CAMFO
NCBI RefSeq	XP_002428746.1	5e-12	32.43%	hypothetical protein Phum_PHUM399540 [Pediculus humanus corporis]
NCBI nr blastp	gi\|383860730	1e-12	26.05%	PREDICTED: uncharacterized protein LOC100883897 [Megachile rotundata]
NCBI nr blastx	gi\|270011350	2e-17	19.83%	hypothetical protein TcasGA2_TC005359 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL25461		Lepidoptera specific

Nucleotide sequence:

>DPOGS203491-TA
ATGGCTAAGATTGCGGACGAACCGAATATGAGTGACTCCACTTTATTGGTGACCGTAGAAGATCTTATAAACCAAGCCATGGGACCACCTGGTGGGAATGTAGTGGACTTCAAATTGATTCAAGTGGTTCTCCAAATTCTCGCACGTCAACAGCGAATGCTGCAACAAAAGGTAGAAATCCAGGTTTCAGAATTTATTGAAGTAACGCCTATTAAGAAGTCTAAGGGAAAGTCTTCGGAAGAATCAACTGAAAGTTCATCCTCTAGAAGTCCTCGTCCTCTTGCGAAGCCTCACATGGCGAAGATAAAGGAAGAACAAAAAATGGACGATGATAAGCGAACTGAACAAGAAGAACAAAGAGAAGACGATCAGGAAAAAGTTGATAAGAAAAGTAAACAGGAACAATCTGCTAAAGAAAAAGCTAAATCAAAGAAAGACGGAGACACAACTGAAAAAGAGTTGGGCAAAACTAAGTCACAAAGTGAGTTTGAAAAAGTTCAAAAGGAGGAAGAAGACAAAAGCAAACCACAGAAAGAATCTGGAAAAGGCCAAAAGGGAACAGCAAAAGGCAAATCTCAGAAGGATATGGGAAAAACTCAAAAGAAACAAGGAAAGAAACCTGATGACTCAGCTGCTACCAGTTTAACTGTCACGGATTCCCATGGCCGGACAAACATCGATGTGGTAACTCAGTCACAATTCGCAATTCTGGAAGCGGCGATAAAAGACCTCATGGACGTTGCTGCTCCACAACCCCTCTCGATGCCAAAAAATGAGAAGTTGAGGAAAGATCTCGCCAAAGGCACTGCGACTTTGCCTGATGCTATGGAGGCTATGCAGGTAGTAGCTCGTATGAAAGCAGCAGAAGCCGCTATCCAGCGCATGTCAGGCCTGATTACACATCTGGCAGGTGCAAGTGACCTCGCCGATGTTGGCGATGTCTCAGATGTGACAGATGAGAGGGAAGAGAAACTCCCTGAAGAGACCATCAAATCTCGAGTTTCTGTCGCTCCGAGGAAGTCTGTAATGATCGATCCGAAGGTTTCTCAAGTGTCACATATAAGTACGAAGCCGTCAGTAGCCTCCTATGTAGACACCGGCCCTTCGTCAGCCTCGTCAGTGGCCGCTCCCAGACCCTCACAAGTTTCGGTCAAACCGTCGGTGTTGTCCAAAGCTTCTTCCGTGACTATGGGCCCGAGTGTCACCCAAGAAGAAATGGAGTCAGCCCTGAGAGGTTTGCATGACGAAATATCCAAGTCTCTTAACGCGGCCGTGAGTCGTGCCGCGACTGCTGCGGAGACGGCCCTCCACACTGCTGTCAATGTCGCAAATAAACTAGACGTAGCTCTAAAACTGGATGGTCGTATATCAGCGCTGTACGCCATCGTCGGTGACTACTCAGATCAGTTGAGTGGATTCGACGCCGGGCTCACGACACAAATGCAAGGTTTCAAAGATCAAATCGCCCAAATGCGTTCGGATCTCAAGAAAGGACTTCAACAGTTGGACAATGTTAACAATAACGCCGAAACAGCTGCTGTGATGGAGCTGACGGAGCGCTACACTGAGCTGGTCGTAGACCTGGACACCACTATGACAGCGCACACGGCGCTGCAGCAGCTACAGTCAAAGCTGGCTGGGGAGATGCATGAGGAGACAAATAAACATCAGCAAAATTTTCAGGTTTGGGTAGTGTTTGTCGTTTGCCGACCACCGCTGAGCTTGGTGGAGTGTGTGGAAATGCTGCGCGAACAGAAATGCGACAGAGATGAAGTCTTGGATGGACTCCGGGATAAGGCCGACATATCACGTCTGGCGGGTCTGCTGTCAGAGGTACAGTTCGCGACGGCGCGGACTGACTTCGAGCGGCGGCTAGACCTCTGTCACGACAAATTCAACAGACAGGATGCAATGTGGACGTCGGCAGTCATGGACCTGTCCCGTCTGACGGATCAGAAGGCGGAACTGATCGAGTTGCTATCGTTACGAGACACCACACAGAAACAACTGCAAGAGTTACAAGACAGGCTGCACACGATGGCCGTCGTACTGGGAGAGCCAAAGGCGGCGCTACTTACTCGCCAACTAGCTCGTGGTGCAGTGTGCGGCGCCTGCGGAGCCTCCGCGCTCATGGAGCCGAGGGACTCCCACGCGGGTGCTCCGCCTCGCCTGCCGCCGCTCCGAGCGGAACCCGAGCCGGAGCCCTGCAATCGATGGATCGTCGCTGAGCCTCCGCTTGAGAGACACGTGTGTCACCGGTGGGCGGGAGGGTCCCACACGCTGTTGAGTGCGACCACACACGAGCGAGCACCGAGTCTGGACCTCAGTGAGATCCGCACCATGAAGTATACAGGCCACGGCACGGACGGACGGCTGTACATGTTGGAAGAGGATCTCAAGCCGTGTGTTGAATGCAACATGCTCACCACGGACGTCCCTCCAGAAGGAGCGCAGGCCAGCGACACGCACTGA

Protein sequence:

>DPOGS203491-PA
MAKIADEPNMSDSTLLVTVEDLINQAMGPPGGNVVDFKLIQVVLQILARQQRMLQQKVEIQVSEFIEVTPIKKSKGKSSEESTESSSSRSPRPLAKPHMAKIKEEQKMDDDKRTEQEEQREDDQEKVDKKSKQEQSAKEKAKSKKDGDTTEKELGKTKSQSEFEKVQKEEEDKSKPQKESGKGQKGTAKGKSQKDMGKTQKKQGKKPDDSAATSLTVTDSHGRTNIDVVTQSQFAILEAAIKDLMDVAAPQPLSMPKNEKLRKDLAKGTATLPDAMEAMQVVARMKAAEAAIQRMSGLITHLAGASDLADVGDVSDVTDEREEKLPEETIKSRVSVAPRKSVMIDPKVSQVSHISTKPSVASYVDTGPSSASSVAAPRPSQVSVKPSVLSKASSVTMGPSVTQEEMESALRGLHDEISKSLNAAVSRAATAAETALHTAVNVANKLDVALKLDGRISALYAIVGDYSDQLSGFDAGLTTQMQGFKDQIAQMRSDLKKGLQQLDNVNNNAETAAVMELTERYTELVVDLDTTMTAHTALQQLQSKLAGEMHEETNKHQQNFQVWVVFVVCRPPLSLVECVEMLREQKCDRDEVLDGLRDKADISRLAGLLSEVQFATARTDFERRLDLCHDKFNRQDAMWTSAVMDLSRLTDQKAELIELLSLRDTTQKQLQELQDRLHTMAVVLGEPKAALLTRQLARGAVCGACGASALMEPRDSHAGAPPRLPPLRAEPEPEPCNRWIVAEPPLERHVCHRWAGGSHTLLSATTHERAPSLDLSEIRTMKYTGHGTDGRLYMLEEDLKPCVECNMLTTDVPPEGAQASDTH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: