MonarchBase - Protein-coding gene

DPOGS212208
Transcript	DPOGS212208-TA	4563 bp
Protein	DPOGS212208-PA	1520 aa
Genomic position	DPSCF300323 + 96789-112308
RNAseq coverage	383x (Rank: top 31%)

Annotation
*Heliconius*	HMEL016691	0.0	81.54%
*Bombyx*	BGIBMGA000976-TA	0.0	74.35%
*Drosophila*	CG17233-PC	2e-79	41.35%
EBI UniRef50	UniRef50_E2A1N2	4e-171	41.22%	Glutamine and serine-rich protein 1 n=8 Tax=Endopterygota RepID=E2A1N2_CAMFO
NCBI RefSeq	XP_624473.2	3e-171	44.02%	PREDICTED: similar to CG17233-PA, isoform A isoform 2 [Apis mellifera]
NCBI nr blastp	gi\|380026333	7e-178	44.61%	PREDICTED: uncharacterized protein LOC100866350 [Apis florea]
NCBI nr blastx	gi\|380026333	0.0	41.98%	PREDICTED: uncharacterized protein LOC100866350 [Apis florea]

Group
KEGG pathway
Orthology group	MCL15359		Insect specific

Nucleotide sequence:

>DPOGS212208-TA
ATGGATCCAGTAGGACCATGGTCAGCATATGCTTCGTACAATCGGCTAGCAGGAGTACAAGCTGGTGCTGCAAGTGGAGATTTTCATCACCATCTGGCAAGCGGAGGAACTGGATTAGGCAGCCAATCTGTGCCTTCAACTACTAGCCAAATATTACTACAGGCAGCTCATACTACGGCATCATTAGCAGGACAACTTGGTTCATCCACTAGCTCTCCTTTCAACCCTGGTGGTTTCCTTTCTCCACCCACTGTGGGGTATGATGCAGTTTTCTCACCTTTATTTCATCATGCCAACCCAAAACCAGCACATTATAGTTCATCCCTACAGGCGCAGCACCGTCAAGTAATTGCCCAAGCGCAGGCAGCGGTCGCCTCTAAACAATCTTCAGTAGAAAGTGAAATTTCCTCATTAAGGGAAAATTATTCCCATCAACCGCTAGCTGCACAAGGAACATCATTTTTTGATCAACCAACAACACCTGGCAGTACGGCAGGTTTGAGTTGGCAAGGAAACAATCAACTTCCCAGTCCATTTGGAATTCTACCTCATGAAAGTGTTGTGCCCTCATCGCCAAGTCCTGCCACAACAAAAGCATCAGCGACATATGAAAACTTTAATGCTCACTTTGCTGCCGCTCAAACTCTCAACAATCACCTCAACTCTCAAATTTCCAGTGCCGGTAAACAAACAAACAGGTCGGGATCACCTGCAACAGCAACTAAACAACCAGCTTCTTCAACATCATCTTCGACTTTTTTTCAATCTCCTTCATCTTTTGGAAACCAGTCTGATAATTCGTACAGTTCAAGTGCAAAAAGTGGCCAACTCCCATCACAGCAGGATTATGCTGGAAGTAAGTCATATTCAAGTTCTGCAAGTAATGCTGTTCACTCCCAACAATCTTGTATAGTGTCAACTCCATCAGTAACATCCTCTCCCCCACATCCCAGCAAAGATTACCGTTCACCCCCTTCCAATTCTACCAGACCGTCAGCGACTATATACAATTCTTCACCTAAGAATTCTTCTAGTGAAAAAAGCCCCCACACATCATCTAGTAGTAGTAGCGGTTTTGTATCTCCCACGTCCAAACCTCCACAAATACAAACGAAAGCACAAAGTAAAATATACCCCGAGTTAAGTTCAGAGCAAAGAAAAATCTGTGACACGAATGACAAACTCCAACCCCAGTCGTCCCCTATAAGTTACTCTATTATGGATAGTCCTGGTAGATTAAATTTTACTTCGGGTACTGGAACCTCTTCTAAGACTAATAGAATTGGCAGTTCTCAGTATAATTCGACACAAAGTTCAAGTTTTAGGCATTATCAAAGTGGAAATAATGTAGAGTCAGAGTATCATGTTAGAGCTAAAAGTAGTTCTAGTACTGACACTGGATATTCCAGCAGTAGTTCTCAAAATGGACCTGATTGTGGGGTTGTAGTCTCTAGAAGGCATAGTCCTTTGCAGGCGGCACCTCAGACCTCGCCCTTGGGACATGGTTCTAGTCCAGCCTACCCTTTATACCATAGTCCCATGAATTCTATCAATTCCCCTCAACAGCTAGGGGATCATTACAGCAAAGTGAATAATGCTGCACCAAGGTCACCCTTAGATGCTTCTGTCTCACGACCACCCTCACAAAATAGCCAAGTCGCTTACCCTTCCGTTATAACAAGAGCCTTAGGAATTGAACAAACTAAATCTTATAGTGAAAATAGATACGAACGTAACCAAAATCAGCCAGCAACTCAAAGTTGTTGGGAAACAGAGAGGCAATCCAACAGAAAATTCAGCAGTATTGGTATGAGTAGGAGTAACAGTTCTAGTAGCTTCAACGGCTTAACTGAAAATAATACTCATCCTGAAAAATCCTCATCTCAGTCCCAGAGTTCTAATGAAAAAATATTGAGTTTGTCTGAAAGACATCATAATTACGTCGAGGGCAATAGTGTAGCTTTACAAGATCTCTCTAGTTGTCGCGGTGATCCTATGAGTATAGTTAAGAATCTTCAAAGTTTACAACAAAGTTGTCAAATCCAAGATAGTAAAAGTACTAAAAGTCTAACCCCAATGTCGAACTTGCCACCCGTAAGTAAATCAATATCCAGGCGAAAAAGTACTGAAAAAGTAGTACCTCATACTAATATGAATGACATTTCCAATGCCGTAATGGCAGATTATTTAGCTAATAGAATACCACCACCCGCGCATAGCTCCACGAGCCAGCAACAAAACGGTAGCTATTTTGATTTCGAGAGATGGAATCTTCCGCCCCCTCCGCCTAAAATGTTTCCCGGAACTTCAGCTTTCGGTTCCCAAGCACCACTACATGCCACTAACTTCAATCAACACCAAGCTCTGGCAATGCAGCACGGTCACACATTAACCTATTTTTCTCCCTTTCACCTAGGCCACCATCCCGATTTCCAATCCTCTGTGGAGTTAACACCTCTATCTTCATTTAGTGAAACTCCACCTTCGGCTTCCTCGTCATCTTTTTCCACACCAGAAACTCGTGAAGAGGAACAGCCCAAGGTGGTAGTACCTAATATAGAAGAAGAACTTGGTTTCCTTGCAGAACAACGCGCAAATACTGCATCGACGGTAGCACCCACTTCACAGCAGCAGAACATTAACAGTACTTCACAAGACGCTACTTCAAAAATAATGGAAAAAAAGTTCAATGTTCCCGTTACGGGCCCCGGTTCGGGATTCATGGCTTCTTATTTGAAATTTTTACAAGGAGAGAGAGACACCTCTCCTCCGCCGGCCGGTCGAGGCGCCAGGAAATCTACATGGTCGAGGAGCAACACCAACAGTAACACGAACAATAAAACATATCCCAACGACCATAACAAAAGTCAGTGCGAGACGAATTCGTCGCAGAGCGCCAACGGCTCCATGGCGACCATTAACTCCGGCATGACGCTCGGCAACCCCGCCATGAGCACGGCGCTCGCCAACCAGCCGCACCCCTCGTCCACCCTCCTCCCGCACGCCAAGGCCGCGGAGCAGGACGAGTCGCGCTACTACAGTCTGAACAAAGACAGAAAGAGAAAGTACGACGGCACGGAGGAGGCCGTCTACGACGCGGACGAGGAGGCGAGGCGGCTGAACAAGCCCGTGCTGAACGTGCCCAGCACGCCGCTCAGCGACAAGGGCAAGAAGGGGCGAGCGGCGGCGATGAGCAAGGCGCCGCCCTCGGCGTTGGTGGCGCCTCAGCCGGCCGCGCCCAAGAAGCCGCGGGCGCCCTCGCACCCGGCGCCTCCGCTGCCTCCCCCGCAGCAGCAGTACTATTACCAACCGCAGCCCGAGGAAGTGCCGTCGCACACAGTCCTGGGTTACGGGGTGTACGGCGACGGAGACGCGAACTCCAACAGGAAGTTGCATCATATAAAGCACCAACAAGTGTCGAGCAGTGCGCAGATTGAGAACAGACCTATCGAAGAAATGCCTTACCAGTCCGGCGAGTTTGTTGCAATAAAGAGCGAACTGAACGAGATGTGGCCGGCGATATGGAGAGTGGACGGCAAGACGTTACTGCAGAAGTATGAACCGTTTGAAGAAAATGGGAAAGTACTGTATAGAAATATATCAACGTATGCAGCTTGGAATCCTGAGAATAAAAAACTCTACACGCAAGTCCCAGTGAAAGTTCGGTCGCAGTCCCATTTAGAAACAATAGTAGAATTAGTGAGAAGCGAGTTGCAAGGGGATGAATGTAACTTTATAGAAAAAAGGATGTTGGAAACTCAAATGTACCAGGAAAACTTTGAAGTTTATATACAGACGTTAATATCGCACGCGTTGGATCCCAATTTCCTGACGGAGATTTTCCAGGAGCAAGACGAATACTTCCTGTCTAACGTCAAAACTGTGGACGAGGTGACTGAGAGTATGCGTCAACGCGTGTCGTGCAGTAACGCTCGGTCGCTGGACGCGGCCGTGGACGTGTGGCCGGGGCTGAGCGTTGCGGCGGGCGGTTCGGGGGCCTGTCGAGCCTGCACCAGACCCGCTGTGACTCGTCTGCTGCTGTACGGACAACCCTACAACCCGGCCACGCTCGAACCCGTGCAACCCAACGCCAGGCTGGCATACGAGAAGGAGTTCCTGTTATGCACAACTTGTTGCGGTCGAGTGCAGTTGTACTCGAGGATATCACATCAAAAGTACCTCATGTATGCCGAGTGCAGTAAACGTGTGGCTGAGAAACGAATGCAGAATCCAAGTAAAGACACCACAGACATACTCAACGAATTGCTAGCGGATGAAGTTTGGCTGTCACAGGAATTCCTGTTATGCACAACTTGTTGCGGTCGAGTGCAGTTGTACTCGAGGATATCACATCAAAAGTACCTCATGTATGCCGAGTGCAGTAAACGTGTGGCTGAGAAACGAATGCAGAATCCAAGTAAAGACACCACAGACATACTCAACGAATTGCTAGCAGATGAAGTTTGGCTGTCACAGCTGTTCCGAGACGTTCGACATTCGTGGGCCGAAGCGGAATCCTGGGAGAGGAAAATGAGACAGGCCATGACACGACAGATGATTTAA

Protein sequence:

>DPOGS212208-PA
MDPVGPWSAYASYNRLAGVQAGAASGDFHHHLASGGTGLGSQSVPSTTSQILLQAAHTTASLAGQLGSSTSSPFNPGGFLSPPTVGYDAVFSPLFHHANPKPAHYSSSLQAQHRQVIAQAQAAVASKQSSVESEISSLRENYSHQPLAAQGTSFFDQPTTPGSTAGLSWQGNNQLPSPFGILPHESVVPSSPSPATTKASATYENFNAHFAAAQTLNNHLNSQISSAGKQTNRSGSPATATKQPASSTSSSTFFQSPSSFGNQSDNSYSSSAKSGQLPSQQDYAGSKSYSSSASNAVHSQQSCIVSTPSVTSSPPHPSKDYRSPPSNSTRPSATIYNSSPKNSSSEKSPHTSSSSSSGFVSPTSKPPQIQTKAQSKIYPELSSEQRKICDTNDKLQPQSSPISYSIMDSPGRLNFTSGTGTSSKTNRIGSSQYNSTQSSSFRHYQSGNNVESEYHVRAKSSSSTDTGYSSSSSQNGPDCGVVVSRRHSPLQAAPQTSPLGHGSSPAYPLYHSPMNSINSPQQLGDHYSKVNNAAPRSPLDASVSRPPSQNSQVAYPSVITRALGIEQTKSYSENRYERNQNQPATQSCWETERQSNRKFSSIGMSRSNSSSSFNGLTENNTHPEKSSSQSQSSNEKILSLSERHHNYVEGNSVALQDLSSCRGDPMSIVKNLQSLQQSCQIQDSKSTKSLTPMSNLPPVSKSISRRKSTEKVVPHTNMNDISNAVMADYLANRIPPPAHSSTSQQQNGSYFDFERWNLPPPPPKMFPGTSAFGSQAPLHATNFNQHQALAMQHGHTLTYFSPFHLGHHPDFQSSVELTPLSSFSETPPSASSSSFSTPETREEEQPKVVVPNIEEELGFLAEQRANTASTVAPTSQQQNINSTSQDATSKIMEKKFNVPVTGPGSGFMASYLKFLQGERDTSPPPAGRGARKSTWSRSNTNSNTNNKTYPNDHNKSQCETNSSQSANGSMATINSGMTLGNPAMSTALANQPHPSSTLLPHAKAAEQDESRYYSLNKDRKRKYDGTEEAVYDADEEARRLNKPVLNVPSTPLSDKGKKGRAAAMSKAPPSALVAPQPAAPKKPRAPSHPAPPLPPPQQQYYYQPQPEEVPSHTVLGYGVYGDGDANSNRKLHHIKHQQVSSSAQIENRPIEEMPYQSGEFVAIKSELNEMWPAIWRVDGKTLLQKYEPFEENGKVLYRNISTYAAWNPENKKLYTQVPVKVRSQSHLETIVELVRSELQGDECNFIEKRMLETQMYQENFEVYIQTLISHALDPNFLTEIFQEQDEYFLSNVKTVDEVTESMRQRVSCSNARSLDAAVDVWPGLSVAAGGSGACRACTRPAVTRLLLYGQPYNPATLEPVQPNARLAYEKEFLLCTTCCGRVQLYSRISHQKYLMYAECSKRVAEKRMQNPSKDTTDILNELLADEVWLSQEFLLCTTCCGRVQLYSRISHQKYLMYAECSKRVAEKRMQNPSKDTTDILNELLADEVWLSQLFRDVRHSWAEAESWERKMRQAMTRQMI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: