MonarchBase - Protein-coding gene

DPOGS215583
Transcript	DPOGS215583-TA	2757 bp
Protein	DPOGS215583-PA	918 aa
Genomic position	DPSCF300097 + 155399-159972
RNAseq coverage	280x (Rank: top 39%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA009188-TA	1e-27	36.47%
*Drosophila*			%
EBI UniRef50	UniRef50_D6W9C7	3e-21	22.42%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6W9C7_TRICA
NCBI RefSeq	XP_001660842.1	5e-23	26.53%	hypothetical protein AaeL_AAEL010459 [Aedes aegypti]
NCBI nr blastp	gi\|157126193	1e-21	26.53%	hypothetical protein AaeL_AAEL010459 [Aedes aegypti]
NCBI nr blastx	gi\|72547036	2e-39	25.38%	proteophosphoglycan 5 [Leishmania major strain Friedlin]

Group
KEGG pathway
Orthology group	MCL18015		Lepidoptera specific

Nucleotide sequence:

>DPOGS215583-TA
ATGGCTTTGTTCCCCGCGTATTCATCGGACGCTGTAGAAAATACTACTATAAAGGAGCGAGTGTACATATCAGAAAACCCATCTCAATTTATCGAGAGCGAGTTGTTGGCGAGTGATTCTGAAGAGAGTAAGGACGAGCCTGCTGAGAAGTTGTCCCGTGTATTTGTCAGAGGTCCCCGGCCTCAGAGTAATGATGACTTCTACATTGATCGCAAACTCGATCGCGGTAATCTTCGGGTCTCCACCCTCTACTACCCTGGCAGACCGCATTTGGGCTGTCCTAAGCGCTCCGCCGGTCACACGTGTTCGCGTCACGTCTCACCGACCTCACACGTCGCCAGGTACGAGTGTAAGGTCCGCCGATTCTCCGAGTCCAGGGGCGAGGCTCGCAGCCGGAGGTACTTCACCCGCCGCGTCCCAGACTCCGACCCGGATCTGACAGACCTGCAAGAGAGAGCCGCCGCCTACCGCGACCTGCTGCAACGAAACCCCACCGACGTTGCCCTCTGGGAGACCTTCATCGACTTCCAGGAGCGGTGCGGCGGACAGGACGCGGCGCTGAGGGCGGTGGAGGAGGCGGTCGGCCGCGCCCCGAACAGCGCCCGCCTCCAGGGGCGGCTGCTGGAGGCTCTGCGCGCCGCTCTCGACCAGCACCAGCTGCTGCAGAGGCTGCGGACCATGCTGGCGGAGGAGCGCTCCGGGGCTGCTCGCGTCGCGCTGTGGGAGGCGCTACTCGACGCCCTGGGGGCGGAGCGCGGCACCGATGCCGCCAACCTCACGACCGCCGCCGCCGCCGCGCTCAGAGACACGCCGCGGGAACACGCGCCGCGCATATTACACGCACTCGGGTGCTACCTTCGAGCCGCTGGTCTGTGGGAGCGTCTCGTGCTCCTGGTCGAGCTGACGGTCGCCATGAACTACGCTCCCGCCGCGGTCTCCGCCCCCGACCCGGCCGTCCTCGCCGAGGCGGAGCGCCGCTCGCTGGAAATGGAGGATCAGGCGATCTCCAGCGGCCTGCCGCTTAGTGCCGTGTGGGTGCGCGTGGAGCGAGCGCGAGCGGCGTGTCACTGGCGGCCCGCGCTCCCGTCCTCCTCGGCGGACCGCTCCCCGCCCCCGGCCGACCCCCAGCGGATCCCGTTGCCGCACGACGTTGCTGACCTGCTGCTGCCGATGTCCGCGGACGACCACCTGTTCCACCTGTCCGTGCGTCTCCTTCTCCTGGTCAAGGTTCCCATGTTGCCCGCCACGGACCTCTGGACTCGCCGAGCGGGAAGGCTCGGTGCAGGCGGCGGCGGCGAGTCTCTCCTGCCGCTGGTGTGGGCGTGTCGGACGCTGCCCCCGGCCCACCCCGCTCGCCCTGCCCCGGAGCTCGCTCGTCGCCTGCTCGCGCTGCTAGTGGACCCTCCTCACTATTTTTCGGACGACACGGGTTATCTCACTTGGGTCAACTCACTGTGGGAGGTGTGTTGTTCGCGGGCGGGAGGGCGCTCGCGGACTGCCCTGGTATGTTGGAGGCTCCGCTGGCTCCAGACGCTGTCTCTCCTCTCGACCGAGGACGAGGCGGAAACGAGACGACTGCGGGCGGAGGGGCGGGCTCTGTTGCGGCGCTTCGAGACCGCCTCTCCTCTACCGTACGCCGAGTGTGCCAGGCTGGACTGGCTGGCGGCGGGAGGGGTCCGGGGCAAGGGGGCGGAGCGCGCACTGCAGGCGGCCGGCCGGGCCCTGAGAGCTGCGCTGGCAGACGACTCTTGTCCTCCTCAACATGCGCTCTTCGTGGCCAGGGTGGTGGACGAGATCGCGGGCGGGACCAGCGACGCCGGGGTCGCCGCCCTCGTGACGGCCGTCACCGGGCGCGACACGCGCGGCGGGGCCTCGGAGGACGAGCGGAGTCACGCGCTGCAACTATGCGAGGAACGCTGCGAGGACATCGAGCGGGGGCTGCTGGCGGCCGGCGAGGAGGAGGGCGAGGGCTCCGGGCCCGACACCTGGGTGGACCTGCTGCTGCCGGGACACGGCGAGTGGGCCCGGGCCCGGACCGCGCTGGCTGCACCCGCGAGGCGGGCCCAGCTGGTGGAGCGGGTGCGCAGCGCGGCGCCCGCGGCCCGTGGATCCCCCGCCGCCTGCTACTGGGAGGACGCGGCGGAGTCCCTGGGCCGCACGGCGCGAGTCGCGGCTCGCCTCACACCGCTGTTCCCGCACAACGCCGCGCTCGCGGTCGTGTCGGCGGGCGCTCCGCTGTGGTTGTCTCCGGCGGTGGCTCGCGGCAGAGGCCCCCGCGCCGGTGCGGCCGCCTTCGCTTCCTCGCTCCCCGCGTGGCTTGCGGCTCTGCGCACGGACTTCGCCCCGGCCGTTCCTCGCCGTCCTCGCAGTGGGACCGTTCCGTTCCGTGGAGATGTCTCTGATGGATCTTCTTCTGTTCCAGAGGCGGAGGCGCTAGTCCGCGTTTGTCGTCGCCTGTGCTCCGCGTCGGGAGCTGCCACGGACGAGGCGGCGCTGGCCTGGAGCGCCCGCATCGAGGCGGAGGCCCGCGCCCCGAGACCGCGGCTCCCTCACGCCCTGTTCGCCGCCCTGGAGCGCGCGCCGCAGTATAAGTGGCTGTACGTGCGAGGCGGGTCGTGGTGCGGGCGCGAGGCGGCCGTGTTGTCGGACGCCCTCCTGGAGCGCTCGCTGCGAGTCCACGCCCTGCTGGCCGAGTTGGAGCCGGTCCTCACCACACTCCCACGAGACGGTGAGGACGAGCGCCTGGTCCGGGACTAA

Protein sequence:

>DPOGS215583-PA
MALFPAYSSDAVENTTIKERVYISENPSQFIESELLASDSEESKDEPAEKLSRVFVRGPRPQSNDDFYIDRKLDRGNLRVSTLYYPGRPHLGCPKRSAGHTCSRHVSPTSHVARYECKVRRFSESRGEARSRRYFTRRVPDSDPDLTDLQERAAAYRDLLQRNPTDVALWETFIDFQERCGGQDAALRAVEEAVGRAPNSARLQGRLLEALRAALDQHQLLQRLRTMLAEERSGAARVALWEALLDALGAERGTDAANLTTAAAAALRDTPREHAPRILHALGCYLRAAGLWERLVLLVELTVAMNYAPAAVSAPDPAVLAEAERRSLEMEDQAISSGLPLSAVWVRVERARAACHWRPALPSSSADRSPPPADPQRIPLPHDVADLLLPMSADDHLFHLSVRLLLLVKVPMLPATDLWTRRAGRLGAGGGGESLLPLVWACRTLPPAHPARPAPELARRLLALLVDPPHYFSDDTGYLTWVNSLWEVCCSRAGGRSRTALVCWRLRWLQTLSLLSTEDEAETRRLRAEGRALLRRFETASPLPYAECARLDWLAAGGVRGKGAERALQAAGRALRAALADDSCPPQHALFVARVVDEIAGGTSDAGVAALVTAVTGRDTRGGASEDERSHALQLCEERCEDIERGLLAAGEEEGEGSGPDTWVDLLLPGHGEWARARTALAAPARRAQLVERVRSAAPAARGSPAACYWEDAAESLGRTARVAARLTPLFPHNAALAVVSAGAPLWLSPAVARGRGPRAGAAAFASSLPAWLAALRTDFAPAVPRRPRSGTVPFRGDVSDGSSSVPEAEALVRVCRRLCSASGAATDEAALAWSARIEAEARAPRPRLPHALFAALERAPQYKWLYVRGGSWCGREAAVLSDALLERSLRVHALLAELEPVLTTLPRDGEDERLVRD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: