MonarchBase - Protein-coding gene

DPOGS209415
Transcript	DPOGS209415-TA	3270 bp
Protein	DPOGS209415-PA	1089 aa
Genomic position	DPSCF300346 + 279043-283417
RNAseq coverage	641x (Rank: top 20%)

Annotation
*Heliconius*	HMEL021396	2e-56	77.86%
*Bombyx*	BGIBMGA012602-TA	1e-39	65.00%
*Drosophila*	Cpr65Eb-PA	7e-20	55.45%
EBI UniRef50	UniRef50_C0H6K3	3e-37	65.00%	Putative cuticle protein n=1 Tax=Bombyx mori RepID=C0H6K3_BOMMO
NCBI RefSeq	NP_001166736.1	5e-38	65.00%	cuticular protein RR-1 motif 12 [Bombyx mori]
NCBI nr blastp	gi\|290560808	9e-37	65.00%	cuticular protein RR-1 motif 12 precursor [Bombyx mori]
NCBI nr blastx	gi\|290560808	2e-50	34.94%	cuticular protein RR-1 motif 12 precursor [Bombyx mori]

Group
Gene Ontology	GO:0042302	2.1e-11	structural constituent of cuticle
KEGG pathway
InterPro domain	[102-151] IPR000618	2.1e-11	Insect cuticle protein
Orthology group

Nucleotide sequence:

>DPOGS209415-TA
ATGGAATCCAGGATTCTAGTTCTATCAATAATAGCTTATGGCTATGCGGATAAATTAGATAAGGGATACCTGCCTCCTGTCAATGCAGCATCATCAGGTGGCAGCCCAGCAGAATTAATTGCTCCAGCTGATCAATCTGAGGTTTTCGGGCAAGGGTTGCCCGTTCCAGAAAGTCAACCAGGCTCTTATATCCAAGATATTGGACAGGAAGTTCTTCAAGCTTACAACCAGGAACGCCCTCAAGCAGCAGCTGATAGAAATGCGGAGATACTAAAGTTTAATAACGAAAATAACGGTGAATCCTATGCATATAATTATGAAACATCTAACGGGATTTCTGTGGAGGAATCAGGTGTTGCATCTAATGGAGTTAATGCTCAAGGTGGCTATGCCTATACTGGGGATGACGGTAAATCCTATTCAGTCACTTATACGGCAGATATAAATGGCTATCAACCTCAGGGTGAACATTTACCTACACCTCACCCTATCCCAGAAGAAATATTAAAGTCCATAGAAGAAAATGCTAGGGCTGCTGCTGCCGGTACACAAGAAGGAGCTTACAATCCTGAGGAGTATGATTCCAACGTTTATTATCAAACAAAGCCAGATCAAGAATCTGATGGTTCTTTAGATGTAATCGAAAGAAACAAAAATCAAGAAATAAGCTCCATATATAACAATCCCCTCGATTCTGTGGGTCAACAATATCAAAAAGCATCTAGTTTAGATGTAAATCCATCAGACCAAAAACGGAATAAGGAAAGTGGACAAGATATTAACCAGATGTACACTCCAAATCCTTATCAATCCCACCAGACCTCTGGTATTGGTATTCAAGGAAACAGTGGTTTTGAATCTAGTAGTCAGTCACCTATTCAAGGAATAGCAGGACAATTTTTACAAGGAGACGGTTATCAATATAATCAACCTAAATTTTCATTGCAGCCAGTTTTTCCAGGACAAGATCAATACAAACCGCAAGTAACTAGCGACAATGAAAATATATCATCATCGTTAAGACCAAGTTCATCAGGTCCCGCATTTAATAGAGATCAAAATTTGAAACCTTCATTTGGAAGCCTTCCCTCAGCTGAACAAACTCCGCAATATCAATCTGGCCAACAAATTCTTCCAGAATTTAGGCCCTCCTCTCATAGCGGACCAAATGCATCTCAAAGTATGAGGGGATCTGTCCCAAACCAAGACCAACAAATCCAAATCAAGGAATCATCTGGCGATTTGAACGAAAGCAAAGGAAATGGTTATCATTACAATCAACCAAAGCCCGTGTTCCAACCCGCTAATTCCGAACAAAGCTCGTTAAACCAATATCGTCCAGAATTATCTGGCCAAAGTGAAAAGATATCATCTTCTTCAAGGCCAGGCTTATCAGGATCCATATATAATGGAGATCAGAATTTGAAACCTTCATTTGGAAGCCTTCCCCCAGCTGATCAATCTTCGCAGTATCAATCTGGCCAACAAATTCTTCCAGAATTTAGGCCCTCCTCACATAGCGGACCAAATGCATCTCAAAATATGAAGGGATCTCTCCCAAATCAAGACCAACAAATCCAAATTAAAGAATCCTCTGGCGATTTGAACGAAAGCAAAGGAAATGGTTATCATTACAATCAACCAAAGCCCGTGTTCCAACCCGCTAATTCCGAACAAAGCTCGTTAAACCAATATCGTCCAGAATTATCTGGCCAAAGTGAAAAGATATCATCTTCTTCAAGGCCAGGCTTATCAGGATCCATATATAATGGAGATCAGAATTTGAAACCTTCATTTGGAAGCCTTCCCCCAGCTGATCAATCTTCGCAGTATCAATCTGGCCAACAAATTCTTCCAGAATTTAGGCCCTCCTCTCATAGCGGACCAAATGCATCTCAAAATATGAGGGGATCTCTCCCAAACCAAGACCAACAAATTCAAATCAAGGAATCATCTGGCGATTTGAACGAAAGCAAAGGAAATGGTTATCATTACAATCAACCAAAGCCCGCTTTCCAACCCGCTAATTCCGAACAAAGCTCGTTAAACCAATATCGTCCAGAATTATCTGGCCAAAGTGAAAAGATATCATCTTCTTCAAGGCCAGGCTTATCAGGATCCATATATAATGGAGATCAGAATTTGAAACCTTCATTTGGAAGCCTTCCCCCAGCTGATCAATCTTCGCAGTATCAATCTGGCCAACAAATTCTTCCAGAATTTAGGCCCTCCTCACATAGCGGACCAAATGCATCTCAAAATATGAAGGGATCTCTCCCAAATCAAGACCAACAAATCCAAATTAAAGAATCCTCTGGCGATTTAAACGAAAGCAAAGGAAATGGTTATCATTACAATCAACCAAAGCCCGCGTTCCAACCCGCTAATTCCGGACAAAGCTCCTTTAACCAGTATCGTCCGGAATTATCTGGCCAAAGCGAAAAGATATCATCTTCAGCAAGACCAAGTATGTCAATTCCCATATTTAATAGAGATCAGAATTTGAAACCCTCATTTGGAAGTCGTCCCTCAGCTGATCAATCTCAAAAGTATCAATTCGGCAAACAAATTCCTTCAGTTTTTAAGCCTTCTTCTTATAGAACATCAAACGTTTCTCAAAATAAAGAAAGTCCTTTCCTCAATCGAGACCAACGAGTCCAAATTAAACGACCATCAAGTGGTTTAATACAAAACAAAGTAAACGGTTATCAATATAATCGACCAAAACCTGCCTTTCAGCCAACTATTTCGGGACAAAATAGACCTCGAGTTTCTAACGAAGGAAATAAGAAGCCACTATTAAGTCAAAACACTTTCACTTCAGTAGTTAGTGGAAATAACGGAAACATTAATCCTTCACCACAAAACGGACCAAATGGTTCTCAAAATAAAGGATCTTACCCTATTAAAGTTCTAAAGAACCCAGGCAGTCAGGCAGCTGGCTCTTCACAAGGCAACGGTTCACCTCGCTTCAGTATTTTGAATAAAAATAAACCTTATTCTGCTTTGCAAAAACCCGGACAAGGTTTCCAATCGTCTCCTAGTGAAGGACTTGGAAACAATAAATTTGGAAAAGGACCTATTTCTGCTTTAAAACAAGTCGAAGCGCCTTACCACTACAAAAGACCAAGTGTAAGTTTTACCACACAACGTCCAAACTCTTTTTCGCAAACAACACAGATAAGCAGAGGCAATCAGGATAAAAGTGAACAGTTTGCGGGGTCTCGTCCACCGCCGAGTTTCAGCGAGGAAGAAGGTTACAAATATTAG

Protein sequence:

>DPOGS209415-PA
MESRILVLSIIAYGYADKLDKGYLPPVNAASSGGSPAELIAPADQSEVFGQGLPVPESQPGSYIQDIGQEVLQAYNQERPQAAADRNAEILKFNNENNGESYAYNYETSNGISVEESGVASNGVNAQGGYAYTGDDGKSYSVTYTADINGYQPQGEHLPTPHPIPEEILKSIEENARAAAAGTQEGAYNPEEYDSNVYYQTKPDQESDGSLDVIERNKNQEISSIYNNPLDSVGQQYQKASSLDVNPSDQKRNKESGQDINQMYTPNPYQSHQTSGIGIQGNSGFESSSQSPIQGIAGQFLQGDGYQYNQPKFSLQPVFPGQDQYKPQVTSDNENISSSLRPSSSGPAFNRDQNLKPSFGSLPSAEQTPQYQSGQQILPEFRPSSHSGPNASQSMRGSVPNQDQQIQIKESSGDLNESKGNGYHYNQPKPVFQPANSEQSSLNQYRPELSGQSEKISSSSRPGLSGSIYNGDQNLKPSFGSLPPADQSSQYQSGQQILPEFRPSSHSGPNASQNMKGSLPNQDQQIQIKESSGDLNESKGNGYHYNQPKPVFQPANSEQSSLNQYRPELSGQSEKISSSSRPGLSGSIYNGDQNLKPSFGSLPPADQSSQYQSGQQILPEFRPSSHSGPNASQNMRGSLPNQDQQIQIKESSGDLNESKGNGYHYNQPKPAFQPANSEQSSLNQYRPELSGQSEKISSSSRPGLSGSIYNGDQNLKPSFGSLPPADQSSQYQSGQQILPEFRPSSHSGPNASQNMKGSLPNQDQQIQIKESSGDLNESKGNGYHYNQPKPAFQPANSGQSSFNQYRPELSGQSEKISSSARPSMSIPIFNRDQNLKPSFGSRPSADQSQKYQFGKQIPSVFKPSSYRTSNVSQNKESPFLNRDQRVQIKRPSSGLIQNKVNGYQYNRPKPAFQPTISGQNRPRVSNEGNKKPLLSQNTFTSVVSGNNGNINPSPQNGPNGSQNKGSYPIKVLKNPGSQAAGSSQGNGSPRFSILNKNKPYSALQKPGQGFQSSPSEGLGNNKFGKGPISALKQVEAPYHYKRPSVSFTTQRPNSFSQTTQISRGNQDKSEQFAGSRPPPSFSEEEGYKY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: