MonarchBase - Protein-coding gene

DPOGS214545
Transcript	DPOGS214545-TA	3156 bp
Protein	DPOGS214545-PA	1051 aa
Genomic position	DPSCF300266 - 248074-255843
RNAseq coverage	177x (Rank: top 50%)

Annotation
*Heliconius*	HMEL016123	0.0	66.17%
*Bombyx*	BGIBMGA003273-TA	9e-92	79.37%
*Drosophila*	CG13676-PA	2e-52	48.31%
EBI UniRef50	UniRef50_B2DBM9	0.0	57.56%	Similar to CG13676-PA n=2 Tax=Papilionoidea RepID=B2DBM9_9NEOP
NCBI RefSeq	XP_002426626.1	2e-63	59.18%	hypothetical protein Phum_PHUM263920 [Pediculus humanus corporis]
NCBI nr blastp	gi\|183979254	0.0	57.56%	similar to CG13676-PA [Papilio xuthus]
NCBI nr blastx	gi\|183979254	0.0	60.33%	similar to CG13676-PA [Papilio xuthus]

Group
Gene Ontology	GO:0008061	6.1e-10	chitin binding
	GO:0006030	6.1e-10	chitin metabolic process
	GO:0005576	6.1e-10	extracellular region
KEGG pathway
InterPro domain	[110-171] IPR002557	6.1e-10	Chitin binding domain
Orthology group	MCL17559		Insect specific

Nucleotide sequence:

>DPOGS214545-TA
ATGAAGCGCTCTCGTCATAGATGGCTGGGGTTCGTGCTATTTTGCGTAACTTTGGCAGCGCTCACGGACTTGCCGACAACGACAGCGGTCCGTGCGACGTCACTCATCTTCTCAAAGACGACGACATCAACCAGCACTGCTGGCCCAGAAGAAGAACCCTCTGCACCTGATGATGAAGCACAGGTTGAACCGAGTGCGGAAGGGGAAGAAGGGAACGCTACTAGTAAATATACGGGAATTCCTCAAATAGATTACATACTTGATCCAAATCTACCACGCGAGCTGAATGGGTACAATTTATCCCAGTATCCCTTCTACGAAGCTGTGCCTCCTCCAGAAACCATGGATTTCAAATGCGATGGACTCCACGATGGTTTCTACGCCTCTATACCCCATAAGTGTCAGGTCTACCACCACTGCCTCTTCGGCACCAGATACGACTTCCTCTGCGCGAACTACACAGCCTTCGATCAAAAAACTTTCATCTGTCACTTCGTATCTGAAGTGGATTGTAAAAATTCAGCAAAATATTTTAGCAGGAACGAAGCTCTATACAAGGCGGCGTCCACTGACCCTCCGTCTACAACATCTACAACAACCACCACAACAACAACCACGCCGCGACCACCACGGCCAGGAAGACGCCGACCACATCCCAGATACGATTACTACGATGACGATTATTACTACCCAGCTAGAGATGACTATGATTACGAAGAGAGAGGTGGTAGACGGAATAGACCTCGTAGACCAGGCAAGCGCAGGCCTCAAGTTGACTACGATGACAGATACGAGACGAGATCGAGACCAAGGGATGATGTTGATGAGGATTACGAAGACAGAAGACCATATGAAAGACCGAGAGCTGCTAAAAGACCGGATTACAGAAGACCATACGACGATGAAGACAGAAGACCATATAAAGGTGGTAGAAGGCCAGGAAAACCAAGGGTTGATGAAGAGTCATATGGTCTCGAAGATGAAGAAAATGACAGGCCGAGAGATAGTAAAAGAGGTGAATTTAGACCCAGGGATAAGTTTCGACCTAGAGACGAAGAAAGATCTAGGGACGAAATCCGTCCACGAGATGAAGATGTTATTCGACCGCGAGATGAAAATAAATACAAAGATGAAGACAGTAATAGAGATGAATTGAGAACTCGAGATGATGTAGACTCTAGAGATGAAATAAGACCCAGAGATGAGATAAGGCCTCGAGATGAAATACGTCCAAGAGATGAAATAAGGCCTCGAGATGAAATACGACCAAGAGATGAAATAAGGCCTCGTGATGAAATACGACCAAGAGATGAAATAAGGCCTCGAGATGAAATACGCCCAAGAGATGAGATAAGGCCTCGTGATGAAATACGACCAAGAGATGAGATAAGGCCTCGTGATGAAATACGGCCCAGGGATAAGAAAAGACCCAGACCACTCAGAGACGAGGTCCCTGCTATAGAAAGTAACCCGAGAGAAAGGGTAAGGGATGACAGGTACCAATCAACTGAAGGTAGAAGATTATACGATAGACCATACAGGCCTAGGGAAGATCGTCCCCGGAATAAGCCTGACCAAGACGATGATGAAGATAGACCAGTAGAAGTCCGACAGAGTCCTTCAACTGCTGATTCTCAACCGTTAGTGAAACCCAACGGACGTGGTATTTTCAGTAAACCTAGAATGCCGCCCAAAATTAAAAGACCCGTTCCGATTAATGAAAAGGAAAAGTATGAATATGTTACAATAACAACTACAAAGGCTCCACCAAAACTGGCTGATGATGAATATTATGATGAATATGATGAAGAGGATAGCCGGCGGCCATTACCCTCTGCAAAAACAAGCACTATTCAACAAAAACCAAAACCTGAGCCAATTGAAAGAGAAAAATTTAAACCAACCAGATCTGCAGGTATAGAGAAATTTAAAAAACCAAAGGTTCCAATTGATTATGATGATGATGAATATTATTATGAGTCCTCAGCGCGACCTCTGAAGTATTCCAATATCCAGCGCGCTAAAGACGAACGCCCATCGAAAGCTAAAGACCCCGACTATTTCTATGATGACAAAGAGAAAGTAACAGAAAATGAAAAATTTAAGGAAAAAGAAGAGGAAATAACTTCCAAGATAAGAGATATTAAACCTAATGTAAAAGTTTTCAGGAGGCCTTTTTTACCGTCTAGGGGTGGAAGTCCTTATCTCCCAAGAGGGCTACAACCAGTAGCTGGTAAAGATATGAGACTACCGCACAACACCACCCCGAAACCTACTTCTACCTCTTCTACTACAACTACAACTACTACAACAACCACTACTACTACTACAACAACGCCTCCACCAACAACAACAACTACTACAGAACCACCAACAACAACCACAGAACGAATAACAACAACAGTCGCAACACAAAAACCCACATCAACCGCTGTGCCTGAAGAAGAATATGAATATTATGACGAAGAAGACATAGAATATGAAACAAAACACAAAAAAGAACCAACGACAACTATTCAGTCAGAAGTTGAAGAAATTAAAGCAATTCCTACCACCACGACTACACCAGCACCCACCACGTTAAAAACAACAACTCAAAGATACATAGAGTCACATAATGATAGAGCAAAAAATTTAGCAACGAAAGTATTGAGGAATTTTAATGAAAATTACGAAGCCATTAAAGAAAAGCTAGAATCAACTCTGTCACCAGGAGATTATCTGAAACCGTACATCCCTTATAGAGATATCAATGTCAACAAGCCAGCTCCGAGGCCTGAAATATCAAATGGTTACACAGCCACAGGAAAACCATTGAAAATACCAGACATCAAACAGAATCTGGCTGATTCAATTGAAAACGAATACGACATTAGGTTAAACGAGGCGATCTCGCCCGTAAGAACTCCTAGCGGCTTCATCGTACCAAACGACAGAGATTATTCCTTCTCGAGGTACAGAAACAATATTCAGTCTGAGCCTCAGTACTCCGCCTCAGAAATAGGGGCTTACCAAGTTAGGAAACGACCTCAAATCTCTGGTGTCACGATCCGAACTCCCGCTTCGTATTTTTTACCGCAAAGGGTCATTTACGACGACGGTTCAGTGAGACAGACTCGCCAACTAATATATAGACAAATAGGAGATGTATATTAA

Protein sequence:

>DPOGS214545-PA
MKRSRHRWLGFVLFCVTLAALTDLPTTTAVRATSLIFSKTTTSTSTAGPEEEPSAPDDEAQVEPSAEGEEGNATSKYTGIPQIDYILDPNLPRELNGYNLSQYPFYEAVPPPETMDFKCDGLHDGFYASIPHKCQVYHHCLFGTRYDFLCANYTAFDQKTFICHFVSEVDCKNSAKYFSRNEALYKAASTDPPSTTSTTTTTTTTTPRPPRPGRRRPHPRYDYYDDDYYYPARDDYDYEERGGRRNRPRRPGKRRPQVDYDDRYETRSRPRDDVDEDYEDRRPYERPRAAKRPDYRRPYDDEDRRPYKGGRRPGKPRVDEESYGLEDEENDRPRDSKRGEFRPRDKFRPRDEERSRDEIRPRDEDVIRPRDENKYKDEDSNRDELRTRDDVDSRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDEIRPRDKKRPRPLRDEVPAIESNPRERVRDDRYQSTEGRRLYDRPYRPREDRPRNKPDQDDDEDRPVEVRQSPSTADSQPLVKPNGRGIFSKPRMPPKIKRPVPINEKEKYEYVTITTTKAPPKLADDEYYDEYDEEDSRRPLPSAKTSTIQQKPKPEPIEREKFKPTRSAGIEKFKKPKVPIDYDDDEYYYESSARPLKYSNIQRAKDERPSKAKDPDYFYDDKEKVTENEKFKEKEEEITSKIRDIKPNVKVFRRPFLPSRGGSPYLPRGLQPVAGKDMRLPHNTTPKPTSTSSTTTTTTTTTTTTTTTTPPPTTTTTTEPPTTTTERITTTVATQKPTSTAVPEEEYEYYDEEDIEYETKHKKEPTTTIQSEVEEIKAIPTTTTTPAPTTLKTTTQRYIESHNDRAKNLATKVLRNFNENYEAIKEKLESTLSPGDYLKPYIPYRDINVNKPAPRPEISNGYTATGKPLKIPDIKQNLADSIENEYDIRLNEAISPVRTPSGFIVPNDRDYSFSRYRNNIQSEPQYSASEIGAYQVRKRPQISGVTIRTPASYFLPQRVIYDDGSVRQTRQLIYRQIGDVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: