MonarchBase - Protein-coding gene

DPOGS204347
Transcript	DPOGS204347-TA	2973 bp
Protein	DPOGS204347-PA	990 aa
Genomic position	DPSCF300142 + 266668-269737
RNAseq coverage	267x (Rank: top 40%)

Annotation
*Heliconius*	HMEL007010	0.0	39.63%
*Bombyx*	BGIBMGA007250-TA	9e-147	37.66%
*Drosophila*	Mur89F-PA	2e-30	34.76%
EBI UniRef50	UniRef50_B4N9S3	1e-51	40.25%	GK11459 n=2 Tax=Eukaryota RepID=B4N9S3_DROWI
NCBI RefSeq	XP_002069652.1	3e-52	40.25%	GK11459 [Drosophila willistoni]
NCBI nr blastp	gi\|195443954	5e-51	40.25%	GK11459 [Drosophila willistoni]
NCBI nr blastx	gi\|195443954	2e-102	27.57%	GK11459 [Drosophila willistoni]

Group
Gene Ontology	GO:0008061	7.4e-13	chitin binding
	GO:0006030	7.4e-13	chitin metabolic process
	GO:0005576	7.4e-13	extracellular region
KEGG pathway
InterPro domain	[360-419] IPR002557	7.4e-13	Chitin binding domain
Orthology group	MCL16483		Insect specific

Nucleotide sequence:

>DPOGS204347-TA
ATGTGCCACAACGAAGGATTCCAGGCCGATCCAATGGATTGTTCTGTTTTTTACCGATGTGTTCAATCATCTCGTGGAAAATTTAACGTTTTTAGGTTCCAATGCGGTCCAGGCACCGTGTATGATCCCGAGACAGAAATTTGTAATCATGCTTCTAATACAAAGAGATCTGAATGTGGTGCTGCAATTTCTTCAAACAATCTCGAAATTAACGAAAATGGTCTTGACATGCAAGAACTGCCATCACCTATTACGACATCACCGTTAAATATTCAAATGAATGGTTCAGTGACCTCAATATCAATTTCAGAGAAAGATCTACATATATTGAATAGTACAACAGCCAGTTTAACAACCACTGCAGCAGTCAATCAACAATTCTCAGAAGCATTTGATATTTCAGGGATGTACCCATGGGATAATAAAAACAGCGATTTCACTCCAAATCCAATATTATCAAAACCAGCACTGATAGAAAAAAATAATCCGTGCACTTTTGATGGATTTGTAGGTGATAGTTATGATTGTAAGAAATTCTACAGGTGTGTCAACAATTTTCGAGGAGGTTTTACACGTTATGAATTTGTATGTAGTGATTCAACGATATGGGACGATGATAAACAAAGTTGTAATTACGCATGGGCTGTTCGAAGTAGAAGGTGTGGTCGCGATGCTACTCGTAATAACGTCTTAAATGCCATGACTACCCATTACGAAAACGAGAATAATCTCGTGGATAAAGATCCGAATTTAAATCATTTCGGTGAAAAAATTCAAAATAGCTATATATCTAACGATAGTCCTACAAGTATAAATCAAAATAAAGATCATACACGTATCACAAGTAGTAGTTTCAGTATGGTGACAATACCTTATGACAACGCAAATATTGTGACCGATAAGAATGAAGACCCTGCTCATTTCATTGACAAACAAAACAATAGCTCTTTATCTGGAACAAGTGACAGTCAAAATCAGGAAATTAAAATAGAATTCACTATGTCTTCAAATCCATCTTCATCAACAGAACACACATTGTTAAGCAGCAGTGTAAATGACTCCTGGAAATTATTGAATAATGTATGTACACAAAGTGGTTTTATTGGTGATCCGAATGATTGTAAAAAATTTTATCGATGTGTTGATAACGGTCAAGGCAGTTATACGAAATACGAATTTTCATGTAGTCAAGGGACTCTTTGGGATAGTGAGATAGAAGCTTGTAATCATGCATGGGCTGTGAAAGGCTGTGGCAATACAGCTTTCACTCAAAGCTTAACGACAGAAACTAGCGTCTCAAATGTAGTTAGTTCAGAGATAAACCCTTTGCCTGACGGAATTAATAATGTTGATGATGACTTCGGTTATCCAAATCTAGTGGATCAGGATCATATGAAAACAACTACTTCAAAAATTGAAACAACGTTTTCTTTGCCAGCAACAAACGAAGAAGCAAACATTTTGGATAAATCATGTTCAACAAGTGGTTATTTTGTAAATTCGCTAGATTGTTCGAAATTTTACAGGTGTGTTGAGAACGGAAAAGGGTCTTTTACTAGATTTGACTATAACTGCGGTGAAGGGACTGTCTGGGATGAAAGTATTGAGGCTTGTAACCATGCCTGGGCTGTAAAATCTTGTAGATCAAATTCAGAAAACTTTATTGATTCTGAACAAATGACAACCATTACTCTCGTTCAAACTTCAACACAAAAAAATAAAGATAACAATGATTACGATTCTATCTACGGTTCACAACAAAGTACAATGGGATCAAACATAGTCACAGAGCTTTCGACAACAACATTGAAACAAACACTGCTTTCTCAAAATGAATGTACCACAAATGGGTTTATAGGAGACAGTAGGGATTGTAAAAAGTTTTATAGATGCGTAGAAAATGGTGATGGTGGGTATACGAAATATGAATTTTCTTGTGGCGATGAGACTGTTTGGGATCCTGTTATCGAAGCTTGTAATCATAATTCAGGAGATAAAGATTGTACAAGATCGTCTAACAATAATTATAATACTGTAGAACCAATTAATAGTAATGAAGATGTAGGAAATCATTATGTTACATCAAGTAGTCAGGATCCAGAAAATCCAGCCCAAAGCCAAAGTACAACAAGCGTTGTTCCAAGTAACAATAATCTGTGTGAAACTGCTGGATTTATGGGAGATTCAAATGATTGTGAAAAATTTTATAGATGTGTTGAAAATGGTAAAGGAGGATATAATAGGATTGAATTTAAATGTGCTGAAGGGACAGTTTGGGATTCCAGTATTGAAGCGTGTAATCACAGATGGGCGGTAGAAAACTGCGGAAAAGATTCTGCTAATGAATTTATAGAAACTACTATTGATTCAATGAGTACTGTTACTGACAAAACGTCAATTTCTACAAAATCTCCTGAATATTCAGAAACTTTAGCTCAATATACATCTACAGAAAGGACTAATGTGTCCGAGGATTCATGTTCCTCAGAAGGATTTTTCGGATCAGTAAACGGGGAATGCAATAAATTTTACCGATGTGTTGATAACGGAAGAGGTGGTTATTATAAATATGAATTTACATGTGGTGATGGGACAGTTTGGGATGAAAATATTAAAGCTTGTAATCATGATACATATAATAAAACTTGTAGAATTTCTGACAGTAAACCTCAAACTGATACGACCATTTCAACTGACGGACCTAAATCGACAACACACGCTTCAATCACAAATGTTCAGGAACCTTCAAAACCAGATGATAAAGAATGTAAATCTGAAGGCTTTATTCCTAATCCTTTAGATTGTCACAAATTCTTCCGTTGTGTTGATAATGGTGAGGGTGGTTATACTAAATTTGAATTTTCATGCGGAGAAGGAACAGTTTGGATTCAAGAAATTCAAGCTTGTGATCACGATACAGGGGAAAATAGCTGTAACCAGCAGAACAACAACAACAACGTTATAACAAGATAG

Protein sequence:

>DPOGS204347-PA
MCHNEGFQADPMDCSVFYRCVQSSRGKFNVFRFQCGPGTVYDPETEICNHASNTKRSECGAAISSNNLEINENGLDMQELPSPITTSPLNIQMNGSVTSISISEKDLHILNSTTASLTTTAAVNQQFSEAFDISGMYPWDNKNSDFTPNPILSKPALIEKNNPCTFDGFVGDSYDCKKFYRCVNNFRGGFTRYEFVCSDSTIWDDDKQSCNYAWAVRSRRCGRDATRNNVLNAMTTHYENENNLVDKDPNLNHFGEKIQNSYISNDSPTSINQNKDHTRITSSSFSMVTIPYDNANIVTDKNEDPAHFIDKQNNSSLSGTSDSQNQEIKIEFTMSSNPSSSTEHTLLSSSVNDSWKLLNNVCTQSGFIGDPNDCKKFYRCVDNGQGSYTKYEFSCSQGTLWDSEIEACNHAWAVKGCGNTAFTQSLTTETSVSNVVSSEINPLPDGINNVDDDFGYPNLVDQDHMKTTTSKIETTFSLPATNEEANILDKSCSTSGYFVNSLDCSKFYRCVENGKGSFTRFDYNCGEGTVWDESIEACNHAWAVKSCRSNSENFIDSEQMTTITLVQTSTQKNKDNNDYDSIYGSQQSTMGSNIVTELSTTTLKQTLLSQNECTTNGFIGDSRDCKKFYRCVENGDGGYTKYEFSCGDETVWDPVIEACNHNSGDKDCTRSSNNNYNTVEPINSNEDVGNHYVTSSSQDPENPAQSQSTTSVVPSNNNLCETAGFMGDSNDCEKFYRCVENGKGGYNRIEFKCAEGTVWDSSIEACNHRWAVENCGKDSANEFIETTIDSMSTVTDKTSISTKSPEYSETLAQYTSTERTNVSEDSCSSEGFFGSVNGECNKFYRCVDNGRGGYYKYEFTCGDGTVWDENIKACNHDTYNKTCRISDSKPQTDTTISTDGPKSTTHASITNVQEPSKPDDKECKSEGFIPNPLDCHKFFRCVDNGEGGYTKFEFSCGEGTVWIQEIQACDHDTGENSCNQQNNNNNVITR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: