MonarchBase - Protein-coding gene

DPOGS204381
Transcript	DPOGS204381-TA	3036 bp
Protein	DPOGS204381-PA	1011 aa
Genomic position	DPSCF300002 - 1738917-1744276
RNAseq coverage	103x (Rank: top 60%)

Annotation
*Heliconius*	HMEL013074	2e-55	57.23%
*Bombyx*	BGIBMGA007678-TA	2e-23	34.20%
*Drosophila*	obst-E-PB	4e-27	37.91%
EBI UniRef50	UniRef50_F4WJU2	1e-33	43.20%	Chondroitin proteoglycan-2 n=8 Tax=Endopterygota RepID=F4WJU2_ACREC
NCBI RefSeq	NP_001161915.1	9e-34	40.21%	cuticular protein analogous to peritrophins 3-E [Tribolium castaneum]
NCBI nr blastp	gi\|332025417	4e-33	43.20%	Chondroitin proteoglycan-2 [Acromyrmex echinatior]
NCBI nr blastx	gi\|332025417	3e-36	43.45%	Chondroitin proteoglycan-2 [Acromyrmex echinatior]

Group
Gene Ontology	GO:0008061	5.1e-17	chitin binding
	GO:0006030	5.1e-17	chitin metabolic process
	GO:0005576	5.1e-17	extracellular region
KEGG pathway	tca:662504	2e-08
	K01873 (VARS, valS)	maps->	Aminoacyl-tRNA biosynthesis
			Valine, leucine and isoleucine biosynthesis
InterPro domain	[920-994] IPR002557	5.1e-17	Chitin binding domain
Orthology group	MCL23316		Specific divergent

Nucleotide sequence:

>DPOGS204381-TA
ATGTATCTTAATCTTTGTTTAGCCGCTATCCTGATTGTCGTAGCATTTGCCGAAAGTGATTCCAATATTTGCAGTAATGTTATCGATTCTTACATTGGAGACCCACAAAGCTGCGACACCTACATCAGATGCCAAGCTCATCATCCAATTCATGCATCTTGTCCAGATGGATTAAATTTCAACCCTAAGGTGAAATATCCGAATTTTCCATGTAGTTATCCAGAGGACGTACCGTGCAATGGCCGAGCTTATTCAAATCCGCCTAAGCCAACAGCGGAATGTCCCAGACAGAATGGTTACTTTCCGGCGCCCGCTGCATCTAAACAGGACTGTGGACGTTATAGAGTATGTAAAGCTGGGAAAGCGATCTTCATGTCTTGTCCAACAGGACTCGCATTCAATCCAGCCACCGCCAAATGCGATTGGCCTGACCAAGTACCATCCTGCATCGCTAATGATTTCTTTGGTTTCTCCTGTCCACCCGGTACTGTAGATATTAGTGGCAACCCCATTATCACCAACCATAAACATCAAGATGACTGCTACAATTTCTTCTCCTGTGAGAACGGCCAAGCTCGTCTCCTGTCTTGCGATATCGGTTATGCCTTCGACGAGCGCTCCGGACTAAATGCTCAGGGCGGTGGAAGATTTAGTTTTCCCAGTCGATTTGATTTTCGAAGGCCCATAGTAAGACCATGGGCGAGACCTAGTGTATCTGCTGCACCAGATACTCCAAAGCCCACAGAAAGAAGTTCACCTACTGAAAAGAGTATAACCACTGAAAAACCTATAGAACCTATTCCAACAACGAAAGCTGTTTCAAGTACAATTTCTCCAATTGTCATACCCAAAACTGCTAGGCCATCCTTGACAAGAATGCCACCACGTGGACGTTTTGGGCCACAGCCTGTATTTGGGCCCAAACCTGGCTCCGTAGTGACGAATTCTCCAATCGATACATCGACAGGGGCCTTGGAAATAGTTACCCCGATGAAAATGTTTCCAGAATATTATCCAGTCCTATCAACAACGGAATCGAATATACTATCAACGAGATCACCGTTTGTTCCTAATCGTATAACAAGTAACAGTCACCAAAATTTTGATCCCAGATCTCAAAATTCTCTATTCATGTCTCATAATGCAAACGAAGATGATAAAACTGCTGAATATCAAACCGAAAAAGCATACAGTGTAGTCTCGAAAACAACATCAGAATTACCCTTATCTACTCAACAACCTTTAAAGGCCATGGAAAATTCTGTAAATAATAATCCAAATGTTTTGTCACCCTTAATAGCAACAGTATCCGAGACGGAAAAAATAGCTACAACTTCAAAAGCATCATTACTAGAAGAAACTACAAAATATGAACACCCTTCAAGTTTAAATCCAGACTGGTATACTAAATCCTACGTATCTAAACCTACAACAACAGTTCCATCGACTCCCAAAATAATTATTGTACCAGCAATTACAGTAACGTCAAATGCTCCACTTGATGAGGAGCACAACAATGAATTTTCAAATTTCAACATAAGAGATCGAGTGCCACCTTACACATCCCACGCCTTAAATGTACGGATACCTGAGAATCGACGAGATTTCCCTTCTAGTTCAAAATTTCCGTCAAAGGAAATTATAATAACAGCAGCAACTACAGAAAAACCACCATCTACAACAGATATAAAAGAATACCAAGGGAAAGAACCTTCTACAAACGAACCGTTAGTTAAAGTAGAAGAATCTCCATTTAAGATAGTATCAACAACTGAAGGCTCCCCGGCGAAGACTAATGTTTATAAATTATCAACTAACGGTATTAACAGCTACAAAGATAATTACTATGAGCAAACAACATTTGTACCTAAAATTATCTCCACATCAACAAAAGAACCAAAAGAATATGCTATACCTATAAGTACATCAGGCCCACTTATTGGCGTGCAAAAAATGGATGCTGACAGAGGCTTCACTCCAAAGAATCCTGAAATATGGGTAATGGAAAATTACGATAAAACTAAAACCCCAACGGACTCTTATAAATCCGACACACCCATTTACCCTATATATTCAAATAATAATGAAGCAAATTACGACGAACTACAACGATCTATAACAAATGCACCAACTATTATAAATAATCCCACAACAATACCTAAAAAATATACTATACCGACAACATCTAAACCATGGATTATTGATGATAACAAGAAATACGTTTTGACCACAGAAACTCCAATTGAATATACCAGTCAGTATGAAATAACAACAGAACCAACGTATAAATTAGATACGTATTCCACTCGTTCTGTTTATCTAAACAATAATGAAGAGAATTACTTTAAAGAAAATGAGAAACCAGAGGTCACTAATAAGACCAATTTAACGCAATCATATAGGGCCTGGTATCATAAAACCGATACGCCACCAACTAAACCACCAAAGGCGACTATAATACAGCTCTCGAATAACAACCGGTACAGTAAAACGACGACTGCACCTAAGCCATCAGTTCGTTATACCACGCCCCAACCAAGGAATTCCTACGTAGAAAAAGTGTATGACATAGGTAACTTTAAATGTAAGGACGATGGATTCTATGCAATAACAAATCAATGTGACGACTTCATCGAATGCAAGTCTGGAGTCCCTATTCAAAACTCTTGCCCTGATGGACTTCATTTCAATCCGGCAGCTAAACACTCGGAATTTCCATGTTCCTACCCTTCAGAGGTTAAGTGCGAGAACCAAGCTGCCAGTCATAAGGCTCAACCAACTTCCGAATGTCCGCGTCGCTATGGCTACTTTTCTCTGCCGAGTGGTGGCTGTGACAAGTACATTATGTGTCAAGAAGGCCTGGCCACAGTGATGTCTTGTCCGCCAGGACTCGCCTTTAACATAGGCACAAGTAGTTGTGATTGGCCTTCAAATGTTCCCGACTGTGTGCCTGATGTTTTTGAAGGATTTATCTGCCCAGCGCCAGAGCTTGATGAAGACAGTAATCCTGTCCGCAGCATTTACAAATACAGGTAA

Protein sequence:

>DPOGS204381-PA
MYLNLCLAAILIVVAFAESDSNICSNVIDSYIGDPQSCDTYIRCQAHHPIHASCPDGLNFNPKVKYPNFPCSYPEDVPCNGRAYSNPPKPTAECPRQNGYFPAPAASKQDCGRYRVCKAGKAIFMSCPTGLAFNPATAKCDWPDQVPSCIANDFFGFSCPPGTVDISGNPIITNHKHQDDCYNFFSCENGQARLLSCDIGYAFDERSGLNAQGGGRFSFPSRFDFRRPIVRPWARPSVSAAPDTPKPTERSSPTEKSITTEKPIEPIPTTKAVSSTISPIVIPKTARPSLTRMPPRGRFGPQPVFGPKPGSVVTNSPIDTSTGALEIVTPMKMFPEYYPVLSTTESNILSTRSPFVPNRITSNSHQNFDPRSQNSLFMSHNANEDDKTAEYQTEKAYSVVSKTTSELPLSTQQPLKAMENSVNNNPNVLSPLIATVSETEKIATTSKASLLEETTKYEHPSSLNPDWYTKSYVSKPTTTVPSTPKIIIVPAITVTSNAPLDEEHNNEFSNFNIRDRVPPYTSHALNVRIPENRRDFPSSSKFPSKEIIITAATTEKPPSTTDIKEYQGKEPSTNEPLVKVEESPFKIVSTTEGSPAKTNVYKLSTNGINSYKDNYYEQTTFVPKIISTSTKEPKEYAIPISTSGPLIGVQKMDADRGFTPKNPEIWVMENYDKTKTPTDSYKSDTPIYPIYSNNNEANYDELQRSITNAPTIINNPTTIPKKYTIPTTSKPWIIDDNKKYVLTTETPIEYTSQYEITTEPTYKLDTYSTRSVYLNNNEENYFKENEKPEVTNKTNLTQSYRAWYHKTDTPPTKPPKATIIQLSNNNRYSKTTTAPKPSVRYTTPQPRNSYVEKVYDIGNFKCKDDGFYAITNQCDDFIECKSGVPIQNSCPDGLHFNPAAKHSEFPCSYPSEVKCENQAASHKAQPTSECPRRYGYFSLPSGGCDKYIMCQEGLATVMSCPPGLAFNIGTSSCDWPSNVPDCVPDVFEGFICPAPELDEDSNPVRSIYKYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: