MonarchBase - Protein-coding gene

DPOGS206423
Transcript	DPOGS206423-TA	1914 bp
Protein	DPOGS206423-PA	637 aa
Genomic position	DPSCF300181 + 128759-136540
RNAseq coverage	184x (Rank: top 49%)

Annotation
*Heliconius*	HMEL018081	4e-54	37.82%
*Bombyx*	BGIBMGA013822-TA	5e-135	56.20%
*Drosophila*			%
EBI UniRef50	UniRef50_A0JCZ2	3e-76	45.00%	Hyaluronidase, putative n=4 Tax=Glyptapanteles RepID=A0JCZ2_9HYME
NCBI RefSeq	XP_972926.1	1e-78	45.56%	PREDICTED: similar to hyaluronidase [Tribolium castaneum]
NCBI nr blastp	gi\|91084537	2e-77	45.56%	PREDICTED: similar to hyaluronidase [Tribolium castaneum]
NCBI nr blastx	gi\|91084537	1e-80	45.85%	PREDICTED: similar to hyaluronidase [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	1.7e-88	metabolic process
	GO:0003824	1.7e-88	catalytic activity
	GO:0006952	5.1e-80	defense response
	GO:0005975	5.1e-80	carbohydrate metabolic process
	GO:0004415	5.1e-80	hyalurononglucosaminidase activity
KEGG pathway	tca:661685	3e-78
	K01197 (hya)	maps->	Glycosaminoglycan degradation
InterPro domain	[42-340] IPR017853	1.7e-92	Glycoside hydrolase, superfamily
	[40-339] IPR013785	1.7e-88	Aldolase-type TIM barrel
	[1-465] IPR018155	5.1e-80	Hyaluronidase
	[1-465] IPR001329	5.1e-80	Glycoside hydrolase, family 56, allergen Api/Dol m 2
Orthology group	MCL10654		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206423-TA
ATGTATTATATATTACTTATGTTTGTATGTTGTGCTGTGAAATCTGAAGTTGTAAGTAACTATTATGTAGTTGAAATGCCGGAGTCGGATACGCCACAGCAGAATGTTAAAGATATCAAAAAAGACTTTAGGGTCTACTGGAACGTTCCGACGATGCAGTGCACTTCCAAAAAAATACTATTCGAGAACTTGTACGAAAAATTCGGGATAATACAGAATGATGGAGACAGATTTAATGGAGAAAAAATCACTATTCTATATGAACCAGGAGATTTTCCGGCGATTTTTAAAAATGAATCCAGTGGAAAATACAGATTGAGAAACGGAGGTGTACCTCAGGAGGGCAGCTTGGAAGAACATATAGATGCTTTTAGAATTGATTTAAATCAAACCATACCCGATCCGAAATTTGACGGAATCGGTATAATTGACTTCGAGTCGTGGAGACCGGTTTTTCGACAAAATTTCGGAGTACTCGTTCCTTACAAGGATGTTTCAATCGAGATTGAAAAGCAATTGCACTGGTGGTGGCCAAAGACATGGATACAGGCACAGGCTACCCAAAGATTCGAGGCAGCAGCCAGAAGGTTTATGCAGACGACTCTATCGATAGCAAAGCAAATGCGACCCAAAGCCTTATGGGGCTACTACGGATTTCCACACTGTTTCAACATGGCCAGCAATAATATGAAGGAAACATGCGCGAAGAATGTTCCAGAAGAAAACGATAGCTCCGTCTCACTCTCCTCTACTCAGCTCTCTTCGCTTATTAATGGGAGAGTGAAAGAGAGCGTCAGAGTGAGATTCAAAAACACTCCAGTGTTGCCGTATTTCTGGTTTAGATACCGCGATGCTGGTTTTATGAAACAGGAAGACCTTTCCGTAGCTCTCAGCACACTGTACCAGTCGAAAGCATCTGGTTTAATAATATGGGGCAGCTCAAATGACGTGAATACTGTTGACAAATGTAAGAAACTTTACAACTACGTGGAGACCATCCTTGGACCGAAAATAGCGAAATATACAAAACAGAATGTGTTTAAAGATGAAATTAATAACGAACTTAATAATACATTAACAACCGTGGAACTTTCTACTACAGAAGTTCCTGAAAATACAACTATTTCTATGAAAATAGGACAAATAGATCCTGAATATGATTGGATTCCACCCAAAAACTACACTGAGGACATATCGCAGCAAGTCGATGAAGAACTAACCAAAAAAGGCTTCAACAGAACTGAAAATAACGAAGTGGACGTTTTAAGTTCAGGGGCTGGTATAGATTTTTTATATGATGCTCTGCTAAATGTTGAAAGCAATGGAGAAAACGAAGATATTGAGCAAACGACTAGAAGTGCTGATAGTGATGAAAGTTCGCAAAGCACCGCTGTTACTAACAATGGCTTAAAAGACGACATGTTTGATGTATCCGAAGATTACACTCAAGAGACATCAACGATATTAGTAGAAATCACAACTGACGATCAAAAAAATATTCCCTACAACCATTCTACAACAAATGTTATTGAATATACAGAGAATTATACAAACGGAGAAATAACCAATGAATATGAAACAACACAGCTTAACACGGATAAAGAATCTGAAAATTTTCAATCAACAGAGGATAGTTTCTACGATCTTAGTAACTTTTTCAGTTCCAGTGAAGAGACATCCGATTACTTGATCAAAGTTGAAAAAATTAACGTTACCAGCGAGGAAACGTCGAGTGATTATTCTTATAAAGAGAACTCGAGTGACTACAGTGATTATTTCGTAGTTCTAAGATATTATAATGTGAATAAAACTAAATCACAAAAAAGAATGGTTTTTCAACAAATAGACAGAGAAGACATCAGTGAAGTGACCGAAAATTCAGATCAGGTTGTGACATACGTTTACGGCAAATGA

Protein sequence:

>DPOGS206423-PA
MYYILLMFVCCAVKSEVVSNYYVVEMPESDTPQQNVKDIKKDFRVYWNVPTMQCTSKKILFENLYEKFGIIQNDGDRFNGEKITILYEPGDFPAIFKNESSGKYRLRNGGVPQEGSLEEHIDAFRIDLNQTIPDPKFDGIGIIDFESWRPVFRQNFGVLVPYKDVSIEIEKQLHWWWPKTWIQAQATQRFEAAARRFMQTTLSIAKQMRPKALWGYYGFPHCFNMASNNMKETCAKNVPEENDSSVSLSSTQLSSLINGRVKESVRVRFKNTPVLPYFWFRYRDAGFMKQEDLSVALSTLYQSKASGLIIWGSSNDVNTVDKCKKLYNYVETILGPKIAKYTKQNVFKDEINNELNNTLTTVELSTTEVPENTTISMKIGQIDPEYDWIPPKNYTEDISQQVDEELTKKGFNRTENNEVDVLSSGAGIDFLYDALLNVESNGENEDIEQTTRSADSDESSQSTAVTNNGLKDDMFDVSEDYTQETSTILVEITTDDQKNIPYNHSTTNVIEYTENYTNGEITNEYETTQLNTDKESENFQSTEDSFYDLSNFFSSSEETSDYLIKVEKINVTSEETSSDYSYKENSSDYSDYFVVLRYYNVNKTKSQKRMVFQQIDREDISEVTENSDQVVTYVYGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: