MonarchBase - Protein-coding gene

DPOGS210840
Transcript	DPOGS210840-TA	1395 bp
Protein	DPOGS210840-PA	464 aa
Genomic position	DPSCF300027 + 88615-93878
RNAseq coverage	245x (Rank: top 42%)

Annotation
*Heliconius*	HMEL021305	2e-55	48.87%
*Bombyx*	BGIBMGA003916-TA	9e-140	53.00%
*Drosophila*	CG7985-PA	4e-72	34.06%
EBI UniRef50	UniRef50_E0VEV0	1e-89	37.26%	Putative uncharacterized protein n=1 Tax=Pediculus humanus corporis RepID=E0VEV0_PEDHC
NCBI RefSeq	XP_001607502.1	5e-112	41.47%	PREDICTED: similar to hexosaminidase (glycosyl hydrolase family 20, catalytic domain) containing [Nasonia vitripennis]
NCBI nr blastp	gi\|156549076	1e-110	41.47%	PREDICTED: hexosaminidase D-like [Nasonia vitripennis]
NCBI nr blastx	gi\|383865625	9e-112	42.00%	PREDICTED: hexosaminidase D-like [Megachile rotundata]

Group
Gene Ontology	GO:0043169	1.8e-29	cation binding
	GO:0005975	1.8e-29	carbohydrate metabolic process
	GO:0003824	1.8e-29	catalytic activity
	GO:0004553	9.7e-16	hydrolase activity, hydrolyzing O-glycosyl compounds
KEGG pathway	tca:661188	2e-105
	K04678 (SMURF)	maps->	Ubiquitin mediated proteolysis
			Endocytosis
			TGF-beta signaling pathway
InterPro domain	[1-322] IPR017853	3e-43	Glycoside hydrolase, superfamily
	[2-341] IPR013781	1.8e-29	Glycoside hydrolase, subgroup, catalytic core
	[48-225] IPR015883	9.7e-16	Glycoside hydrolase, family 20, catalytic core
Orthology group	MCL17769		Insect specific

Nucleotide sequence:

>DPOGS210840-TA
ATGCAGAACAGGATTGTGCATTTCGATTTAAAAGGTGCTCCCCCTAAACTGTGCTATTTAGAAAAGATCTTCAAGATAATAAAGAAATGGGGCGCTACTGGTGTTTTATTAGAGTGGGAGGACACATTCCCATATAGCGGAGAGCTGGTAGATATTGGCAGTGTCCTTGGTTGCGGTGGTGACGGCATGTATTCTATGGATGAAGTGCGACAAATACTACAGTTAGCTAGGAACTGTGGACTTGAAGTCATTCAACTAATTCAAACTATTGGACACATGGAGTTTGTTCTGAAGCACCCTTTGTTCCAAGATCTCAGGGAATTGCCATATTCTCCGGCTGTTTTGTGTCCATCACAGCACCGTTCTCAATTACTAGTGAGAGAGATGTTGAGGCAGGTTTTGGAGGTACAGCCGGATGCTAGATATATACACATTGGGGCAGATGAGGTTTGGCACAGAGGGGAATGTGAACTTTGTAAATATAAAGCATCAACGAACGAACACAAATTACACTCAATTTATTTAGAACACATACGAGATTTAGCCTTATTTATAAAGCAGTTGAGACCGGATTTGATTGTTCTCATGTGGGATGACATGCTGCGGTCTATAAGTGTAGATGTATTGAAAAATTACAGCCTGGGTGAGTTAGTTCAGCCAGTGGTGTGGAACTACAGTCCGCTGCATTTGTTCCATGTTGAAGTGCAATTATGGACATGTTACAGTCAGGTGTTCCCAAGTGTTTGGGCTGCTTCAGCTTACAAAGGAGCCAGCGGAAGTTGTGAGATCTGGCCGGTGGTATCCCGTTACGCCAGCAACCAACAAGCCTGGTTGAAGACAGTCAAAGAGTATTCCTCGGCTGTTAACTTTGTTGGAGTCGTCCTTACTGGTTGGTCGAGGTTCGATCATTACGCCACTCTATGTGAACTGTTGCCGCCATCTTTGCCAAGTTTGTCTATCTGTCTGAAGATGTGGATGACTATGGACGAATGTTTTGACAACTCGGAGTCGTTGCCGCTGGAGGAGTGGCCGGGAGTAGAACTCGCACTCAGCATACGAAACTTCGCTTCGTTGAGGGAACGCGCGCATAACGTCATGTACAGAGAGCTCGTTCCCACGTGGCTGAACCCCTGGCAGCTGCAGCACGCGTACACCAGCCCCATACAACTACGTGGCATCGTGGCTACTATGACGCAAATAATAGCGGATATAAAGGCGATACATAGCGAACTTCTAACGCAATTTCCTTTATATACGGGGGAGAGGAGTGCTCAGGAGTGGCTCGGCTCTCTGGTGACGCCTTTGTTGAGGAAGGTTACGGAGGTACACGACGTAGCTGCTATAAGGACGGACATGCAGGCCGGGGTCACACCGGGGATGACAGCCACTCGTTAA

Protein sequence:

>DPOGS210840-PA
MQNRIVHFDLKGAPPKLCYLEKIFKIIKKWGATGVLLEWEDTFPYSGELVDIGSVLGCGGDGMYSMDEVRQILQLARNCGLEVIQLIQTIGHMEFVLKHPLFQDLRELPYSPAVLCPSQHRSQLLVREMLRQVLEVQPDARYIHIGADEVWHRGECELCKYKASTNEHKLHSIYLEHIRDLALFIKQLRPDLIVLMWDDMLRSISVDVLKNYSLGELVQPVVWNYSPLHLFHVEVQLWTCYSQVFPSVWAASAYKGASGSCEIWPVVSRYASNQQAWLKTVKEYSSAVNFVGVVLTGWSRFDHYATLCELLPPSLPSLSICLKMWMTMDECFDNSESLPLEEWPGVELALSIRNFASLRERAHNVMYRELVPTWLNPWQLQHAYTSPIQLRGIVATMTQIIADIKAIHSELLTQFPLYTGERSAQEWLGSLVTPLLRKVTEVHDVAAIRTDMQAGVTPGMTATR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: