MonarchBase - Protein-coding gene

DPOGS204062
Transcript	DPOGS204062-TA	1497 bp
Protein	DPOGS204062-PA	498 aa
Genomic position	DPSCF300200 - 86091-90644
RNAseq coverage	512x (Rank: top 24%)

Annotation
*Heliconius*	HMEL012399	3e-145	50.83%
*Bombyx*	BGIBMGA010735-TA	5e-173	59.50%
*Drosophila*	CG9701-PA	2e-125	44.68%
EBI UniRef50	UniRef50_G9F9H2	0.0	61.84%	Seminal fluid protein CSSFP020 n=1 Tax=Chilo suppressalis RepID=G9F9H2_9NEOP
NCBI RefSeq	XP_001850321.1	1e-137	47.53%	glycoside hydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|364023591	0.0	61.84%	seminal fluid protein CSSFP020 [Chilo suppressalis]
NCBI nr blastx	gi\|364023591	0.0	61.96%	seminal fluid protein CSSFP020 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	1.1e-213	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	1.1e-213	carbohydrate metabolic process
	GO:0043169	4.6e-168	cation binding
	GO:0003824	4.6e-168	catalytic activity
KEGG pathway	tca:664577	1e-118
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[13-483] IPR001360	1.1e-213	Glycoside hydrolase, family 1
	[14-474] IPR013781	4.6e-168	Glycoside hydrolase, subgroup, catalytic core
	[13-487] IPR017853	2.2e-156	Glycoside hydrolase, superfamily
Orthology group	MCL30775		Lepidoptera specific

Nucleotide sequence:

>DPOGS204062-TA
ATGTTTCAAGTTGAAGGCTGGTCGGATCTCAAGGTTCGAAGATTCCCCGATGGCTTTTTGTTTGGCGCGGGGACGTCGGCTTATCAGGTCGAAGGGGCGTGGAATGAAGATGGAAAAGGTGAAAGCATCTGGGACAAATACCTCCACGATAACCCAGACATTATATCCGATGGCAGAAATGGTGATGTAGCATCCAACTCCTACCACCAGTACAAGAGAGATGTGGAAATGTTGAGGGAATTGGGTGTGGACTACTACAGGTTCTCAATATCCTGGAGCAGAGTATTGCCTAGAGGATTCTCGAATGAAATAAATGAAAAAGGTCTCGAATACTACGACAAATTGATAGATGAATTATTGAAATACAACATAAAGCCAATGATAACTTTATACCACTTTGATTTGCCACAAACTCTCCAAGACTTTGGAGGTTGGGCCAATCCGCTGTCAACAGAATGGTTTGAAGATTATGCGGCTGTGATCTTTAAGGCATTCGCTCACAAGGTTCCTTATTGGATAACCGTCAATCAGCCAAATTCCATATGCGTGGAAGGTTATGGTCAAGGTTTGATGGCACCAGCGATCAGCTCGAGTGGAATCGGTGATTACATGTGTATAAAGAATGTGCTGGTGGCACATGCGAGGGCATACAGGTTATATGAGAGGGAATATAAAAAGAAATTTAAGGGATCAGTTGGCATAGCGCTTGCATTAAACTGGGCAGACCCCGTCAATAACAGCACAAAAAATGTCGAAGCTACGGACGTTTACAGAGAATTTATGATCGGTCTCTACATGCATCCCATATGGTCGAAAGATGGTGGGTTCCCTAAAATGGTCAAAGAAAGAGTCCATCAGAACAGCATAAAGCAAGGATTCAAGAAATCTAGACTGCCTGCCCTTAGCAAGGAAGAAGTTACTCTTTTGAAAGGGTCCTCAGACTTCGTGGGAGTGAATCATTATACAACTGTCCTAGTGAAGAGCACGGACAGGGGGATGTCAGCGCCATCTTTCGATGACGACGTTCACGTGGAGCTCACCTACAGGCCGGAGTGGAAGAACGCCACATCTAGCTGGCTGAAGAGCGTGCCCTACGGTATATACAGGGTGTGCGTATATCTCAATACAAAGTACGACTACCCTCAAATGTTTGTGACGGAGCACGGCTGGTCCACGAGGCCAGGGTTGAAGGATGACACGAGGGTTGAGAACCTGAGGCTGTACCTGAAGGCTATACTGTTTGCTATAGAAGATGGCACGGACTTGAAAGGTTACACCACATGGAGCCTAATGGATAATGTGGAGTGGGTCGCTGGAACCAGTGAAAGATTCGGTCTTTATGAAGTAGACTTCGAATCAGAGGATAAAAATAGAACAGCGAGATTGTCAGCTCTGGTGTATAAACGAATCATAGACAAGAGGATCGTTGAAGACGATTATAAACCGAACAATTTAAAAATGTCGATAACTAACAGAAATGTTAAGACGGAACTTTGA

Protein sequence:

>DPOGS204062-PA
MFQVEGWSDLKVRRFPDGFLFGAGTSAYQVEGAWNEDGKGESIWDKYLHDNPDIISDGRNGDVASNSYHQYKRDVEMLRELGVDYYRFSISWSRVLPRGFSNEINEKGLEYYDKLIDELLKYNIKPMITLYHFDLPQTLQDFGGWANPLSTEWFEDYAAVIFKAFAHKVPYWITVNQPNSICVEGYGQGLMAPAISSSGIGDYMCIKNVLVAHARAYRLYEREYKKKFKGSVGIALALNWADPVNNSTKNVEATDVYREFMIGLYMHPIWSKDGGFPKMVKERVHQNSIKQGFKKSRLPALSKEEVTLLKGSSDFVGVNHYTTVLVKSTDRGMSAPSFDDDVHVELTYRPEWKNATSSWLKSVPYGIYRVCVYLNTKYDYPQMFVTEHGWSTRPGLKDDTRVENLRLYLKAILFAIEDGTDLKGYTTWSLMDNVEWVAGTSERFGLYEVDFESEDKNRTARLSALVYKRIIDKRIVEDDYKPNNLKMSITNRNVKTEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: