MonarchBase - Protein-coding gene

DPOGS201335
Transcript	DPOGS201335-TA	1272 bp
Protein	DPOGS201335-PA	423 aa
Genomic position	DPSCF300176 + 643238-648124
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL012399	2e-158	65.05%
*Bombyx*	BGIBMGA010536-TA	3e-137	59.41%
*Drosophila*	CG9701-PA	5e-104	47.45%
EBI UniRef50	UniRef50_G6DAN3	3e-163	81.23%	Glycoside hydrolase n=10 Tax=Obtectomera RepID=G6DAN3_DANPL
NCBI RefSeq	XP_001237813.1	1e-113	54.96%	AGAP006424-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|364023585	9e-139	60.75%	seminal fluid protein CSSFP001 [Chilo suppressalis]
NCBI nr blastx	gi\|364023613	2e-139	60.92%	seminal fluid protein CSSFP031 [Chilo suppressalis]

Group
Gene Ontology	GO:0004553	2.3e-170	hydrolase activity, hydrolyzing O-glycosyl compounds
	GO:0005975	2.3e-170	carbohydrate metabolic process
	GO:0043169	2e-118	cation binding
	GO:0003824	2e-118	catalytic activity
KEGG pathway	tca:664577	7e-95
	K05350 (bglB)	maps->	Starch and sucrose metabolism
			Phenylpropanoid biosynthesis
			Cyanoamino acid metabolism
InterPro domain	[17-379] IPR001360	2.3e-170	Glycoside hydrolase, family 1
	[30-377] IPR013781	2e-118	Glycoside hydrolase, subgroup, catalytic core
	[29-417] IPR017853	4.8e-115	Glycoside hydrolase, superfamily
Orthology group	MCL10040		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201335-TA
ATGATCGGCCTTTTGGGTTACACTTACCTGGCTACAATTTTGGTCGTAGTGGTCAATAGCAAAAACACGTCTAAACATGAAGCAAGGAAACTACCCGACGACTTACTTTTCGGAGCATCTACGGCGTCGTACCAAATAGAAGGGGCTTGGAACCTAGACGGTAAATCTGAAAGTACTTGGGATCGGTTATCACACCATCAACCTTGTGTTATTCACAACTGTGACACGGGCGATATCGCCGCTGATTCCTATCATCAATACAAGCGAGACGTGGAAATGATACGGGAACTAGGCCTCGACTTTTACAGGTTCTCTCTCTCCTGGACGAGAATATTACCAACGAGCTTTCCAGATCAAATCAATGAAAAAGGAGTGCAATATTACAATAATTTGATAAATGAGATGCTCAAATACAACATACAACCCATGGTGACCATTTATCACTTTGATTTACCTCAAAAGTTGCAAGATCTGGGAGGATGGAACAATCCCCATATAGTTGATTGGTTTACCGATTATTCAAGAGTAGTTTTTGAGTTGTTTGGAGACAGAGTTAAGTATTGGATATCTTTTAATGAACCTCGAGAGATATGTGCTCATTCAACCCTAGAACCAGCACTAAGTTCATCTTATAGTGTTTCTGGATATGCTAATTACATGTGTGCCAAAAATCTGCTAGTAGCACATGCTAACGTCTACCATTTGTACAACAATGAATTTCGTAAAGTCCAAGGTGGTCAAGTCGGTATAACAATAAGTTCCGCGTGGTATGAACCTGAATCAGAAAAGGATATAGAAGCTGCTGAAGATATCATACAATTCGAGATGGGAATTTATGCAAATCCGATATTTTCGGAATCTGGAGATTATCCGTCAATCGTGAAAGAAAGGATAGCAGCAAAAAGTAAGGAACAAGGATTTCCAAGATCACGATTACCACAATTCACTCCAGAGGAAGTTGATTTAATTAAAGGAAGCTACGACTTCTTTGGGTTGAATCATTATACTACTTATATGGTTTATAGAAATGAATCAGTATATGGACATTATAGTTCTCCATCTTTTGATGATGATATCGAAGTGATAAGTTATCAAGACGATTCCTGGGATTCAGGTGCTTCATTGTGGATGAAGGTGGACTACGAGAGTCCTGAACGCACCCGCACTCCTCGCAAGTCTGCTTACGTGTACAAAGAGTTGCTGCGCACACGAACACTGGACTATCATTATGAACCTGACATGAGCTTGGGAATGCATGTCGATGATAATTAA

Protein sequence:

>DPOGS201335-PA
MIGLLGYTYLATILVVVVNSKNTSKHEARKLPDDLLFGASTASYQIEGAWNLDGKSESTWDRLSHHQPCVIHNCDTGDIAADSYHQYKRDVEMIRELGLDFYRFSLSWTRILPTSFPDQINEKGVQYYNNLINEMLKYNIQPMVTIYHFDLPQKLQDLGGWNNPHIVDWFTDYSRVVFELFGDRVKYWISFNEPREICAHSTLEPALSSSYSVSGYANYMCAKNLLVAHANVYHLYNNEFRKVQGGQVGITISSAWYEPESEKDIEAAEDIIQFEMGIYANPIFSESGDYPSIVKERIAAKSKEQGFPRSRLPQFTPEEVDLIKGSYDFFGLNHYTTYMVYRNESVYGHYSSPSFDDDIEVISYQDDSWDSGASLWMKVDYESPERTRTPRKSAYVYKELLRTRTLDYHYEPDMSLGMHVDDN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: