MonarchBase - Protein-coding gene

DPOGS215551
Transcript	DPOGS215551-TA	1509 bp
Protein	DPOGS215551-PA	502 aa
Genomic position	DPSCF300129 + 332266-334504
RNAseq coverage	24x (Rank: top 78%)

Annotation
*Heliconius*	HMEL011617	5e-123	46.91%
*Bombyx*	BGIBMGA002293-TA	4e-105	43.25%
*Drosophila*	CG7985-PA	4e-70	33.20%
EBI UniRef50	UniRef50_UPI0002060CB1	5e-75	40.00%	UPI0002060CB1 related cluster n=1 Tax=unknown RepID=UPI0002060CB1
NCBI RefSeq	XP_001649003.1	4e-77	34.13%	hypothetical protein AaeL_AAEL004383 [Aedes aegypti]
NCBI nr blastp	gi\|157105734	8e-76	34.13%	hypothetical protein AaeL_AAEL004383 [Aedes aegypti]
NCBI nr blastx	gi\|157105734	7e-74	33.99%	hypothetical protein AaeL_AAEL004383 [Aedes aegypti]

Group
Gene Ontology	GO:0043169	1e-21	cation binding
	GO:0005975	1e-21	carbohydrate metabolic process
	GO:0003824	1e-21	catalytic activity
	GO:0004553	1.4e-10	hydrolase activity, hydrolyzing O-glycosyl compounds
KEGG pathway	tca:661188	6e-59
	K04678 (SMURF)	maps->	Ubiquitin mediated proteolysis
			Endocytosis
			TGF-beta signaling pathway
InterPro domain	[16-330] IPR017853	9.7e-33	Glycoside hydrolase, superfamily
	[21-240] IPR013781	1e-21	Glycoside hydrolase, subgroup, catalytic core
	[73-234] IPR015883	1.4e-10	Glycoside hydrolase, family 20, catalytic core
Orthology group	MCL12442		Single-copy universal gene

Nucleotide sequence:

>DPOGS215551-TA
ATGGAAGTTGCAGTAACAGAAAGTAATAAACATCCTACGCTTAAACTGAAAAATGTGATTTTACATTTAGATTTTAAAGGTTCTCCGCCTAAATTAAGTTATTTAAAGACTCTGCTTCCTAAACTACAGAGCTTGGGTGTCACCGGACTGCTAATGGAATACGAAGACATGTTTCCTTATGAAGGAAAATTGGTTAATTTAAGTGCTGAAAATCATTATGAAATTATTAAGCTTCAGGAGTTCGTCACTATTGTTGTCCGGCTTGGCCTGGATCTCATACCCCTCGTACAAACATTTGGTCACTTGGAACATGCTCTAAAGCTTCGGGAATTTCAACATTTAAGGGAAAACCCACTATATCCCGATTCAATTTGCCCGAGCCAATCAGAGAGTTATGATCTCATAAAGGCTATGCTCGATCAGATCATCAACTTCCATGAAAACATATTTCCACTTAAATATTTGCATATTGGTTCCGACGAAGTCTATCATATTAAGGAATGCAAAAAATGTTTGAGAAGTAAACTTACGGACATGGACATTTACCTAAGTCATGTTGAAGCAATATCACATTATATAAAAATTAGAAGTCCTTTGACGACAGTACTGCTCTGGGATGATATGTTGAGGAAAATTCCTATGAAAAAGTGGAGATATGTAACATTAGGAAAAACTAATATAGAACCAGTGTACTGGGACTATAAACCCTCGATCAAAGTTTCCCACACGAGTTTGATACAATACCACAAAAAGTTTAAGAACATATGGATTGCTTCAGCATTCAAAGGAGCTGATGGTAGAGTTGCAACATTTCCAGACTTAAGGAAAAGATTATTGAATAATTTTAGTTGGTTAAATCTGATATTTGACTACAAATTTGGAGGCGAAAGTGAAATTTACGAATTTAGCGGAATTATACTTACTGGATGGTCCCGATATTCTCATATGGATCCGCCGTGCGAATTATTACCAGTTGCTACACCAAGCCTTTATTTGAATTTATTAATGATAAAAACTTTTAAATACTCAGACTCTAAACCAAAGGATATCTCAATAGCCCTCAATTATATTAACAAAGACTTTTCAACCAATTTACATTGCCAATATGAAATTAATATAGATAACTTTAATTCAATTCATTGTCACTTCGAAGGAAACGAACTATTTAAGCTCTTAATGGATTGTGAGAAGATTATCAATGATATAACAAAAACAATCGCAGATGTTGAAACAGATTTATCAACACTGGAATTGTACTCAAAAAATTATTACAACAATATAAATATGTGGACAAAAAATTTTAAGTGGTGCATAGATTCGATTAACAGTCTTAATGATATCAGAGAAAAGTTGATTGGTAATTTATCGCATTACTATGGTTCATCTTTTGTTACAGAATATGTTGATTATAAGTTATTTAACACAGAGAACATTATAAAAAATATTATGAAGATTTTAAACAATATGTTTAAAGTGAAGAATTGGAAGAGAAGACTAGAACTAGACTAG

Protein sequence:

>DPOGS215551-PA
MEVAVTESNKHPTLKLKNVILHLDFKGSPPKLSYLKTLLPKLQSLGVTGLLMEYEDMFPYEGKLVNLSAENHYEIIKLQEFVTIVVRLGLDLIPLVQTFGHLEHALKLREFQHLRENPLYPDSICPSQSESYDLIKAMLDQIINFHENIFPLKYLHIGSDEVYHIKECKKCLRSKLTDMDIYLSHVEAISHYIKIRSPLTTVLLWDDMLRKIPMKKWRYVTLGKTNIEPVYWDYKPSIKVSHTSLIQYHKKFKNIWIASAFKGADGRVATFPDLRKRLLNNFSWLNLIFDYKFGGESEIYEFSGIILTGWSRYSHMDPPCELLPVATPSLYLNLLMIKTFKYSDSKPKDISIALNYINKDFSTNLHCQYEINIDNFNSIHCHFEGNELFKLLMDCEKIINDITKTIADVETDLSTLELYSKNYYNNINMWTKNFKWCIDSINSLNDIREKLIGNLSHYYGSSFVTEYVDYKLFNTENIIKNIMKILNNMFKVKNWKRRLELD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: