MonarchBase - Protein-coding gene

DPOGS210466
Transcript	DPOGS210466-TA	1770 bp
Protein	DPOGS210466-PA	589 aa
Genomic position	DPSCF300062 + 346521-351234
RNAseq coverage	2x (Rank: top 92%)

Annotation
*Heliconius*	HMEL013414	7e-132	72.07%
*Bombyx*	BGIBMGA014318-TA	3e-102	54.81%
*Drosophila*	CG7600-PA	1e-30	33.71%
EBI UniRef50	UniRef50_D6X556	9e-67	36.97%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X556_TRICA
NCBI RefSeq	XP_972360.1	2e-67	36.97%	PREDICTED: similar to CG7600 CG7600-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91094531	3e-66	36.97%	PREDICTED: similar to CG7600 CG7600-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91094531	2e-57	34.66%	PREDICTED: similar to CG7600 CG7600-PA [Tribolium castaneum]

Group
KEGG pathway	tca:663273	7e-23
	K09556 (BAG2)	maps->	Protein processing in endoplasmic reticulum
Orthology group	MCL15422		Patchy

Nucleotide sequence:

>DPOGS210466-TA
ATGGAAGTGGACGTGTATTCACTGTCTGAAGGCTCTCGCCTACCGCTAATTGACGAAACATCGGCTTTAGGCACAACAGCACCAAAAGACAGATTGATATCCGTATTAGACCAAGTGGAGATGAGAGTGGAGCGACTCAGACGGGACACAGTGCGTATTGAAGAGGAAAAAGACTCCTTACTGTCAACCCTAGACAGCGTGAAACATTCTGAACTGCTCGGTGACATATCTGAATGTGATAAGGAAGATATAATGCGTTATGCCGACCGTATCCTGGCTCGAGCTCTCACTGTGGAGGTGGCTGTGAGGACGGACAGGGACTCACAGCAGGAAGAAGCCTTGTCCCAGTCTCCATTCCTACTTATTATTGTTAGACTGGCGATATCTACGGCGCCGTTGAGTCGCGAGGCGCGTGCGGGGGCCGCGGCGGGGTCCCTGCCTCACGTGGGTCCTGCGCCGCCCGAGGCCGGCTCCCCTTGGATGAAACTCTACCTATATCACCTGGCCGGCTATGGACCACCTACACTGCTGCTGCTTAAAGGTACAGTACTGCGCGCTGTTCCAAGATGTCTGCTAGGTTTCTCACGGTTGGCGGTGTCGTGGTGGGGGGCGGAGTCCGAGTCCTGCCGAGACGGCCGCCGCCCACGAGAAGCGGCTGCCAACTCGGCGCTCCGCCGCGGGCCCGTGTTGCTACAAGCGGCCGGCGTGCGAGCCCCGCCCGTCCTCCTCCACGTGCCATTCCCGCCATCTAACGACGAACAAGATGAGTATCAGAGTCTTTGGCGTCGTCACGGCGGTCTCCGTCGTGTGAGTCGCCGCCTGCGCCTATGTCGGTCCGCGGGGTACGTGACACTAGCGGACATCGGGGTGCCCGACCTGGGGTGTGCGCGACCCCCCGCCGCCGTCCAGCTGGTGACACCCAGGAAGAGGAAGGACGTCTGCGGCATCGCGAAGCCGATCAGCGAGATATCGATATCATCGAACGAATCCACGAAGGAGACTTCGGAGTTCACAAAGAACAGCAGACTTCAATCACCCATAGAGTCCCACTTCGCTAACACTCCGACCGCAGACAGCAAAACTGGTTCCCCCGCTAACGGCTTCACCAGCGCCGAGAGCGGGCAACTTCTCTGCGAAGAACTGGACAATCTGAACCTTGACACTCATCTGAGCAAAGAATCCATAACCAGCGACGATTTCGTCCCCATACATTCCTCTCGAAGTATTGACGATCTAACTCACAAACATTCCACTGAGGCTTCCAAGAGCAAAGAGTCCGAGAACGAAATAGTACCCGTTCACAGCACCAACGTTAAAGATAAAGACAAGTTGGACAACCAGTTGAGCGATCTGTTGAGCCCAGCTGAAGAGTCCATATCGATGTTCACTCAGTTGTCCGACAAGTTGACCGAAATAACAAACGAGGCAGACAGCGGCGTGGATACGGCGCACAATAACTCCGACGATGATACTTGTAAACCAGAGAAATGGACTATTCTGGATCTTCAATTTGGCATTCCATTGTTCGACGAGGCGCTCTGTGAGAATGTCTGTCGCAGTATCATTGATAGAATCGCCAAGCCGGAGTTACTGGAGAAAGTCAAAGAAGACAACGAGTTTATTCGTGCGGACCTGTTGAAGTTTGTCTCGCAATGTCAGTATTACCCCGGCGAGGATATGGGCATAGTGAAGAGAGGGACGTTGGTTCCGCTGCCAAGAAAGAATTTGGTATTTGAAAACGGCCAGATCAGTGAGTGGACGGGAAAATAA

Protein sequence:

>DPOGS210466-PA
MEVDVYSLSEGSRLPLIDETSALGTTAPKDRLISVLDQVEMRVERLRRDTVRIEEEKDSLLSTLDSVKHSELLGDISECDKEDIMRYADRILARALTVEVAVRTDRDSQQEEALSQSPFLLIIVRLAISTAPLSREARAGAAAGSLPHVGPAPPEAGSPWMKLYLYHLAGYGPPTLLLLKGTVLRAVPRCLLGFSRLAVSWWGAESESCRDGRRPREAAANSALRRGPVLLQAAGVRAPPVLLHVPFPPSNDEQDEYQSLWRRHGGLRRVSRRLRLCRSAGYVTLADIGVPDLGCARPPAAVQLVTPRKRKDVCGIAKPISEISISSNESTKETSEFTKNSRLQSPIESHFANTPTADSKTGSPANGFTSAESGQLLCEELDNLNLDTHLSKESITSDDFVPIHSSRSIDDLTHKHSTEASKSKESENEIVPVHSTNVKDKDKLDNQLSDLLSPAEESISMFTQLSDKLTEITNEADSGVDTAHNNSDDDTCKPEKWTILDLQFGIPLFDEALCENVCRSIIDRIAKPELLEKVKEDNEFIRADLLKFVSQCQYYPGEDMGIVKRGTLVPLPRKNLVFENGQISEWTGK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: