MonarchBase - Protein-coding gene

DPOGS205917
Transcript	DPOGS205917-TA	1998 bp
Protein	DPOGS205917-PA	665 aa
Genomic position	DPSCF300089 + 381087-388705
RNAseq coverage	335x (Rank: top 34%)

Annotation
*Heliconius*	HMEL005511	5e-112	77.66%
*Bombyx*	BGIBMGA007018-TA	1e-156	51.93%
*Drosophila*	Sap130-PC	5e-24	37.16%
EBI UniRef50	UniRef50_D6WNN5	1e-35	34.75%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WNN5_TRICA
NCBI RefSeq	XP_397260.3	1e-38	37.37%	PREDICTED: similar to CG11006-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|91082015	4e-35	34.75%	PREDICTED: similar to sin3a-associated protein sap130 [Tribolium castaneum]
NCBI nr blastx	gi\|345495532	7e-42	26.53%	PREDICTED: hypothetical protein LOC100678030 isoform 2 [Nasonia vitripennis]

Group
KEGG pathway
InterPro domain	[532-663] IPR024137	8.3e-25	Histone deacetylase complex subunit SAP130
Orthology group	MCL25304		Lepidoptera specific

Nucleotide sequence:

>DPOGS205917-TA
ATGAGTGGTCATTTAGAAAATGATAGGTCTGTTACAACTGGTAAAATGTATCCTATTGACCTAGCACCTCAAAAAATAACTATAGTAAAGAGTATGTCTAATGCTGAAGTGAAAATGGCTCATTTAATCCCAGTCCAAACAAAAACGACCAGCTCCAATCAAATAATCTCTCACGGTAACACTGGTTCAATGGGATTAATGCGTACAGGTACCCAAATCATTTCCCCAGGCGTCACTTCTCAGCCCCAAATGATAGTTAGCGGGTCACCAATACTACAAAGCACACAGATAGTCAGCCAAGGATCCCAACTTCTTGGACCAAATGCACAAATGTCGCAGCCTCAATTGATTCCCGGTGGTCAAATTTTAAGTCCCGGTACCCAAATAATAAGTCAGGGTACACAGCTGTCGGCTCAAGTATCAAGTAATAATAATGCAGTTTCTAGTACTGTACAGTCTAGTAATCCCTCCACTGCAAATAGTGCACAGTTGTTAAATGTTGGTGGCTTAGTTAGTGGATCTAGCAATTTAGTGGTTAGCTCCTCTGTGCGTACTCTGCCTTCCAGTGTAAGGGTGTTACCACCTATGCAACACACTAGTAATAGGCCGGTTCTCTCCAGTGTTAATGTTAGCAGTGCAAGTGGAGTTCTTGTGAGTAAGGGGGTGACAAGTCATGTGCCCCGTGGTTTAGCAGCGGGAGCTTCCCTCGCCGTGCGTCCCGTAACAAACACACAGCCAGCTAACACTCAAGGTTGGTCGAGCAGCCGCGGCCGCGGGCGTGCGCTTGTATATGGCTGTAGGGCTCGCTCGCCCGCTCCCCGCGCCCCCGCACCCAGTTGTACTACCATACCCACAACCACTGTACTAACATCTACCGGTGTTATATCAAGCACTGTCCGTCAAGCGCCCCGCGCGCCCGTCCCCACTACACCGCCGGCTACGTCCGCTCGACCATTGCCTTTATTGCAAAGAAACTATCAACCTACTAAAGTGGTAGGTGTAGCCAGTGTTGGTATGCGTGGCGTGGCTAACAGCGCCCCCTCTCAGTTGTATTACGAAGTGCCACGGCCACAACAGTCTCAACCACTGCAAGTGCCACTACAGCCGCAACTGACAAGATCATTGACACCATATGCACATGCACAAGGATTAGTGAGCATAGTGAATGCCTCACAGTCTGATGTACGTCAGCTATCTTCTTCCATTCAGAACTCCGCACCGCGACCTTCGATATTAAGAAAGAGGGACATTGATGGGTCGCCAACGAAGTCGTCAATATATTCTGAGGGTACGGGATGGGAGGATGTTCCCAGCGGTTCAGGGTCAGGGTCGACAACGATATCAGCGGCGTCTTCTCCACGGGATCTGGACCTAGAGCCGGGACCGGAGCCCGAGCCGGTACCGGAGCCCGACCACGACCTGTCCCCGAGGAAGAAACCCCGCAAACAAATATTGAGCAATGAAGTTAGACAATGTGAGTTCCCAGCGGAAGACACGCCGCCCTCACCGCCGCCAGCAGCCCCGGCACCGCCACTACCCAAACGTCCGTCACTGAGCTCGAGCTATGTGTGCGGCTGGCGGAGTACAGCGTTACACTTCACCCGGCCGTCGGATGTTCGCCGCAGAGAGCCGAGAGCCCGTGACATAGTTAGCATCGCGGCCCAGAGACACGTGCTCACCAGCGCTGAGGGCTGGAAGGTACATCATTTGACAGCACAAATGGACGACCTGGTGTCTCTAGAAGCGGATGTGGGTGAACAGTTGGCGGGAGTTTTGGGCGCAGTGGCGGCGAGGGACCGTGGACCGCTTCATGCACTGCAGCACACACTACTGGAACTTGTCAAGGGTAATATTCAAAGAAGTAAAATCGTGTGCGAGGGTATACAAGAAGCCCGGGAGGATATCCTGCGAGTGTTCAAACATCGCAACTTTGTTTCCGACATTTTGACTCGACAGGCCGACAAGCGATGTTTCAGGAAGCATAGATCGCAATCATAG

Protein sequence:

>DPOGS205917-PA
MSGHLENDRSVTTGKMYPIDLAPQKITIVKSMSNAEVKMAHLIPVQTKTTSSNQIISHGNTGSMGLMRTGTQIISPGVTSQPQMIVSGSPILQSTQIVSQGSQLLGPNAQMSQPQLIPGGQILSPGTQIISQGTQLSAQVSSNNNAVSSTVQSSNPSTANSAQLLNVGGLVSGSSNLVVSSSVRTLPSSVRVLPPMQHTSNRPVLSSVNVSSASGVLVSKGVTSHVPRGLAAGASLAVRPVTNTQPANTQGWSSSRGRGRALVYGCRARSPAPRAPAPSCTTIPTTTVLTSTGVISSTVRQAPRAPVPTTPPATSARPLPLLQRNYQPTKVVGVASVGMRGVANSAPSQLYYEVPRPQQSQPLQVPLQPQLTRSLTPYAHAQGLVSIVNASQSDVRQLSSSIQNSAPRPSILRKRDIDGSPTKSSIYSEGTGWEDVPSGSGSGSTTISAASSPRDLDLEPGPEPEPVPEPDHDLSPRKKPRKQILSNEVRQCEFPAEDTPPSPPPAAPAPPLPKRPSLSSSYVCGWRSTALHFTRPSDVRRREPRARDIVSIAAQRHVLTSAEGWKVHHLTAQMDDLVSLEADVGEQLAGVLGAVAARDRGPLHALQHTLLELVKGNIQRSKIVCEGIQEAREDILRVFKHRNFVSDILTRQADKRCFRKHRSQS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: