MonarchBase - Protein-coding gene

DPOGS205492
Transcript	DPOGS205492-TA	3003 bp
Protein	DPOGS205492-PA	1000 aa
Genomic position	DPSCF300166 + 361889-365477
RNAseq coverage	1498x (Rank: top 9%)

Annotation
*Heliconius*	HMEL017743	95.90%
*Bombyx*	BGIBMGA008426-TA	82.90%
*Drosophila*	Rpn2-PA	72.54%
EBI UniRef50	UniRef50_B0WHS6	74.47%	26S proteasome non-ATPase regulatory subunit 1 n=12 Tax=Eumetazoa RepID=B0WHS6_CULQU
NCBI RefSeq	XP_001848260.1	74.47%	26S proteasome non-ATPase regulatory subunit 1 [Culex quinquefasciatus]
NCBI nr blastp	gi\|170040984	74.47%	26S proteasome non-ATPase regulatory subunit 1 [Culex quinquefasciatus]
NCBI nr blastx	gi\|91082073	77.71%	PREDICTED: similar to 26S proteasome non-ATPase regulatory subunit 1 isoform 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0000502	0	proteasome complex
	GO:0042176	0	regulation of protein catabolic process
	GO:0030234	0	enzyme regulator activity
	GO:0005488	3.1e-37	binding
KEGG pathway	cqu:CpipJ_CPIJ006702	0.0
	K03032 (PSMD1, RPN2)	maps->	Proteasome
InterPro domain	[1-1001] IPR016642	0	26S proteasome regulatory complex, non-ATPase subcomplex, Rpn2/Psmd1 subunit
	[9-747] IPR016024	3.1e-37	Armadillo-type fold
	[564-753] IPR011989	3.3e-18	Armadillo-like helical
	[655-690] IPR002015	2.8e-10	Proteasome/cyclosome, regulatory subunit
Orthology group	MCL13806		Single-copy universal gene

Nucleotide sequence:

>DPOGS205492-TA
ATGAATATCACATCCGCTGCGGGGATAATATCCCTGCTTGATGAGCCTATGCATGAAGTGAAAAAGTTCGCTCTAAAGAGATTAGACAACATCGTAGACGAATTCTGGCCGGAAATTTCTGAATCAATTGAAAAGATTGAAATTCTACACGAAGATAAAGTTTTTTCACAGCACCAACTGGCTGCTTTAGTGGCAAGCAAAGTTTATTATCATTTGGGTGCATTCGAAGACTCTCTAACATACGCGCTAGGAGCTGGGGAGTTGTTCGATGTAAACGCAAGGAACGAATATGTCGACACCACGATTGCAAAGGCCATCGATTTCTATACACAGAAACGTAAAGCCCTGTTCATTGATAGTGCCTGTGAGACCATTGACCCTCGACTGGAGGCTATCGTGAACCGAATGTTCCAACGGTGTCTTGATGACGGTCAATACAGGCAGGCCCTCGGTCTGGCGTTAGAGACGCGACGAATGGACATCTTTGAAGAATCTATTATGAAGTCTGATGATGTGTCAGGCATGCTGCAGTACGCATTTACTGTGGCAATGAGTCTTCTCCAGAACAGAGGTTTCCGAAGCACAGTCCTCCGATCTTTAGTAGGTTTATACCGAGGTCTGAACATTCCAGACTATGTCAATATGTGTCAATGTCTCATCTTCTTAGAGGATCCATTATCAGTCGCAGAAATCTTGGACAAATTAACTCACGGCCCACAAGATTCAGTACTAATGGCTTACCAAATTGCATTTGATCTGTATGACTCAGCAACTCAACAATTTTTAGGGCGAGTTCTACAGGCCCTTAGAATTACAGCACCTATACCGAGTGCTTTGGGCGGTAAACCCCAACCGCAAGGTGGCCCTTTCCCAGAATCTACTATGGAGGTAGATCAATCACCCTCTGAAGAACCTAAGAAACCAGAACGGGATATTGATAGTCTTAATGATGAGGAAAAGGAACATCAGAGGAGAGTAGAAAAATTAATATCTATATTAGGAGGAGATGTATCTATAGGTTTACAATTACAGTTCTTAATTAGGTCTAATCATGCGGATATGTTAATTCTAAAGAACACGAAAGATGCCATCAGAGTTTCAATCTGCCACACAGCTACGGTTATAGCTAATGCATTCATGCACGCTGGCACGACAAGCGATCAGTTCTTAAGGGATAACTTGGAATGGTTGGCGCGAGCGACGAATTGGGCAAAACTGACAGTGACGGCTTCGCTTGGCGTAATACACAGAGGCCACGAGAACGAATCCTTGGCTCTCATGCAATCTTATCTGCCCAAAGAGGCTGGGCCATCATCTGGCTATTCTGAAGGTGGCGGCTTATACGCATTAGGTTTGATTCATGCAAACCACGGCGCCAATATCATTGATTATCTTTTAACTCAATTAAAAGACGCTCAGAATGAAATGGTTCGCCACGGAGGCTGTCTGGGTCTCGGTTTAGCTGCAATGGGCACTCACCGGCAGGACGTTTACGAACAACTCAAGTTCAACCTATACCAAGACGACGCAGTTACCGGTGAAGCTGCTGGTATTGCTATGGGAATGGTCATGTTGGGTTCCCGCAACGCTGCCGCCATCGAGGACATGGTCGCCTACGCCCAGGAGACTCAACACGAAAAGATTTTGCGTGGTTTAGCCGTCGGCATATCCTTCACCATGTACGGACGGCTGGAAGAGGCTGATGCTCTCGTCCAACAGCTATTGAGAGATAAGGATCCGTTATTGCGTCGAGCTGGTTGTTACACCATAGCTACAGCCTACTGCGGCACTGGCAATAACGATTCAATTCGTACATTACTTCACGTGGCCGTTTCTGACGTGAACGACGACGTCCGCCGCGCTGCTGTAACTGCTTTAGGATTCCTACTGTTCAGAACGCCCGAACAATGTCCGTCTGTGGTGTCACTATTGGCGGAGTCCTACAATCCTCATGTACGGTACGGCGCTGCTATGGCCTTGGGTATCGCATGCGCCGGTACTGGGAATCGTGAAGCTATCGGACTTCTAGAACCTATGGTCAAATTTGACCCTGTTAATTTCGTCAGACAAGGAGCGCTTATAGCATCGGCGATGATTTTGATTCAGCAGACCGAGGCGCTATGTCCCAAAGTTACATACTTCCGTACGCTTTATTCACAAGTAATTTCAAACAAACACGAAGATGTTATGGCCAAATTTGGGGCTATATTGGCCCAAGGTATCATAGATGCAGGTGGACGGAATGTAACAGTCTCCCTTCAGAACAGAACCGGTCACATGAATATGTTGGCTGTTGTTGGCATGCTAGTATTCACTCAATACTGGTACTGGTTCCCGTTGGCTCATTGCCTATCACTTGCTTTTACGCCCACATGCGTGATTGCCCTAAATTCCGATTTAAAAATGCCACTACTGGAAATGAAATCCAACGCTAAACCATCGCTGTACGCCTACCCAGCACCGCTTGAAGAAAAGAAACGCGAAGAAAGAGAAAGAGTCACCACTGCCGTACTAAGTATTGCCGCAGCCAGAGCGCGCAGACGAGCTCACGGAACAGAGGGTTCCGCTAGCAGTAGTGTGACGTCATCGACCACATCTAAGATGGATGTCGATGAAGAAGAGAAGAAGCCTTCCAAATCACCAAACCCAAATATAACAGTTCACGGTAAATCCGATAAAGATGCCGGATCGTCGAAAGAAGGCAAGAAAGACGAAAAGGAAGCAGAAGAAAAAGATGTCAAGGAGAAGAAGGAACCGGAACCAAACTTTGAAATTCTCAGCAACCCAGCCAGGGTTATGCGTCAACAACTAAAAACTCTGACAGTTGTTGAGGGTTCCGGATACATGCCTTTGAAGGACGTCACTATTGGCGGTATCGTAATGTTGAATCATACGGGAGACAGTGAACAAGTGCTTGTGGAACCTGTCGCTGCTTTTGGTCCGAAAGCTGAAGAAGAAAAAGAACCTGAACCTCCTGAACCATTTGAATACTTGGACGAATGA

Protein sequence:

>DPOGS205492-PA
MNITSAAGIISLLDEPMHEVKKFALKRLDNIVDEFWPEISESIEKIEILHEDKVFSQHQLAALVASKVYYHLGAFEDSLTYALGAGELFDVNARNEYVDTTIAKAIDFYTQKRKALFIDSACETIDPRLEAIVNRMFQRCLDDGQYRQALGLALETRRMDIFEESIMKSDDVSGMLQYAFTVAMSLLQNRGFRSTVLRSLVGLYRGLNIPDYVNMCQCLIFLEDPLSVAEILDKLTHGPQDSVLMAYQIAFDLYDSATQQFLGRVLQALRITAPIPSALGGKPQPQGGPFPESTMEVDQSPSEEPKKPERDIDSLNDEEKEHQRRVEKLISILGGDVSIGLQLQFLIRSNHADMLILKNTKDAIRVSICHTATVIANAFMHAGTTSDQFLRDNLEWLARATNWAKLTVTASLGVIHRGHENESLALMQSYLPKEAGPSSGYSEGGGLYALGLIHANHGANIIDYLLTQLKDAQNEMVRHGGCLGLGLAAMGTHRQDVYEQLKFNLYQDDAVTGEAAGIAMGMVMLGSRNAAAIEDMVAYAQETQHEKILRGLAVGISFTMYGRLEEADALVQQLLRDKDPLLRRAGCYTIATAYCGTGNNDSIRTLLHVAVSDVNDDVRRAAVTALGFLLFRTPEQCPSVVSLLAESYNPHVRYGAAMALGIACAGTGNREAIGLLEPMVKFDPVNFVRQGALIASAMILIQQTEALCPKVTYFRTLYSQVISNKHEDVMAKFGAILAQGIIDAGGRNVTVSLQNRTGHMNMLAVVGMLVFTQYWYWFPLAHCLSLAFTPTCVIALNSDLKMPLLEMKSNAKPSLYAYPAPLEEKKREERERVTTAVLSIAAARARRRAHGTEGSASSSVTSSTTSKMDVDEEEKKPSKSPNPNITVHGKSDKDAGSSKEGKKDEKEAEEKDVKEKKEPEPNFEILSNPARVMRQQLKTLTVVEGSGYMPLKDVTIGGIVMLNHTGDSEQVLVEPVAAFGPKAEEEKEPEPPEPFEYLDE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: