MonarchBase - Protein-coding gene

DPOGS202256
Transcript	DPOGS202256-TA	1287 bp
Protein	DPOGS202256-PA	428 aa
Genomic position	DPSCF300032 - 562676-566104
RNAseq coverage	853x (Rank: top 15%)

Annotation
*Heliconius*	HMEL005094	2e-120	83.05%
*Bombyx*	BGIBMGA004908-TA	0.0	86.80%
*Drosophila*	Pros26.4-PA	0.0	84.81%
EBI UniRef50	UniRef50_P62191	0.0	81.38%	26S protease regulatory subunit 4 n=395 Tax=root RepID=PRS4_HUMAN
NCBI RefSeq	XP_312923.4	0.0	85.94%	AGAP003215-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|312384064	0.0	86.39%	hypothetical protein AND_02632 [Anopheles darlingi]
NCBI nr blastx	gi\|312384064	0.0	86.39%	hypothetical protein AND_02632 [Anopheles darlingi]

Group
Gene Ontology	GO:0005524	1.3e-23	ATP binding
KEGG pathway	aga:AgaP_AGAP003216	0.0
	K03062 (PSMC1, RPT2)	maps->	Proteasome
InterPro domain	[245-343] IPR003959	1.3e-23	ATPase, AAA-type, core
Orthology group	MCL11539		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202256-TA
ATGGGACAAAATCAATCTGGTGGTGGCAGCGGCGGAGACAAAAAGGATGACAAGGATAAGAAGAAGAAATATGAACCACCGATTCCTACAAGGGTTGGAAAAAAGAAGCGCAAGGCTAAGGGGCCAGACGCAGCTTTAAAGCTGCCTCAAGTAACGCCACATACGCGATGTAGGTTGAAACTACTTAAGTTGGAGAGAATTAAGGATTACTTACTTATGGAGGAGGAATTCATCCGCAATCAAGAAAGACTGAAGCCACAAGAAGAGAAAATTGAAGAGGAAAGATCAAAGGTAGATGATCTCCGTGGCACACCAATGTCAGTAGGTACTCTGGAAGAGATCATTGATGACAATCATGCCATAGTCTCCACATCCGTCGGCAGTGAACACTATGTCAGCATCCTGTCATTTGTTGACAAAGACCAGCTAGAGCCAGGCTGCTCAGTTTTACTAAACCATAAGGTTCATGCTGTGGTGGGTGTGCTGGGTGATGACACCGATCCGATGGTGTCAGTCATGAAGCTCGAGAAGGCTCCACAAGAGACATATGCAGATATTGGTGGTCTTGACACACAGATACAGGAAATTAAGGGAGCAAATGGCCTACCTATTGGATATACACAATATCCACAAAATAGTTTTGCAAATGCATTGCCACCCTTATATTGGGAAGAGGGAGGGGGAAAAGTAGGAAAAGTTAAAGGTCACATAAACGGTGGGAAAAGGAAAAGGGCAACCGGCTCTGGTGATGGTCCGAAATTAGTTCGTGAACTATTCAGAGTAGCCGAAGAACATGCTCCATCAATTGTATTTATTGATGAAATAGATGCTGTCGGGACCAAACGTTATGACTCCAACTCTGGCGGTGAGAGGGAAATTCAAAGAACTATGTTGGAGCTCCTCAATCAGTTGGACGGTTTTGATTCAAGAGGAGATGTTAAGGTTATTATGGCAACTAACAGAATAGAGACCCTAGACCCGGCCCTGATCCGTCCAGGCCGGATCGATCGCAAGATAGAGTTCCCGCTGCCCGACGAGAAGACCAAACGACGCATCTTCACCATACATACCTCCAGGATGACCTTGGCCGATGATGTCAACTTGTCAGAGCTCATCATGTCCAAGGATGATCTGTCCGGGGCAGATATGAAGGCTATTTGTACCGAGGCTGGTTTGATGGCACTCAGAGAACGGCGTATGAAGGTTACTAATGAAGACTTCAAGAAGTCTAAAGAGAGTGTCCTGTACCGCAAGAAGGAAGGCACTCCGGAAGGGCTTTACCTTTAA

Protein sequence:

>DPOGS202256-PA
MGQNQSGGGSGGDKKDDKDKKKKYEPPIPTRVGKKKRKAKGPDAALKLPQVTPHTRCRLKLLKLERIKDYLLMEEEFIRNQERLKPQEEKIEEERSKVDDLRGTPMSVGTLEEIIDDNHAIVSTSVGSEHYVSILSFVDKDQLEPGCSVLLNHKVHAVVGVLGDDTDPMVSVMKLEKAPQETYADIGGLDTQIQEIKGANGLPIGYTQYPQNSFANALPPLYWEEGGGKVGKVKGHINGGKRKRATGSGDGPKLVRELFRVAEEHAPSIVFIDEIDAVGTKRYDSNSGGEREIQRTMLELLNQLDGFDSRGDVKVIMATNRIETLDPALIRPGRIDRKIEFPLPDEKTKRRIFTIHTSRMTLADDVNLSELIMSKDDLSGADMKAICTEAGLMALRERRMKVTNEDFKKSKESVLYRKKEGTPEGLYL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: