MonarchBase - Protein-coding gene

DPOGS215611
Transcript	DPOGS215611-TA	1257 bp
Protein	DPOGS215611-PA	418 aa
Genomic position	DPSCF300041 - 2236255-2239467
RNAseq coverage	2308x (Rank: top 5%)

Annotation
*Heliconius*	HMEL005916	1e-96	56.78%
*Bombyx*	BGIBMGA003671-TA	2e-142	70.86%
*Drosophila*	CG13349-PE	5e-84	47.21%
EBI UniRef50	UniRef50_F4WT80	6e-84	49.06%	Proteasomal ubiquitin receptor ADRM1-like protein n=7 Tax=Formicidae RepID=F4WT80_ACREC
NCBI RefSeq	XP_001949000.1	2e-90	46.86%	PREDICTED: similar to Protein ADRM1 homolog (p42E) [Acyrthosiphon pisum]
NCBI nr blastp	gi\|383850957	5e-92	46.59%	PREDICTED: proteasomal ubiquitin receptor ADRM1-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|170033363	5e-106	50.12%	ADRM1 [Culex quinquefasciatus]

Group
Gene Ontology	GO:0005634	8.3e-122	nucleus
	GO:0005737	8.3e-122	cytoplasm
KEGG pathway
InterPro domain	[5-418] IPR006773	8.3e-122	26S proteasome complex ubiquitin receptor, subunit Rpn13
Orthology group	MCL15756		Insect specific

Nucleotide sequence:

>DPOGS215611-TA
ATGTCCGCGACAGCATTGTTTGGCAACACTTCGGGACTGGGAGGCAGTTCTGGAGGGAATAAACACTTAGTTGAGTTTCGGGCTGGTAGAATGACTCTTAAAGGACGAATGGTACATCCCGACAAGAGGAAGGGTTTATTATATGTGTATCAAGGTGAAGACTCATTGATGCATTTCTGTTGGAAAGATCGTACAACTGGAGAAGTTGAAGATGACCTATTGATCTTTCCGGATGACTGTGAATTTGTAAGAGTTAATGAATGTACAACCGGAAGAGTATATGTATTGAAATTTAAATCATTTTCAAAGAAATATTTCTTTTGGATGCAGGAGCCAAAAACAGACAAGGATGATGAATATTGTCGCCGTCTCAATGAAGCGTTGAATAACCCACCAACTTCCGGTGGTCGTGGTGGTAGCGGCGGTGGTGCCCAAGATGGAGACTTACACAACCTTCTTAACAACATGTCACAACAGCAATTGATGCAGTTATTTGGTGGTGTTGGTCAGATTGGTGGATTATCATCACTGCTGGGAACTATGGGCAACAACAGTAGCAGTGGCAACGCAACTCGTCCATCTGGAAATAGCAGCAATTCCCGTGGTGGTTCGGCACCTCGGTCTGAGCCCACAACACGTACATCAGCACGAGCTCGTGATGAACGCACACCTGTTCCCATCGTTGCCCCCACACCCGCTACTGTTCCCGCCCCTACTGCCACCCCACCCAACACTGCCACTGGAACTCAACCTCGCAGTGGTCAGATATTTCTATCCGACCTGCAGCGGTACTTCTCCGGTCTAGGCAACGCACCTCCGGAGGGCGAAGGCGCGGTGGGTGGGACGGGGGCTTCCCGCGTGGAGTTGGGGGCTGCGCTGGCGACTCCGGAGGTGGTGTCAACGGCCAGCGAGCCGGCTAACTCCCAGCGCCTCGCCCCTCACCTGCCGCCCGCGCCGCCCGCCGCCCCCCAGGACGATGTAAGGACCACACTGCTCTCACCGCAGTTCGCCCAGGCAGCCAATCAGTTTTCATCGGCTCTTACATCCGGTCAAATGGGACCAGTCATGACACAGTTTGGGCTTCCGGCTGACGTCACTACAGCCGCCAACACGGGAGACATGCAGGCCTTCTTTAAAGCCTTGGAGAGTGCGTCTTCATCCGAAAGCGGAAAGTCGGAAGGAGACAGAAAGAAAGATAAACCTCAAGATGACAAAAATGACAAAAAAGATGGTGATGCTGGAATGTCACTCGATTAA

Protein sequence:

>DPOGS215611-PA
MSATALFGNTSGLGGSSGGNKHLVEFRAGRMTLKGRMVHPDKRKGLLYVYQGEDSLMHFCWKDRTTGEVEDDLLIFPDDCEFVRVNECTTGRVYVLKFKSFSKKYFFWMQEPKTDKDDEYCRRLNEALNNPPTSGGRGGSGGGAQDGDLHNLLNNMSQQQLMQLFGGVGQIGGLSSLLGTMGNNSSSGNATRPSGNSSNSRGGSAPRSEPTTRTSARARDERTPVPIVAPTPATVPAPTATPPNTATGTQPRSGQIFLSDLQRYFSGLGNAPPEGEGAVGGTGASRVELGAALATPEVVSTASEPANSQRLAPHLPPAPPAAPQDDVRTTLLSPQFAQAANQFSSALTSGQMGPVMTQFGLPADVTTAANTGDMQAFFKALESASSSESGKSEGDRKKDKPQDDKNDKKDGDAGMSLD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: