MonarchBase - Protein-coding gene

DPOGS204343
Transcript	DPOGS204343-TA	1179 bp
Protein	DPOGS204343-PA	392 aa
Genomic position	DPSCF300142 + 112513-116030
RNAseq coverage	391x (Rank: top 31%)

Annotation
*Heliconius*	HMEL002320	6e-118	59.90%
*Bombyx*	BGIBMGA007247-TA	7e-142	65.85%
*Drosophila*	nudE-PC	7e-45	37.91%
EBI UniRef50	UniRef50_D6WVA2	3e-43	45.74%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WVA2_TRICA
NCBI RefSeq	XP_393385.2	5e-46	40.43%	PREDICTED: similar to nudE nuclear distribution gene E homolog like 1 (A. nidulans) isoform B [Apis mellifera]
NCBI nr blastp	gi\|270011307	1e-42	45.74%	hypothetical protein TcasGA2_TC005309 [Tribolium castaneum]
NCBI nr blastx	gi\|270011307	1e-45	45.78%	hypothetical protein TcasGA2_TC005309 [Tribolium castaneum]

Group
KEGG pathway	smm:Smp_169560	7e-16
	K06560 (MRC)	maps->	Phagosome
InterPro domain	[130-322] IPR006964	1.1e-19	NUDE protein, C-terminal
Orthology group	MCL13028		Single-copy universal gene

Nucleotide sequence:

>DPOGS204343-TA
ATGGAATCTCCAAATCAGGCAGAATTGGATACGGTGGAATATTGGAAGGAACAAGCAAAACATTACGAACAGAAGGCAACGGATATACAGCAAGAGTTGGACGAGTATACAGAAAATTCAGCTCAGCTTGAAAAAGAATTGGACGCGTCCTTGGTTCGAGTGGAAAAACGAAACAGAGATTTGGAACATCAAAATCTGAGGCTCAAAAACGATATCGATATGCTCAAATCTAAATTAGAAAGAAGTCAACATGAAACAAATGCACTTGAAAATGAATTACAAACACTCAAAATGGAAAAAGAGAAACAGGCTACATATATAAGAGAATTAGAGCAAAAGAATGATGATTTGGAAAGAGGACAACGAATTATATCAGAATCGGTTTCATGTATAGAAGCATTATTAAATCAGGCTTATGAACGCAATGCTGTCTTAGAAAGTGAAGTTGATGAAATTGAAAACTTGAGGGTAAAATTGCAAAGAGCTACAGATGAAGCCAGAGATCTCAAACAAGAGTTAATAGTTATAGAGAAAAATCCAATTTCTAAGAAGGAAGAGAGCAGTATAAATGAAAATGTGTGTAATGGACATACAACGAGGAGTCAAGTAGAAATAGAAACACAAACTTCCCTACTTTCACCGACAAAACGTGAACTGAATGGTAATGCTATGACGCCATCATCTAGAGTATCGGCTATTAACATTGTTGGAGATCTGCTCAGAAAAGTTGGGCTTGAAAGATTTCTTTGCCGTGATTGTGGTAAGGTCAAATGTTCGTGTGACGTCAGCACCGAGCAACAAAACACTGTTCTTGAAACGAACGTCCATGAACACGATCCTATAAATAATGTTGATAATTCTGTTGAGTACAGAAAAGGGACTTTCACGCGTCAATATTCAAAATCGGAACAGTCCAACACGACGGCTAACAAAACAATGCCATTAACACCAAAAAGTTCCGAACCATTCGAAAGATCCTACCATAATGAGAATGCGAAATTAAGAAGATCATTCATAGTGCGATCGAGAGAAGGAATAGAGAATTTGTTGAACTTCTCATCAGCAAGAAAAGCTTTGGAATCAAAGTTAGCATCGTGTCGTGGTACTGTTAGACCTAAAGAGTCACCAAACCAAACATCCGACGTCAATAAGGACTACAGGTGTGTACTCAAGAACTAA

Protein sequence:

>DPOGS204343-PA
MESPNQAELDTVEYWKEQAKHYEQKATDIQQELDEYTENSAQLEKELDASLVRVEKRNRDLEHQNLRLKNDIDMLKSKLERSQHETNALENELQTLKMEKEKQATYIRELEQKNDDLERGQRIISESVSCIEALLNQAYERNAVLESEVDEIENLRVKLQRATDEARDLKQELIVIEKNPISKKEESSINENVCNGHTTRSQVEIETQTSLLSPTKRELNGNAMTPSSRVSAINIVGDLLRKVGLERFLCRDCGKVKCSCDVSTEQQNTVLETNVHEHDPINNVDNSVEYRKGTFTRQYSKSEQSNTTANKTMPLTPKSSEPFERSYHNENAKLRRSFIVRSREGIENLLNFSSARKALESKLASCRGTVRPKESPNQTSDVNKDYRCVLKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: