MonarchBase - Protein-coding gene

DPOGS201164
Transcript	DPOGS201164-TA	1827 bp
Protein	DPOGS201164-PA	608 aa
Genomic position	DPSCF300065 + 656043-660791
RNAseq coverage	544x (Rank: top 23%)

Annotation
*Heliconius*	HMEL014978	0.0	71.43%
*Bombyx*	BGIBMGA003961-TA	0.0	67.87%
*Drosophila*	CG4673-PA	7e-170	51.52%
EBI UniRef50	UniRef50_Q9VBP9	1e-167	51.52%	Nuclear protein localization protein 4 homolog n=32 Tax=Coelomata RepID=NPL4_DROME
NCBI RefSeq	XP_970927.1	0.0	56.72%	PREDICTED: similar to nuclear protein localization [Tribolium castaneum]
NCBI nr blastp	gi\|91088135	0.0	56.72%	PREDICTED: similar to nuclear protein localization [Tribolium castaneum]
NCBI nr blastx	gi\|91088135	0.0	57.49%	PREDICTED: similar to nuclear protein localization [Tribolium castaneum]

Group
KEGG pathway	tca:659535	0.0
	K14015 (NPLOC4, NPL4)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[261-565] IPR007717	1.7e-91	NPL4
	[126-259] IPR007716	1.5e-50	NPL4, zinc-binding putative
Orthology group	MCL13440		Single-copy universal gene

Nucleotide sequence:

>DPOGS201164-TA
ATGTCAGGAACAAAAAAAATGACGCTACGGGTCCAGTCGTCGGAGGGCACAGCCCGCGTGGAGATGCTGGACACCGAGGTCACATCGCGCCTCTACGAGCGAGTCCACGACACTCTCAACTTGAACTCATTCGGCTTCGCTTTACATAAAGACCGCGCGCGTAAACAAGAAATTTCGTCTAGTAAATCTCGTCAACTCCGAGAGTACGGTCTGCAACATGGAGACATGCTCTATTTGAGTCCTGTCAATGGAACAGTTCTCTTTGACCAGCCTTCTACTAGTTCTGAGCCACTCAACAAACCTTTGACAGAGCTATCAACAGAGGCAGGTCCTTCCACAGTGATTCCCTCAAATGCTGTCAGTAAGGGACCAATAGAACATGAGGTAGATTTACAACTGTACCGTCTCTCGGGCAGCATTCACCGACAGAGAGATGAAAAATTATGTCGTCACAATTCCAAAGGATGTTGTGTGCACTGTTCGGCACTGGAGCCCTGGGATGAGGGCTATCTTAAAGAACACAACATCAAACATATGTCATTCCACGCCTACCTTCGCAAGATGACATCAGGGAAGTTCATTACACTGGATGAACTGTCATGTAAAATAAAGCCAGGCTGCAAGGAACACCCTCCCTGGCCCCGCGGCATCTGCTCGTCGTGTCAGCCGGGCGCTGTGACGCTCACGAGGCAGCCCTACCGCCATGTGGACAACGTGCTACTGGAGCACGCCGCGCCCGTTGAGCGCTTCCTTTCCTACTGGCGCGCCACGGGTCACCAGCGCGTGGGCTTCCTGTACGGCCGCTACGAGCTCCACCCCGACGTGCCGCTGGGTATTCGCGCCCGCGTGGCCGCCGTTTACGAGCCGCCTCAGGAGTGCAGCCGGGACGCCGTCCGCCTGGCGTCGGACGACCACGCCGCGCTCCTCGACCGCCTCGCCGCCCGTCTCGGCCTCGAGCGTGTCGGCTGGATCTTCACCGACCTGCTACCGTTGGATCTAGTCAGCGGCACGGTGCAGTGTCTGAGGGGTGTGGACACGCACTTCCTCTCCGCTCAGGAATGTATCACGGCAGGACATTTCCAGAACGAGCATCCGAACGCGTGTAGGCACGCGTCCTCCGGCTACTTTGGCTCTAAATTCGTGACGGTGTGCGTGACAGGCGACGCCGACAACCACATCCACTTGGAGGGCTATCAGGTGTCGGGTCAGTGCGCGGCGCTGGTGAGGGACGGCATCCTACTGCCCACCAGGGACGCTCCCGAACTCGGATACATTCGGGATTGCTCGCCCGAACAGTACGTGCCTGACGTTTACTATAAGGAAAAGGATGCGTACGGCAACGAAGTAGGCGTGTCGGCGAAGAGGCTACCGGTGGCTTATTTGCTGGTGGACGTGCCGGTGGGCGTGGCGCCCGCAGCAGGCGAGCCCACCTTCGACCCCCGGGCGTCGTTTCCTCCCGCGCACCGGCCCCTGCAGCAGCACGTGCAGTCCCTGAGCGGCCTCCACGCGCACGTGGAGCGCGCCGAGTCGTTCCTGGCAGCGGCCTCCGACTTGCACGTGCTGCTGTTCCTGGCTACCAACGACGCCGCGCCGCTGAGCCTGGAGCAGCTGGCGCCGCTGCTGGACGCCGTCCGCCGCCGCGACGCGTCCGCGGCCGAGGCGTGGCGCGCGTCGCCCGCGGCCGCCGCGCTGCTGGCCCCCCGTCTCTTTCTGTGTCAGGTGACTCGTGTCAGTACAGCTCTTTCTCTCGTGTTTCAGGAACGCCATGTAACGAGCCCGCCGTCGGCCGCCGGTCCTTCCTCGCCGACGGAATATAGAAATTACTAG

Protein sequence:

>DPOGS201164-PA
MSGTKKMTLRVQSSEGTARVEMLDTEVTSRLYERVHDTLNLNSFGFALHKDRARKQEISSSKSRQLREYGLQHGDMLYLSPVNGTVLFDQPSTSSEPLNKPLTELSTEAGPSTVIPSNAVSKGPIEHEVDLQLYRLSGSIHRQRDEKLCRHNSKGCCVHCSALEPWDEGYLKEHNIKHMSFHAYLRKMTSGKFITLDELSCKIKPGCKEHPPWPRGICSSCQPGAVTLTRQPYRHVDNVLLEHAAPVERFLSYWRATGHQRVGFLYGRYELHPDVPLGIRARVAAVYEPPQECSRDAVRLASDDHAALLDRLAARLGLERVGWIFTDLLPLDLVSGTVQCLRGVDTHFLSAQECITAGHFQNEHPNACRHASSGYFGSKFVTVCVTGDADNHIHLEGYQVSGQCAALVRDGILLPTRDAPELGYIRDCSPEQYVPDVYYKEKDAYGNEVGVSAKRLPVAYLLVDVPVGVAPAAGEPTFDPRASFPPAHRPLQQHVQSLSGLHAHVERAESFLAAASDLHVLLFLATNDAAPLSLEQLAPLLDAVRRRDASAAEAWRASPAAAALLAPRLFLCQVTRVSTALSLVFQERHVTSPPSAAGPSSPTEYRNY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: