MonarchBase - Protein-coding gene

DPOGS208474
Transcript	DPOGS208474-TA	3183 bp
Protein	DPOGS208474-PA	1060 aa
Genomic position	DPSCF300064 - 1498962-1502483
RNAseq coverage	748x (Rank: top 17%)

Annotation
*Heliconius*	HMEL004304	95.57%
*Bombyx*	BGIBMGA010657-TA	92.55%
*Drosophila*	emb-PA	73.26%
EBI UniRef50	UniRef50_F4WNS6	82.44%	Exportin-1 n=16 Tax=Opisthokonta RepID=F4WNS6_ACREC
NCBI RefSeq	XP_001604619.1	82.22%	PREDICTED: similar to nuclear export factor CRM1 [Nasonia vitripennis]
NCBI nr blastp	gi\|332024051	82.44%	Exportin-1 [Acromyrmex echinatior]
NCBI nr blastx	gi\|156543308	82.22%	PREDICTED: exportin-1-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0005488	1.2e-141	binding
	GO:0006886	3.5e-11	intracellular protein transport
	GO:0008565	3.5e-11	protein transporter activity
KEGG pathway
InterPro domain	[698-1015] IPR011989	1.2e-141	Armadillo-like helical
	[699-1015] IPR014877	1.3e-129	Exportin 1, C-terminal
	[697-1016] IPR016024	3.4e-118	Armadillo-type fold
	[119-263] IPR013598	5.4e-40	Exportin-1/Importin-beta-like
	[41-107] IPR001494	3.5e-11	Importin-beta, N-terminal
Orthology group	MCL13973		Single-copy universal gene

Nucleotide sequence:

>DPOGS208474-TA
ATGGCAACTTTAGAGCAGCAAGCTTCTAAACTTCTTGATTTCAACCAAAAATTGGACATAACACTTCTTGATAATATCGTTGGATGTTTATATTCCACTGTTGGAGAACAGCAACGTGTTGCACAAGATATTTTAACAGCACTCAAAGAACATCCCGATGCTTGGACCCGAGTTGATACCATACTTGAGTATTCTCAGAATCAGGAAACAAAATATTATGCTCTGCAAATTTTGGAACAAGTGATTAAAACTAGGTGGAAAGTATTACCAAGAAACCAGTGTGAAGGTATTAAAAAATACATTGTGGGTCTGATTATAAAGAACTCGTCGGATCCTGCCACTATGGAAAGCAATAAGGTTTATTTAAAAAAATTAAATATGATACTTATTCAGGTCTTGAAAAGAGAATGGCCTCATAATTGGGAGACATTTATAAGTGACATTGTTGGAGCATCTAAAACTAATGAAAGCCTGTGCCAGAATAATATGGTTATCTTAAAACTTCTCAGCGAAGAAGTGTTTGTATTCAGTACAGGTGAACTAACTCAGACAAAAGCAAAACATCTAAAAGATAACATGTGTTCTGAATTCAGTCAAATTTTTAATCTATGTCAATTTGTATTAGAGAATTCACAAAATGCACCCCTCGTTGATGCAACACTTCACACACTTCTGAGATTTTTAAATTGGATTCCTCTTGGCTACATATTTGAAATGAAATTAATAAGTACACTTATTTTCAAGTTTCTGAATGTTCCCATGTTCCGCAATGTTACCCTTAGCTGCCTTACCGAAATAGCTGGTGTCACAGTAAGTAATTATGAAGAGCAGTTTGTTGCTTTACTTGTTCAAACAATGGAGCAATTGGAAGTTATGCTTCCCCTATCAACTAACATACGAGAAGCTTATGCAGCAGGTCGAGATCAAGAACAGGTTTTTATTCAAAACCTTGCTCTATTTCTATGTACTTATTTAAAAGAGCATGGACAATTAATTGAAAGGAAGGGCCTTACTAACACTCTTATGAATGCCCTCAGATACCTTGTATTAATATCTGAAGTAGAAGATGTAGAGATTTTTAAGATATGTTTAGAATTTTGGAATGCCTTAGCTGCTGATTTGTATAAGATAACGCCATGTTCCCATTCAGTAGGATTTTATAGTTTAGGGAAAAATGTTGGACGAAAAGCATTGTATGCTGATGTTCTGAGCAGTGTTCGATATATTATGATTTCAAGAATGGCAAAACCTGAAGAGGTTTTGGTTGTCGAAAATGAAAATGGTGAAGTTGTAAGAGAATTCATGAAGGACACAGACACTATAAATTTATACAAAAATATGAGAGAAACTTTGGTATATTTAACACATTTGGATTATCAAGATACTGAAAGGATTATGACTGAGAAACTTCAAAATCAAGTGAATGGCACTGAGTGGTCCTGGAAAAATCTGAATACCCTTTGTTGGGCAATTGGTTCGATATCAGGTGCCTTGACAGAAGAAGATGAAAAGAGATTTTTGGTTATTGTTATTAAAGAGCTTTTGGGGTTGTGTGAGCAAAAAAAGGGAAAAGACAATAAAGCTATTATAGCTAGTAATATCATGTATGTTGTGGGTCAGTACCCCCGCTTCCTAAGAGCTCATTGGAAATTTTTGAAAACTGTTGTTAATAAACTTTTTGAATTCATGCATGAAACCCACGATGGCGTTCAGGATATGGCATGTGATACATTTATAAAAATCGCTTTAAAGTGTCGCCGTCACTTTGTAACTACCCAAGTTGGAGAAGCTTGTCCTTTTATTGAAGAAATTTTAAGTACCATCAGTTCTATCATCTGTGATCTCCAGACACTACAAGTTCACACCTTTTACGAAGCTGTAGGGTACATGATCAGTGCACAAGTAGACCAGGTTGCACAAGAACAGCTCATTGAGAAGTACATGTTGCTTCCGAATCAGGTATGGGATGATATAATATCCCAAGCCTCTCATAATGTAGACATCTTGAAAGATGCTGAGGCTGTTAAACAACTTGTTAGTATTCTTAAAACAAATGGTCGAGCTTGTCGTGCCCTGGGCCACCCATATGTTGTCCAATTAGGCAGAATATATCTAGATATGCTCAATGTGTATAAGGTCATGTCGGAGAATATCAGCCAAGCTATAGCGTTAAACGGTGTAGTTGTGACTAAGCAGCCACTCATAAAGAATATGAGGATAATAAAAAAAGAAACTCTTAAACTAATTTCAAGTTGGGTTTCTCGTTCAACAGATAACAGTATGGTATTGGAGAATTTCATTCCTCCCTTACTTGATGCTGTTCTATTGGATTACCAAAGAACTGCAGTGCCTGATGCAAGAGAATCAGAAGTTTTATCCTGTATGGCAGCAATTGTTTATAAACTCGGAGGGCATATAACATCGGAAGTACCGAAAATCTTTGACGCGATCTTTGAATGTACTTTGGAAATGATCAATAAAGATTTTGAAGAATATCCAGAGCACAGAACCGAGTTCTTCTTGTTGTTACAGGCTGTGAACACACACTGTTTCAAAGCATTCCTAAGCATACCTCCGGCGCAATTTAAATTAGTGCTTGATTCCATTATATGGGCATTTAAACATACAATGAGAAATGTTGCTGACACTGGTCTTCAGATATTATATCGGCTGCTTCAAAACGTCGAACAACATCCCCAGGCCGCGCAGAGTTTCTACCAGACCTATTTATGTGATATACTGGAACACGTTTTTAGTGTGGTAACAGATACTTCTCACGGCGCAGGTTTGACGATGCATGCTACCATTCTAGCACATATATTCTCCTTAGTAGAAACGGGTAGAGTGACTGTTCCTCTGGGTCTCACTCCAGATAATATTCTTTATATACAGGAATATGTTGCCCGTCTTCTCAAAACAGCATTCCCTCATTTGAATGATAATCAAATTAAGATTACCGTACAGGGACTGTTCAATTTGGATCAAGACATACCTGCCTTCAAAGATCATCTCAGAGATTTCTTAGTTCAAATTAGAGAGTACACGGGTGAGGACGACAGCGATCTATTTTTGGAAGAACGGCAGTTTGCTCTCAGCAAGGCACAAGAGGAGAAGAGAAGGGTCCAGTTATCTGTGCCGGGGATTATCAATCCGCATGAATTGCCGGAGGAAATGCAGGATTAA

Protein sequence:

>DPOGS208474-PA
MATLEQQASKLLDFNQKLDITLLDNIVGCLYSTVGEQQRVAQDILTALKEHPDAWTRVDTILEYSQNQETKYYALQILEQVIKTRWKVLPRNQCEGIKKYIVGLIIKNSSDPATMESNKVYLKKLNMILIQVLKREWPHNWETFISDIVGASKTNESLCQNNMVILKLLSEEVFVFSTGELTQTKAKHLKDNMCSEFSQIFNLCQFVLENSQNAPLVDATLHTLLRFLNWIPLGYIFEMKLISTLIFKFLNVPMFRNVTLSCLTEIAGVTVSNYEEQFVALLVQTMEQLEVMLPLSTNIREAYAAGRDQEQVFIQNLALFLCTYLKEHGQLIERKGLTNTLMNALRYLVLISEVEDVEIFKICLEFWNALAADLYKITPCSHSVGFYSLGKNVGRKALYADVLSSVRYIMISRMAKPEEVLVVENENGEVVREFMKDTDTINLYKNMRETLVYLTHLDYQDTERIMTEKLQNQVNGTEWSWKNLNTLCWAIGSISGALTEEDEKRFLVIVIKELLGLCEQKKGKDNKAIIASNIMYVVGQYPRFLRAHWKFLKTVVNKLFEFMHETHDGVQDMACDTFIKIALKCRRHFVTTQVGEACPFIEEILSTISSIICDLQTLQVHTFYEAVGYMISAQVDQVAQEQLIEKYMLLPNQVWDDIISQASHNVDILKDAEAVKQLVSILKTNGRACRALGHPYVVQLGRIYLDMLNVYKVMSENISQAIALNGVVVTKQPLIKNMRIIKKETLKLISSWVSRSTDNSMVLENFIPPLLDAVLLDYQRTAVPDARESEVLSCMAAIVYKLGGHITSEVPKIFDAIFECTLEMINKDFEEYPEHRTEFFLLLQAVNTHCFKAFLSIPPAQFKLVLDSIIWAFKHTMRNVADTGLQILYRLLQNVEQHPQAAQSFYQTYLCDILEHVFSVVTDTSHGAGLTMHATILAHIFSLVETGRVTVPLGLTPDNILYIQEYVARLLKTAFPHLNDNQIKITVQGLFNLDQDIPAFKDHLRDFLVQIREYTGEDDSDLFLEERQFALSKAQEEKRRVQLSVPGIINPHELPEEMQD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: