MonarchBase - Protein-coding gene

DPOGS213613
Transcript	DPOGS213613-TA	3588 bp
Protein	DPOGS213613-PA	1195 aa
Genomic position	DPSCF300033 + 852500-864664
RNAseq coverage	275x (Rank: top 39%)

Annotation
*Heliconius*	HMEL013688	0.0	80.57%
*Bombyx*	BGIBMGA011675-TA	0.0	74.38%
*Drosophila*	Nup160-PA	3e-56	27.46%
EBI UniRef50	UniRef50_E1ZVT2	3e-73	29.93%	Nuclear pore complex protein Nup160-like protein n=5 Tax=Formicidae RepID=E1ZVT2_CAMFO
NCBI RefSeq	XP_001845754.1	7e-70	24.21%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|307212944	1e-81	31.60%	Nuclear pore complex protein Nup160-like protein [Harpegnathos saltator]
NCBI nr blastx	gi\|307212944	7e-76	31.51%	Nuclear pore complex protein Nup160-like protein [Harpegnathos saltator]

Group
KEGG pathway
InterPro domain	[31-535] IPR021717	2.6e-36	Nucleoporin Nup120/160
Orthology group	MCL11943		Single-copy universal gene

Nucleotide sequence:

>DPOGS213613-TA
ATGGAGTTTGTCGATGCAATACCGGTAACGTTCAAAGAAATAACTCCAAATCATAATATTCCCGAAAAATGGAAAGAAGTTGTATTGAATACAGGAGGCACTCACAGTACATTACAAGATATAAAATTACCTCACAAAGCTGGCGGCTACTGGTACAAAGATTCGAAGAGAGCTAACACTAGGAACAGATTCATTTACTGGCAAACTACATCAGATTCTATTGAATTGTCAGAAGCTTCTTTAGATGTTAACTTGTCTGGGGCTAATTTGAGATGTAAAGTTGCAGCTGGGACTCCACCGTTAAATAATTTAGAGTTTTATGAGAAGACGTCCTCACAACAGTTAGTTATTTTAGCTGCTACTGTCTCTTCTGTACATAGATTAGTCTTTCCTCATCCTGATCTTCTGGATAGAAAGTCTACATTTGGGTCTATGTGCAGCATCTGCCCTTCCATATTTCATGACACTAGCTCACTCAACAATCCAAACAATTACTACATACTTAATCAATATTCTAACACAAATACAGGTGTGGCACATTCCTGTGCTTCCCTGCTGAGGGACAGCGGAGAGGCAGTTTTTGCTTTGGCATTTGGATATGGCGGTGAAGGAGGCCTTTTATTAGTAAAGTTGCCGCTGGCCGGCTCAGCCGTTACATTATCATTAAAACGAGAATCAACCGTGCCAAGATTCTTATCTGGCATCACGGGTGCTTTAAGGGGAAAAAGTGATGGAGTTGACACATATGGTGTGGTTCTGACAAACGGCTTGGTTGTTGCTATATGTGGAGATAACTGTCTCAGAGTGTGGTCGCTAGATGATGGTGGTGTACCAACAGCTGTTTCAACCTCTTTATCCCAGACATTGGTTAAACCAAAGCCTCCTCCTCACGGTCACATGCTGCAATATACAACAGGCTTAGATGGAAGTATAATATTGGTAGCTTATTTATCATTCCCAAATGAATGTGAATTTGTAGTTATGAAGATGCATGATGGGGGTGTGGGTGCTGCTAGGTTCACACAAATGTGTCACATCTTTGGACCACAGTTGGATCTTCTTGATTATACAATCGGTTACGGAGATGGTAACCACGTCATTTGGGCGTTATGGACTCAGCCCGATGGTGACGCTGTTGTTACAACTACTGGCATCGGTCCGGAGGCGCAGTGGCGCGCTGTCGCTGGTCGCGAGCTTCCGCCCTCTCTTCCTCAGTTGTCTTCACTCAACATGTACCGGGATCGGCTACTCGCGCCGGGACTCTTCCCTCCGGCCGTCATTCGTAAGGCATTGGTTATATACCGTCGTCAGTGGGGTGGTGAGGGGGGAGAGGGGGATGTTGATTTGGGGGAGGCGTGTGTGTCGGCGGTACAGGCAAGACTACGAACACTCACCGCACGACACCAGCCAGCCGACCATTCACACCTCATGCATAAATGCTGGACAGATTTATACAGCTGGTGCATGCAATACATGGAGGGGCTGCAGAAACCGCTCGGCCTCATGGTGTCTAAACATTATAAGGAGTCAGAGTCGGGCTGGTGGTGTGGCGTAGTGAGGCGGGCGGGCGTCTCCCTCGTTAGACAGTTGGAGCCCTACGAGCGAGTCATGTTGTCCCCGGAAGATACATTGCCTGATACTGTCTTCAGAGGTAGTGGGGAGGTGGGTCCGGTGTCGTCGGAGGCGATGCGCGTGGTGGTTGCGGGGGCGAGGTGGGAGCGTGGCGCCACTCCGGCGGGGGCCGCAGAGCTGGAGAGACGTCTCTTCGCGTGTGCTGCTCCACAGCACCGCCTGCTGCCGCGTCTGCTACATCTGCTGCTGCAACCCCCGGAGGACGCCGCCACGCCCACGCTGTCCCCGGAACAAATCGATGAAATCTCAGCCATCTTGGAACCGATCAACGATTTGCAGAATGCGGTACTCAATTTAAACGAAGCCCTGAGACTGGACGTTCCGGAGATAGATTCTAGTGACAATGATGATACCGCTGAGTACGATAATCTCTTTGCGAGCGATCTCGGAGTAGCTATAGTCACTGAAGCTATACGACAAATGGCTGAGATGAGATGTCGCGTTGTCCGCGGCGCCCTCGCAGCTCTCGGCGCGGCTCGCGGCGCCGGCGGGGTCCCGGGCGCTGGACACTGCGCCGTACACTGGCAGGCCTACCGAGCGCTGTTGTGGCTCAGGGCTGCCACTCACCAGTCACATGAATACTGGGCTGTGAGTGGTGGCTTCGAATTTGGTTGGTGGCTGGCGTCCATCAACCAGCCTCGCCTTGTACAGAGCTACGTTGCCCTTCTGGAGCCCTGGTGCGAGTGGAACGCCTGCTCACGCCAGTTCATTTTGGGCATGTCTCTATTGGAGCTGGGAGAGTCGGAGGCTGCGTACACGTCGTTCTGCCGCGCTGCCAAGGGTGTCAGCACGGAACCCTTCCTTAGATCGCTAGTGGCGCCCCACGACACCGCACTCACGCAACACCAGGCGCTAGTATTGTACTACATGAAGGTCATCAAGTTATTCGAGATCCATGATGCTGGAGCCTGCGTCGTGAGATTAGCGGAGACGGCTATCAGTATAGCTGATAAGGATGACCCTAATCTGGCAATGTTCCAGTGGGTTGTATTCAAGTGGCACCTGTCCGGTGGCCGAGTGTCCCGGGCCCTGAGTGCAGCCGCCGCAAACCCAGCAGCGAGCGCCCGAGCAGCCGCCGCCGCTGCCCTACTCACTACCCTCGCGGAGCGTAAACAGCTATCGGCGCTGGTGTCGTGTGGGTCGCTGGCTTTGGAAGCGGAGCGAGCGGCCGCGGCTCGCGCCAAGCTGCACGACCCCTACCCACACAACCCCTACTACGATTTCCTGTACGCGCTGCATCTTTCCAGGCATCACTATCGAAAAGCTGCGGCGGTAGTGTACGAGCGTGCGGCGCGGTGTGCGGGCGAGAGCGGCCCGGCGCGCCGGCGCTGGCTGGCGGCGGCGCTCACCTGTCTGAGGCTCGCGCAACCCAGACACGCCTTCCTCGCCAGACCTGACAGGACGCGGAACTCTAACGACGCTCTGCAGATTATTGGTCCCGAAGAACTTGCAGCCGAATTACGCGAGGAAGTTCCAGAATCCTTAGATCCGGTTCAGCAGGCTTTACTCAAAACGGATAACATAGATTTTGACTACTTATATCCAAATTTGAAAGAAGCTGATCCGGAAACTCTTCTAGCGGTGATGAAGAGGGCGATCAGTACCGGCCAGTTTATGCCACATTGGTTTCTTCAAAGGTTTTTGGAGCTGGAGCCTAATTCGTGTATTCGCGCCATGCTGAGCGGCGGGCGGGCTGTGGAAGCTGCTGAACTGTGTTGTGCTGCACTACGTCGCGACGCCCTGGCCCTTGTGCCGACCACCAACGCACCACCACGCGCCTCGCCACTGTCACTAGCCGACTTACTGCTACATGAACTGACTGAACATGATCACAATCCAAGAGTCAGAGAGGTTTACAATGACTTGCAGCTGATAGTTGAAGAGTATACCAAAATGATAGATCGCACATCGGAAGACCTAAAACTATCACAGTTAAAATACGGAATGACCAATTAG

Protein sequence:

>DPOGS213613-PA
MEFVDAIPVTFKEITPNHNIPEKWKEVVLNTGGTHSTLQDIKLPHKAGGYWYKDSKRANTRNRFIYWQTTSDSIELSEASLDVNLSGANLRCKVAAGTPPLNNLEFYEKTSSQQLVILAATVSSVHRLVFPHPDLLDRKSTFGSMCSICPSIFHDTSSLNNPNNYYILNQYSNTNTGVAHSCASLLRDSGEAVFALAFGYGGEGGLLLVKLPLAGSAVTLSLKRESTVPRFLSGITGALRGKSDGVDTYGVVLTNGLVVAICGDNCLRVWSLDDGGVPTAVSTSLSQTLVKPKPPPHGHMLQYTTGLDGSIILVAYLSFPNECEFVVMKMHDGGVGAARFTQMCHIFGPQLDLLDYTIGYGDGNHVIWALWTQPDGDAVVTTTGIGPEAQWRAVAGRELPPSLPQLSSLNMYRDRLLAPGLFPPAVIRKALVIYRRQWGGEGGEGDVDLGEACVSAVQARLRTLTARHQPADHSHLMHKCWTDLYSWCMQYMEGLQKPLGLMVSKHYKESESGWWCGVVRRAGVSLVRQLEPYERVMLSPEDTLPDTVFRGSGEVGPVSSEAMRVVVAGARWERGATPAGAAELERRLFACAAPQHRLLPRLLHLLLQPPEDAATPTLSPEQIDEISAILEPINDLQNAVLNLNEALRLDVPEIDSSDNDDTAEYDNLFASDLGVAIVTEAIRQMAEMRCRVVRGALAALGAARGAGGVPGAGHCAVHWQAYRALLWLRAATHQSHEYWAVSGGFEFGWWLASINQPRLVQSYVALLEPWCEWNACSRQFILGMSLLELGESEAAYTSFCRAAKGVSTEPFLRSLVAPHDTALTQHQALVLYYMKVIKLFEIHDAGACVVRLAETAISIADKDDPNLAMFQWVVFKWHLSGGRVSRALSAAAANPAASARAAAAAALLTTLAERKQLSALVSCGSLALEAERAAAARAKLHDPYPHNPYYDFLYALHLSRHHYRKAAAVVYERAARCAGESGPARRRWLAAALTCLRLAQPRHAFLARPDRTRNSNDALQIIGPEELAAELREEVPESLDPVQQALLKTDNIDFDYLYPNLKEADPETLLAVMKRAISTGQFMPHWFLQRFLELEPNSCIRAMLSGGRAVEAAELCCAALRRDALALVPTTNAPPRASPLSLADLLLHELTEHDHNPRVREVYNDLQLIVEEYTKMIDRTSEDLKLSQLKYGMTN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: